利用Linux和GFS打造集群存儲
負載均衡是一項困難的任務(wù)。我們經(jīng)常需要通過NFS(網(wǎng)絡(luò)文件系統(tǒng))或其他機制來為數(shù)據(jù)提供中心地址,從而共享文件系統(tǒng)。雖然你的安全機制可能可以讓你免于Web服務(wù)器節(jié)點的故障,但是你仍然需要通過中央存儲節(jié)點來共享數(shù)據(jù)。
通過GFS(全局文件系統(tǒng))——Linux的一個免費集群文件系統(tǒng)——你可以創(chuàng)建一個不需要依賴其他服務(wù)器的真正穩(wěn)定的集群。在這篇文章中,我們將展示如何正確地設(shè)置GFS.
從概念上來說,一個集群文件系統(tǒng)可以允許多個操作系統(tǒng)載入同一個文件系統(tǒng)并可以在同一時間內(nèi)向同一文件系統(tǒng)寫入數(shù)據(jù)?,F(xiàn)在有許多集群文件系統(tǒng),包括Sun的Lustre,Oracle的OCFS(Oracle集群文件系統(tǒng)),以及Linux的GFS.
有許多方法可以讓一個塊設(shè)備同時被多個服務(wù)器所使用。你可以分區(qū)出一個對多個服務(wù)器都可視的SAN(存儲局域網(wǎng))LUN(邏輯單元號),設(shè)置好相應(yīng)的iSCSI(互聯(lián)網(wǎng)小型計算機系統(tǒng)接口),或使用DRBD(分布式復(fù)制塊設(shè)備)在兩臺服務(wù)器之間復(fù)制一個分區(qū)。在使用DRBD的時候,你將需要在主/主節(jié)點中設(shè)置好DRBD以使用GFS.
GFS要求
運行GFS意味著你在運行一個集群。目前為止,運行GFS的最簡單的手段就是使用Red Hat Cluster Suite(RHCS:Red Hat集群套件)。這個套件在CentOS中就有。此外,還需要下面這些包:cman——集群管理器;lvm2-cluster——使LVM(邏輯卷管理器)可以支持集群的CLVM(集群邏輯卷管理器)包;kmod-gfs——GFS內(nèi)核模塊;最后是gfs-utils.
集群管理器(cman)包含必要的工具,比如分布式鎖管理器。除非你希望花時間來確認各種不同的分發(fā)版本是如何采用cman的,否則我們強烈推薦使用CentOS或RHEL.同時,你還將獲得RH(Red Hat)所維護的各種最新版本的集群服務(wù),此外你還可以獲得一個比較穩(wěn)定的環(huán)境。
Fencing(阻絕)機制是絕對必要的。一些指導(dǎo)性文章建議將阻絕模式設(shè)定成"手動",因為阻絕設(shè)置有可能比較復(fù)雜。阻絕意味在集群中進行隔離,或馬上中斷某些危險節(jié)點的運作。如果集群無法阻絕某個發(fā)生故障的節(jié)點,那么你的GFS將會出現(xiàn)很多問題,因此不要跳過這個步驟。
創(chuàng)建集群設(shè)置
你可以通過/etc/cluster/里面的cluster.conf完成大部分的集群設(shè)置。我不建議使用各種集群管理應(yīng)用程序來創(chuàng)建這個設(shè)置文件。即使是完全支持的RHEL應(yīng)用程序,比如兩個月前發(fā)布的Conga,也經(jīng)常會創(chuàng)建一些無效的cluster.conf文件,并且無法被必要的服務(wù)所解析。
下面是一個cluster.conf文件的例子。這個設(shè)置文件采用漂亮的XML格式,其內(nèi)容非常直接。首先,我們對集群進行命名,我們將這個集群稱作"Web.1".
先跳過fence daemon選項,下一個部分就是集群主體的設(shè)置內(nèi)容。你需要在clusternodes部分定義兩個節(jié)點。設(shè)置文件將同時存放在兩個節(jié)點上,這樣這兩個節(jié)點就都知道彼此的情況。
集群內(nèi)的每個節(jié)點都聲明其阻絕方式的名稱是獨一無二的。在clusternames結(jié)束標(biāo)簽下面,我們看到fencedevice部分定義了每個節(jié)點如何阻絕其他節(jié)點的方式。使用一個支持IPMI(智能平臺管理接口)的服務(wù)器是最好的方式,而且其設(shè)置也是相當(dāng)簡單。你只要將IPMI的地點以及登錄方式告訴IP就可以了。為了避免在cluster.conf中留下密碼,你可以將它指向一個由根所擁有的腳本并由這個腳本來返回密碼。
我們還要指出的是我們在設(shè)置中定義了兩個節(jié)點。這是必須的,因為通常來說,除非大部分節(jié)點都同意自己的狀態(tài),否則集群無法達到"Quorate"狀態(tài)。如果只有兩個節(jié)點的話,沒有肯定多數(shù),因此這種方式讓集群只能在兩個節(jié)點下工作,而不能只在只有一個節(jié)點的情況下工作。這是設(shè)置基本集群的必要方式。
在每個節(jié)點上運行"service cman start",系統(tǒng)應(yīng)該可以開始正常運作。你可以檢查"clustat"或"cman nodes"來確認節(jié)點是否良好運行。如果有哪個必要的部分沒有啟動,那么集群將不會顯示"Quorate"狀態(tài)。 #p#page_title#e#
GFS設(shè)置
首先,我們需要設(shè)置CLVM,這樣我們才可以通過GFS使用LVM.激活CLVM只要在lvm.conf中設(shè)定"locking type=3"就可以了。
然后,就像平常一樣創(chuàng)建一個LVM卷組和卷,但是使用的是共享的塊設(shè)備。如果你使用的是DRBD,你將有可能使用/dev/drbd0.我創(chuàng)建了一個物理卷,然后創(chuàng)建一個名為vg01的卷組,然后創(chuàng)建一個名為web1的邏輯卷,這個卷在:/dev/vg01/web1.
最后,我們需要創(chuàng)建文件系統(tǒng):
gfs_mkfs -t web1:mygfs -p lock_dlm -j 2 /dev/vg01/web1
-t中給定的名稱必須是集群的名稱,然后后面是你給這個文件系統(tǒng)所起的名字。只有web1集群的成員才可以載入這個文件系統(tǒng)。然后,設(shè)定分布式鎖管理器的鎖鑰類型,指明你需要兩份journal(因為這是一個雙節(jié)點集群)。如果你預(yù)計未來要增加更多的節(jié)點,那么你需要在這時設(shè)定足夠高的journal數(shù)量。
總結(jié)
我們現(xiàn)在可以開始使用這個文件系統(tǒng)了。在兩個節(jié)點上啟動"clvmd"和"gfs"服務(wù)?,F(xiàn)在你就可以通過"-t gfs"來將類型指定為GFS,從而載入文件系統(tǒng)。
在開始啟動之前,一定要設(shè)定好cman,clvmd和gfs服務(wù)。你最好能熟悉clustat和gfs_tool命令,因為在系統(tǒng)出現(xiàn)問題的時候,你可以用這些命令來查找問題所在。
不要指望GFS能很快。如果有一個節(jié)點在進行大量的寫入操作的話,那么在訪問文件系統(tǒng)的時候出現(xiàn)停頓是很正常的。對于一個數(shù)據(jù)讀取操作比數(shù)據(jù)寫入操作多得多的Web集群來說,這倒不是什么問題。如果出現(xiàn)明顯延遲,那么首先要檢查一下所有組件的狀況,然后評估正在寫入的數(shù)據(jù)。防止延遲現(xiàn)象的最常見措施就是確保HTTP對話中的數(shù)據(jù)不是寫入GFS卷。