存儲(chǔ)技術(shù)概述——集群存儲(chǔ)
運(yùn)用集群技術(shù)來擴(kuò)展服務(wù)器的性能、容量、連通性和實(shí)用性已經(jīng)沒有什么可好奇的了。然而,集群存儲(chǔ)就是另外一回事了。
什么是集群存儲(chǔ)
在集群里,一組獨(dú)立的節(jié)點(diǎn)或主機(jī)可以象一個(gè)系統(tǒng)一樣步調(diào)一致地工作。它們不僅可以共享公用的存儲(chǔ)陣列或者SAN,也可以擁有只有一個(gè)命名空間的公用文件系統(tǒng)。
最近的一些案例來自Cluster File Systems、Oracle、Red Hat以及新興的Panasas和Spinnaker Networks公司等。Red Hat公司于去年收購了Sistina公司,該公司發(fā)布了適用于開放源碼的集群Global File System。Network Appliance公司則收購了Spinnaker Networks公司,該公司目前正在使用其SpinCluster軟件來改進(jìn)網(wǎng)格戰(zhàn)略,即對(duì)網(wǎng)絡(luò)附加存儲(chǔ)(NAS)以及SAN存儲(chǔ)進(jìn)行集群整合。Oracle公司也在該公司的真正應(yīng)用集群(Oracle 9i RAC)上使用其Cluster File System。Cluster File Systems公司則使用其Lustre File System來建立高性能的集群。
在一些成功案例里,單獨(dú)的服務(wù)器也是通過元數(shù)據(jù)服務(wù)器或設(shè)備與存儲(chǔ)連接,元數(shù)據(jù)服務(wù)器或設(shè)備可以對(duì)數(shù)據(jù)進(jìn)行很細(xì)的分類,以使這些數(shù)據(jù)可以很容易地找到。
更好的性能是一些用戶使用集群文件系統(tǒng)的一個(gè)關(guān)鍵理由。某用戶目前使用Lustre File System,他們通過構(gòu)建的集群來進(jìn)行科學(xué)仿真和模型建立工作,如今把兩個(gè)1000節(jié)點(diǎn)的集群用于生產(chǎn)系統(tǒng)。以前,需要在每一個(gè)集群上安裝文件系統(tǒng),而且當(dāng)有人需要數(shù)據(jù)時(shí),經(jīng)常需要把一個(gè)文件復(fù)制到另一個(gè)集群上去,文件系統(tǒng)之間頻繁的FTP任務(wù)對(duì)整個(gè)系統(tǒng)的性能造成了很大的影響。而現(xiàn)在他們能夠隨時(shí)將數(shù)據(jù)從文件系統(tǒng)中調(diào)出來閱讀,在不影響正常仿真任務(wù)進(jìn)行的同時(shí)查看系統(tǒng)運(yùn)行結(jié)果。
集群存儲(chǔ)產(chǎn)品列表
集群存儲(chǔ)的優(yōu)勢(shì)
通常,集群存儲(chǔ)總是和高性能計(jì)算聯(lián)系在一起,不過事實(shí)上,集群存儲(chǔ)正快速被主流的商業(yè)環(huán)境所采用。這些商業(yè)領(lǐng)域被集群存儲(chǔ)的優(yōu)點(diǎn)所吸引。集群存儲(chǔ)通過采用開放訪問方法,如NFS和Windows CIFS,以及使用業(yè)界標(biāo)注和第三方存儲(chǔ),對(duì)現(xiàn)有的技術(shù)和協(xié)議加以利用,如以太網(wǎng)、光纖通卡以及InfiniBand協(xié)議。
目前,發(fā)展速度最快的集群存儲(chǔ)解決方法可能是網(wǎng)絡(luò)附屬存儲(chǔ)(NAS)文件服務(wù)器。企業(yè)需要擺脫單一存儲(chǔ)結(jié)構(gòu)的限制,擴(kuò)展到能夠?qū)Y(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行管理。這樣的需求對(duì)集群NAS技術(shù)的部署起到一定的推動(dòng)作用。
集群NAS系統(tǒng)在許多層面都具有可擴(kuò)展的優(yōu)勢(shì):
• 能夠提高大型的序列帶寬(吞吐量)的性能,或提高小型IOPS,即每秒輸入輸出次數(shù)(事務(wù)型)以及元數(shù)據(jù)查找的性能;
• 擴(kuò)展存儲(chǔ)容量;
• 提高基于本地或以分布式的可用性,與設(shè)備或站點(diǎn)故障相隔離;
• 擴(kuò)展的靈活性,包括同時(shí)訪問相同或不同的數(shù)據(jù)以及由于不同的應(yīng)用需求對(duì)數(shù)據(jù)進(jìn)行平行訪問;
• 具有提供模塊存儲(chǔ)增長(zhǎng)的擴(kuò)展能力;
• 提供了易于管理任務(wù)的擴(kuò)展性,例如存儲(chǔ)的精簡(jiǎn)配置、負(fù)荷平衡以及數(shù)據(jù)保護(hù)。
NAS和文件集群服務(wù)的方法
大多數(shù)公司采用的集群技術(shù)應(yīng)用于存儲(chǔ)、文件系統(tǒng)和文件服務(wù)器。集群技術(shù)可以為存儲(chǔ)系統(tǒng)增加待機(jī)或故障接管的能力,而這些能力反過來為大量的控制器、存儲(chǔ)節(jié)點(diǎn)或處理器,以及集群文件系統(tǒng)提供擴(kuò)展支持。討論集群存儲(chǔ)時(shí)產(chǎn)生困惑的一個(gè)原因是,既有基于塊(iSCSI和光纖通道)和基于文件(NAS NFS和CIFS)的存儲(chǔ),虛擬磁帶庫,還有各種各樣其它的集群存儲(chǔ)解決方法。
集群文件系統(tǒng)能夠讓管理員跨應(yīng)用服務(wù)器訪問同一個(gè)存儲(chǔ)池。同時(shí),集群文件系統(tǒng)也允許對(duì)數(shù)據(jù)文件的共享訪問(讀取和寫入),這樣,無論是直接式存儲(chǔ)還是網(wǎng)絡(luò)存儲(chǔ),都有利于保持文件的一致性與完整性。現(xiàn)在的集群文件系統(tǒng)有SGI推出的高度可擴(kuò)展性文件共享系統(tǒng)(CXFS),美國(guó)昆騰公司的歸檔軟件(StorNext),Red Hat的全球文件系統(tǒng)(GFS),IBM的兩種共享文件系統(tǒng)SFS和GPFS。并不是所有的集群NAS都有一個(gè)集群文件系統(tǒng),也不是所有的集群文件系統(tǒng)都要依賴集群NAS服務(wù)器。有些系統(tǒng)(例如IBRIX公司的提供多用途文件系統(tǒng)解決方案的IBRIX Fusion)可以將這兩者結(jié)合起來。 #p#page_title#e#
與傳統(tǒng)的NAS文件服務(wù)器或集群存儲(chǔ)系統(tǒng)相比,集群文件服務(wù)器的不同之處在于硬件與軟件結(jié)合起來的方式。集群文件系統(tǒng)可以安裝在應(yīng)用服務(wù)器上,或者專門的設(shè)備或服務(wù)器上,將它們轉(zhuǎn)化成為存儲(chǔ)服務(wù)器(本質(zhì)上變成一個(gè)集群文件服務(wù)器)。有的集群文件服務(wù)器,如惠普的PolyServe和IBRIX的Fusion,都是混合的系統(tǒng),從而能夠使集群式或者平行文件系統(tǒng)在符合業(yè)界標(biāo)準(zhǔn)的服務(wù)器上部署。
有的廠商擁有雙重或多重存儲(chǔ)控制器、存儲(chǔ)引擎、NAS或者網(wǎng)關(guān),使用主動(dòng)/主動(dòng)模式(兩個(gè)控制器同時(shí)工作)還是主動(dòng)/被動(dòng)模式( 其中一個(gè)控制器是備用的)。他們聲稱具有集群存儲(chǔ)系統(tǒng)。我想說的是,如果你將一對(duì)存儲(chǔ)處理器或是控制器等同于一個(gè)集群,你就將不得不考慮每一個(gè)具有兩個(gè)節(jié)點(diǎn)以上的存儲(chǔ)系統(tǒng)是一個(gè)集群……這樣的話,幾乎包括了市場(chǎng)上所有的中檔存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)、直連式存儲(chǔ)(DAS)以及NAS存儲(chǔ)系統(tǒng)。
還有更多的廠商能夠提供集群NAS存儲(chǔ)(換言之,超過基本的故障接管),更為重要的是,他們還可以提供集群文件服務(wù)器。NAS,就本質(zhì)上來說,是一種安裝在硬件之上的文件服務(wù)器的解決方案。有某些情況下,它具有能夠?qū)⒂布D(zhuǎn)化成為集群文件服務(wù)器的能力。能夠提供NAS硬件/軟件的解決方案,同時(shí)支持集群文件系統(tǒng)和底層硬件的產(chǎn)品包括NetApp的GX,BlueArc的Titan以及Isilon和Panasas的集群存儲(chǔ)產(chǎn)品.
Isilon和Panasas運(yùn)用的是專有的處理器和存儲(chǔ)器。BlueArc使用的是優(yōu)化處理器,這些處理器附屬于由多個(gè)廠商提供的底層RAID控制器,并且可以共享訪問。還有的產(chǎn)品利用安裝在符合業(yè)界標(biāo)準(zhǔn)服務(wù)器上的集群文件系統(tǒng),將服務(wù)器轉(zhuǎn)化為存儲(chǔ)服務(wù)器,例如惠普的PolyServe和IBRIX的Fusion。
SAN文件系統(tǒng)
隨著文件大小和數(shù)據(jù)規(guī)模逐步達(dá)到TB和PB,用戶也開始尋找一種新的方法,以便在不同的主機(jī)之間存儲(chǔ)、訪問和共享文件。集群和存儲(chǔ)區(qū)域網(wǎng)(SAN)文件系統(tǒng)也因此應(yīng)運(yùn)而生。
廠商們已經(jīng)制造了一些軟件和硬件設(shè)備,它們可以把不相干的文件系統(tǒng)融合成只使用一個(gè)命名空間的文件系統(tǒng)。用戶可以訪問并共享其他用戶的數(shù)據(jù),而無需考慮是什么介質(zhì)或其所處的是哪臺(tái)主機(jī)。
這些設(shè)備和軟件所使用的技術(shù)就是人們所熟知的集群和SAN文件系統(tǒng)。與分布式文件系統(tǒng)相比,此類文件系統(tǒng)有如下幾大優(yōu)勢(shì):因?yàn)閿?shù)據(jù)不需要從一個(gè)文件系統(tǒng)拷貝或復(fù)制到另一個(gè)文件系統(tǒng),通過集群系統(tǒng)共享應(yīng)用和數(shù)據(jù)的任務(wù)執(zhí)行起來要比在單獨(dú)的設(shè)備上執(zhí)行快得多;集群可以為文件和文件系統(tǒng)提供更多的空間;因?yàn)橹恍枰芾硪粋€(gè)文件系統(tǒng),而不再是每個(gè)存儲(chǔ)設(shè)備或主機(jī)都需要一個(gè)文件系統(tǒng),管理也更容易了;如果集群內(nèi)的某臺(tái)服務(wù)器出現(xiàn)了故障,另一臺(tái)服務(wù)器就可以把它的工作接手過來,故障恢復(fù)也成為了現(xiàn)實(shí);用戶也可以同時(shí)對(duì)位于其網(wǎng)絡(luò)上的存儲(chǔ)設(shè)備里的所有文件進(jìn)行訪問。
盡管集群文件系統(tǒng)具有上述優(yōu)勢(shì),但是,它仍有一些地方需要改進(jìn)。
有用戶評(píng)價(jià)說,集群文件系統(tǒng)非常復(fù)雜,此外,它們還需要技術(shù)人員很好的支持和專業(yè)技能來對(duì)其進(jìn)行體系結(jié)構(gòu)的設(shè)計(jì),并使其運(yùn)行起來。
與之相比,SAN文件系統(tǒng)能夠把服務(wù)器與存儲(chǔ)進(jìn)行連接,并對(duì)文件系統(tǒng)環(huán)境進(jìn)行“虛擬化”。
另一用戶擁有的50TB數(shù)據(jù)是由ADIC公司的StorNext FS負(fù)責(zé)管理的。它正在進(jìn)行科學(xué)鏡像數(shù)據(jù)收集。
該用戶的文件相對(duì)來說比較大,最大可達(dá)1GB,因此,使用分級(jí)存儲(chǔ)格式來存儲(chǔ)。其IT主管Terry Duncan說,“我們的大型系統(tǒng)里有數(shù)百萬份文件。我們希望多個(gè)系統(tǒng)能夠以非??斓乃俣韧瑫r(shí)查看相同的數(shù)據(jù)。”
Duncan說,使用SAN文件系統(tǒng)之后,管理更容易了。如果我們不能把文件編寫到一個(gè)公用空間,以便讓數(shù)個(gè)系統(tǒng)同時(shí)訪問這些文件的話,就很難以我們需要的速度來處理這些數(shù)據(jù);如果不能擁有單一的命名空間的話,就得花大量的時(shí)間來回移動(dòng)500GB的數(shù)據(jù)并對(duì)其進(jìn)行分析。