存儲技術概述——集群存儲
運用集群技術來擴展服務器的性能、容量、連通性和實用性已經(jīng)沒有什么可好奇的了。然而,集群存儲就是另外一回事了。
什么是集群存儲
在集群里,一組獨立的節(jié)點或主機可以象一個系統(tǒng)一樣步調(diào)一致地工作。它們不僅可以共享公用的存儲陣列或者SAN,也可以擁有只有一個命名空間的公用文件系統(tǒng)。
最近的一些案例來自Cluster File Systems、Oracle、Red Hat以及新興的Panasas和Spinnaker Networks公司等。Red Hat公司于去年收購了Sistina公司,該公司發(fā)布了適用于開放源碼的集群Global File System。Network Appliance公司則收購了Spinnaker Networks公司,該公司目前正在使用其SpinCluster軟件來改進網(wǎng)格戰(zhàn)略,即對網(wǎng)絡附加存儲(NAS)以及SAN存儲進行集群整合。Oracle公司也在該公司的真正應用集群(Oracle 9i RAC)上使用其Cluster File System。Cluster File Systems公司則使用其Lustre File System來建立高性能的集群。
在一些成功案例里,單獨的服務器也是通過元數(shù)據(jù)服務器或設備與存儲連接,元數(shù)據(jù)服務器或設備可以對數(shù)據(jù)進行很細的分類,以使這些數(shù)據(jù)可以很容易地找到。
更好的性能是一些用戶使用集群文件系統(tǒng)的一個關鍵理由。某用戶目前使用Lustre File System,他們通過構建的集群來進行科學仿真和模型建立工作,如今把兩個1000節(jié)點的集群用于生產(chǎn)系統(tǒng)。以前,需要在每一個集群上安裝文件系統(tǒng),而且當有人需要數(shù)據(jù)時,經(jīng)常需要把一個文件復制到另一個集群上去,文件系統(tǒng)之間頻繁的FTP任務對整個系統(tǒng)的性能造成了很大的影響。而現(xiàn)在他們能夠隨時將數(shù)據(jù)從文件系統(tǒng)中調(diào)出來閱讀,在不影響正常仿真任務進行的同時查看系統(tǒng)運行結果。
集群存儲產(chǎn)品列表
集群存儲的優(yōu)勢
通常,集群存儲總是和高性能計算聯(lián)系在一起,不過事實上,集群存儲正快速被主流的商業(yè)環(huán)境所采用。這些商業(yè)領域被集群存儲的優(yōu)點所吸引。集群存儲通過采用開放訪問方法,如NFS和Windows CIFS,以及使用業(yè)界標注和第三方存儲,對現(xiàn)有的技術和協(xié)議加以利用,如以太網(wǎng)、光纖通卡以及InfiniBand協(xié)議。
目前,發(fā)展速度最快的集群存儲解決方法可能是網(wǎng)絡附屬存儲(NAS)文件服務器。企業(yè)需要擺脫單一存儲結構的限制,擴展到能夠對結構化和非結構化的數(shù)據(jù)進行管理。這樣的需求對集群NAS技術的部署起到一定的推動作用。
集群NAS系統(tǒng)在許多層面都具有可擴展的優(yōu)勢:
• 能夠提高大型的序列帶寬(吞吐量)的性能,或提高小型IOPS,即每秒輸入輸出次數(shù)(事務型)以及元數(shù)據(jù)查找的性能;
• 擴展存儲容量;
• 提高基于本地或以分布式的可用性,與設備或站點故障相隔離;
• 擴展的靈活性,包括同時訪問相同或不同的數(shù)據(jù)以及由于不同的應用需求對數(shù)據(jù)進行平行訪問;
• 具有提供模塊存儲增長的擴展能力;
• 提供了易于管理任務的擴展性,例如存儲的精簡配置、負荷平衡以及數(shù)據(jù)保護。
NAS和文件集群服務的方法
大多數(shù)公司采用的集群技術應用于存儲、文件系統(tǒng)和文件服務器。集群技術可以為存儲系統(tǒng)增加待機或故障接管的能力,而這些能力反過來為大量的控制器、存儲節(jié)點或處理器,以及集群文件系統(tǒng)提供擴展支持。討論集群存儲時產(chǎn)生困惑的一個原因是,既有基于塊(iSCSI和光纖通道)和基于文件(NAS NFS和CIFS)的存儲,虛擬磁帶庫,還有各種各樣其它的集群存儲解決方法。
集群文件系統(tǒng)能夠讓管理員跨應用服務器訪問同一個存儲池。同時,集群文件系統(tǒng)也允許對數(shù)據(jù)文件的共享訪問(讀取和寫入),這樣,無論是直接式存儲還是網(wǎng)絡存儲,都有利于保持文件的一致性與完整性?,F(xiàn)在的集群文件系統(tǒng)有SGI推出的高度可擴展性文件共享系統(tǒng)(CXFS),美國昆騰公司的歸檔軟件(StorNext),Red Hat的全球文件系統(tǒng)(GFS),IBM的兩種共享文件系統(tǒng)SFS和GPFS。并不是所有的集群NAS都有一個集群文件系統(tǒng),也不是所有的集群文件系統(tǒng)都要依賴集群NAS服務器。有些系統(tǒng)(例如IBRIX公司的提供多用途文件系統(tǒng)解決方案的IBRIX Fusion)可以將這兩者結合起來。 #p#page_title#e#
與傳統(tǒng)的NAS文件服務器或集群存儲系統(tǒng)相比,集群文件服務器的不同之處在于硬件與軟件結合起來的方式。集群文件系統(tǒng)可以安裝在應用服務器上,或者專門的設備或服務器上,將它們轉化成為存儲服務器(本質上變成一個集群文件服務器)。有的集群文件服務器,如惠普的PolyServe和IBRIX的Fusion,都是混合的系統(tǒng),從而能夠使集群式或者平行文件系統(tǒng)在符合業(yè)界標準的服務器上部署。
有的廠商擁有雙重或多重存儲控制器、存儲引擎、NAS或者網(wǎng)關,使用主動/主動模式(兩個控制器同時工作)還是主動/被動模式( 其中一個控制器是備用的)。他們聲稱具有集群存儲系統(tǒng)。我想說的是,如果你將一對存儲處理器或是控制器等同于一個集群,你就將不得不考慮每一個具有兩個節(jié)點以上的存儲系統(tǒng)是一個集群……這樣的話,幾乎包括了市場上所有的中檔存儲區(qū)域網(wǎng)絡(SAN)、直連式存儲(DAS)以及NAS存儲系統(tǒng)。
還有更多的廠商能夠提供集群NAS存儲(換言之,超過基本的故障接管),更為重要的是,他們還可以提供集群文件服務器。NAS,就本質上來說,是一種安裝在硬件之上的文件服務器的解決方案。有某些情況下,它具有能夠將硬件轉化成為集群文件服務器的能力。能夠提供NAS硬件/軟件的解決方案,同時支持集群文件系統(tǒng)和底層硬件的產(chǎn)品包括NetApp的GX,BlueArc的Titan以及Isilon和Panasas的集群存儲產(chǎn)品.
Isilon和Panasas運用的是專有的處理器和存儲器。BlueArc使用的是優(yōu)化處理器,這些處理器附屬于由多個廠商提供的底層RAID控制器,并且可以共享訪問。還有的產(chǎn)品利用安裝在符合業(yè)界標準服務器上的集群文件系統(tǒng),將服務器轉化為存儲服務器,例如惠普的PolyServe和IBRIX的Fusion。
SAN文件系統(tǒng)
隨著文件大小和數(shù)據(jù)規(guī)模逐步達到TB和PB,用戶也開始尋找一種新的方法,以便在不同的主機之間存儲、訪問和共享文件。集群和存儲區(qū)域網(wǎng)(SAN)文件系統(tǒng)也因此應運而生。
廠商們已經(jīng)制造了一些軟件和硬件設備,它們可以把不相干的文件系統(tǒng)融合成只使用一個命名空間的文件系統(tǒng)。用戶可以訪問并共享其他用戶的數(shù)據(jù),而無需考慮是什么介質或其所處的是哪臺主機。
這些設備和軟件所使用的技術就是人們所熟知的集群和SAN文件系統(tǒng)。與分布式文件系統(tǒng)相比,此類文件系統(tǒng)有如下幾大優(yōu)勢:因為數(shù)據(jù)不需要從一個文件系統(tǒng)拷貝或復制到另一個文件系統(tǒng),通過集群系統(tǒng)共享應用和數(shù)據(jù)的任務執(zhí)行起來要比在單獨的設備上執(zhí)行快得多;集群可以為文件和文件系統(tǒng)提供更多的空間;因為只需要管理一個文件系統(tǒng),而不再是每個存儲設備或主機都需要一個文件系統(tǒng),管理也更容易了;如果集群內(nèi)的某臺服務器出現(xiàn)了故障,另一臺服務器就可以把它的工作接手過來,故障恢復也成為了現(xiàn)實;用戶也可以同時對位于其網(wǎng)絡上的存儲設備里的所有文件進行訪問。
盡管集群文件系統(tǒng)具有上述優(yōu)勢,但是,它仍有一些地方需要改進。
有用戶評價說,集群文件系統(tǒng)非常復雜,此外,它們還需要技術人員很好的支持和專業(yè)技能來對其進行體系結構的設計,并使其運行起來。
與之相比,SAN文件系統(tǒng)能夠把服務器與存儲進行連接,并對文件系統(tǒng)環(huán)境進行“虛擬化”。
另一用戶擁有的50TB數(shù)據(jù)是由ADIC公司的StorNext FS負責管理的。它正在進行科學鏡像數(shù)據(jù)收集。
該用戶的文件相對來說比較大,最大可達1GB,因此,使用分級存儲格式來存儲。其IT主管Terry Duncan說,“我們的大型系統(tǒng)里有數(shù)百萬份文件。我們希望多個系統(tǒng)能夠以非常快的速度同時查看相同的數(shù)據(jù)。”
Duncan說,使用SAN文件系統(tǒng)之后,管理更容易了。如果我們不能把文件編寫到一個公用空間,以便讓數(shù)個系統(tǒng)同時訪問這些文件的話,就很難以我們需要的速度來處理這些數(shù)據(jù);如果不能擁有單一的命名空間的話,就得花大量的時間來回移動500GB的數(shù)據(jù)并對其進行分析。