全面解析存儲集群系統(tǒng)
集群技術(shù)應(yīng)用于數(shù)據(jù)中心的服務(wù)器設(shè)備上已經(jīng)有幾年的歷史了,效果顯著;現(xiàn)在,它經(jīng)過研發(fā)與實(shí)施,優(yōu)勢完全顯露出來,應(yīng)用范圍逐漸覆蓋了其它各類存儲設(shè)備。
通過應(yīng)用集群技術(shù),不僅可有效提升數(shù)據(jù)中心服務(wù)器系統(tǒng)的穩(wěn)定性、可用性及可管理性,同時,允許用戶使用價格相對低廉的配置(如刀片)捆綁來替代昂貴的單塊集成電路的高端服務(wù)器,在不影響性能的情況下節(jié)約了存儲成本。服務(wù)器集群技術(shù)的種種優(yōu)點(diǎn)引起了存儲業(yè)界的高度興趣,不過,由于應(yīng)用領(lǐng)域不一樣,在部署存儲集群系統(tǒng)的過程中涌現(xiàn)出來的問題,與服務(wù)器集群系統(tǒng)是完全不同的。雖然各個存儲供應(yīng)商們所采取的解決辦法不盡相同,但是,總體而言,目前市面上出售的存儲集群產(chǎn)品主要分為兩大類:一類是集群文件系統(tǒng),一類是建立在集群的架構(gòu)之上的獨(dú)立硬件設(shè)備。
“以傳統(tǒng)的中端存儲系統(tǒng)為例,它的磁盤資源一般挺不了多久,就會被用得干干凈凈,”來自于企業(yè)策略集團(tuán)(ESG)的高級分析師Tony Asaro介紹說。如果用戶需要更大的存儲空間,除了購買一套新的存儲系統(tǒng)及相關(guān)的附屬設(shè)備之外,用戶并沒有太大的選擇空間。
注意:部署一套集群存儲系統(tǒng),并非意味著用戶一定要配置服務(wù)器集群系統(tǒng),雖然兩種集群技術(shù)有著異曲同工之效,它們相互之間卻是完全獨(dú)立的。
51CTO存儲頻道在近期推出的“存儲專家在線沙龍”活動,主題就是“FAN——基于文件的虛擬存儲”,將由國家高性能計算機(jī)研究所工程中心主任許魯給大家詳細(xì)的講解集群存儲的應(yīng)用與部署。
存儲集群的來龍去脈
時值存儲業(yè)界內(nèi)到處熱炒“存儲集群”概念之際,不少投機(jī)份子紛紛加入混水摸魚之列。所有的存儲供應(yīng)商都紛紛鼓吹自家的硬件設(shè)備或軟件工具是集群技術(shù)的“結(jié)晶”——也就是說,它們的產(chǎn)品可以融入任意的存儲環(huán)境內(nèi)。這顯然有點(diǎn)兒言過其實(shí)了,它們中大多數(shù)僅僅只能算作是集群應(yīng)用程序,即使能夠與一些廠商的存儲系統(tǒng)共享訪問數(shù)據(jù)和工作負(fù)載,但也是有一定局限性的,不可能與市面上所有的存儲產(chǎn)品都實(shí)現(xiàn)無縫兼容。
企業(yè)存儲管理員們在日常工作中經(jīng)常會遇到四大類問題,分別為容量可擴(kuò)展性、性能可擴(kuò)展性、可用性、可管理性。雖然不是絕對的,但是,這4類問題確實(shí)“催生”了許多存儲集群產(chǎn)品。老實(shí)說,幾乎所有的存儲系統(tǒng)都是圍繞著如何解決這些問題而設(shè)計的:
·容量可擴(kuò)展性。在不干擾系統(tǒng)正常運(yùn)作的情況之下,接入新的磁盤陣列,擴(kuò)大系統(tǒng)的存儲容量。
·性能可擴(kuò)展性。隨著系統(tǒng)容量的不斷擴(kuò)大,支持的主機(jī)服務(wù)器數(shù)量不斷增加,系統(tǒng)整體的性能也應(yīng)該有相應(yīng)的提升,否則很難維持正常運(yùn)作。
·高可用性。冗余的存儲組件和透明化的容災(zāi)恢復(fù)操作,可確保備份數(shù)據(jù)的高可用性。
·可管理性。系統(tǒng)升級、數(shù)據(jù)容災(zāi)恢復(fù)、存儲資源管理,都應(yīng)該盡可能地實(shí)現(xiàn)自動化操作。
以上四類問題,可通過不同的途徑來加以解決,不過,集群存儲系統(tǒng)的工作原理基本上都是大同小異的,比如說,所有的設(shè)備被整合到一個虛擬的存儲池,組成一個透明化的全局文件系統(tǒng),整個集群系統(tǒng)只能分配到一個驅(qū)動器盤符。一來緩解了存儲管理壓力,二來提高了現(xiàn)有磁盤資源的利用率。此外,還增加了服務(wù)器共享數(shù)據(jù)的能力,避免了因相同文件被重復(fù)備份而造成的不必要的資源浪費(fèi)。
集群的概念
兩臺控制器耦合在一起,互為冗余,如果其中一臺設(shè)備發(fā)生了故障,另一臺將會自動頂替上,維持業(yè)務(wù)的連續(xù)性,這就是最簡單的集群形式。凡是支持active-passive工作模式的冗余雙控制器配置方案,兩臺控制器中總有一臺一直處于備用狀態(tài),從控制器并不會分擔(dān)主控制器的工作負(fù)載,而且系統(tǒng)容量是無法擴(kuò)展的,所以,active-passive方案又被稱作“偽集群”。而支持active-active工作模式的冗余控制器配置方案,則是在仿集群的基礎(chǔ)之上向前邁進(jìn)了一步,在兩臺控制器之間實(shí)現(xiàn)了雙向的失效切換和負(fù)載均衡分配。 #p#page_title#e#
在非分布式的active-active集群系統(tǒng)中,集群成員共享一個文件系統(tǒng)及其它的物理設(shè)備資源,它最大的缺點(diǎn)就是:給指定控制器分配存儲資源及邏輯單元號(LUN)的工作,主要由存儲管理員來完成。分布式集群系統(tǒng)是目前大多數(shù)存儲廠商最喜歡采用的架構(gòu),在設(shè)計和搭建系統(tǒng)方案時不需要受任何條條框框的限制。在分布式集群中,所有的物理存儲資源都被整合到一個虛擬的存儲池內(nèi),管理員們只需要留意一下存儲設(shè)備與服務(wù)器的連接方式,以及它所運(yùn)行的應(yīng)用程序類型就可以了,諸如配置存儲資源之類的瑣碎事情都由系統(tǒng)自動處理,不需要管理員插手。
單一的文件系統(tǒng)
目前市面上有幾款適合于集群存儲系統(tǒng)的全局文件系統(tǒng)工具,IBM公司推出的SAN文件系統(tǒng)(SAN FS)就是其中的佼佼者。這類程序一般運(yùn)行于某臺存儲設(shè)備或帶有客戶端程序的智能交換機(jī)上,在其支持的主機(jī)服務(wù)器上運(yùn)行,共同構(gòu)成集群存儲系統(tǒng)的核心組件——全局文件系統(tǒng)。
SAN FS及其同類產(chǎn)品采用的是雙交叉(two-pronged)的處理方式:以IP網(wǎng)絡(luò)連結(jié)多點(diǎn)的服務(wù)器,讓分布式的儲存網(wǎng)絡(luò)能夠像單一的服務(wù)器本地文件系統(tǒng)一樣運(yùn)作,不管數(shù)據(jù)所依附的是那一套操作系統(tǒng),該軟件都會持續(xù)追蹤描述性的信息(descriptive information)──也就是所謂的元數(shù)據(jù)(metadata,即:文件內(nèi)伴隨實(shí)際內(nèi)容而有的一些信息,如實(shí)體位置、文件大小、訪問權(quán)限,等等)。這樣一來,就可以依照即定的策略,實(shí)現(xiàn)相連的各存儲設(shè)備間的數(shù)據(jù)遷移,從而提高了系統(tǒng)整體的資源管理水平和分層存儲的效率,有助于推動信息生命周期管理的實(shí)施進(jìn)程。SAN FS可與運(yùn)行Windows、Linux、Unix等主流操作系統(tǒng)的服務(wù)器協(xié)同作業(yè),不過,必須使用IBM的存儲系統(tǒng)來存放元數(shù)據(jù);它可以支持各種后端存儲系統(tǒng),如果與IBM的SAN卷管理器(SVC)搭配使用的話,就可以與其它廠商的磁盤陣列互通。
除了IBM的SAN FC之外,目前市面上發(fā)售的集群文件系統(tǒng)軟件還有Ibrix Inc.的Fusion、PolyServe Inc.的Matrix Cluster、Red Hat Inc.的Global File System (其前身為Sistina GFS)、 SGI的InfiniteStorage Shared Filesystem CXFS和Veritas Software Corp.的Cluster Server。它們都是基于主機(jī)的應(yīng)用軟件,可將SAN網(wǎng)絡(luò)中分布的服務(wù)器集群在一起,提供一個統(tǒng)一的管理界面。
集群文件系統(tǒng)(即:軟件集群產(chǎn)品)之所以受到用戶的追捧,主要是因為它們能夠支持多廠商的存儲設(shè)備,讓用戶以往的投資不至于被浪費(fèi)。相比之下,如果采用硬件集群系統(tǒng)的話,就需要添置新的硬件設(shè)備,費(fèi)用比較大。
當(dāng)然,并不是說所有的集群存儲系統(tǒng)都需要采用虛擬化技術(shù)或全局文件系統(tǒng)。Evaluator Group公司的資深合伙人兼首席分析師Randy Kerns是這樣點(diǎn)評SAN FS的:“它是一套類似于存儲虛擬化的元數(shù)據(jù)服務(wù)器。”SAN FS雖然是集群系統(tǒng)中的關(guān)鍵組件,卻并不是集群系統(tǒng)的全部。“它是實(shí)現(xiàn)全局命名空間的一種途徑,”Kerns強(qiáng)調(diào)說,“不過,誰也沒有規(guī)定,全局命名空間一定要跟集群存儲掛上鉤。”
軟件集群與硬件集群的對比
1、集群解決方案(基于軟件的集群產(chǎn)品)
優(yōu)點(diǎn):可與企業(yè)現(xiàn)已部署的存儲設(shè)備協(xié)同工作;可被應(yīng)用于異構(gòu)存儲系統(tǒng);提高了服務(wù)器的容災(zāi)容錯水平。
缺點(diǎn):無法提高存儲系統(tǒng)的容量和數(shù)據(jù)傳輸速度;無助于提升存儲系統(tǒng)整體的冗余程度和容災(zāi)水平。
2、集群存儲系統(tǒng)(基于硬件的集群產(chǎn)品)
優(yōu)點(diǎn):可提高存儲系統(tǒng)的容量和數(shù)據(jù)傳輸速度;可通過單一的控制平臺來管理所有集群的存儲設(shè)備;不要求安裝服務(wù)器軟件。
缺點(diǎn):不適合于企業(yè)級應(yīng)用;需要重新購買硬件設(shè)備,不能與企業(yè)現(xiàn)有的存儲陣列集群在一起。