光纖硬盤磁盤陣列技術(shù)分析
當(dāng)今世界信息爆炸式的增長(zhǎng),除了給科技與技術(shù)的發(fā)展帶來更大的發(fā)展動(dòng)力外,也給企業(yè)的數(shù)據(jù)存儲(chǔ)帶來了巨大的挑戰(zhàn)。然而,作為企業(yè)信息存儲(chǔ)系統(tǒng)中的最關(guān)鍵部分——磁盤陣列,很多人未必能說得清楚。
磁盤陣列技術(shù)誕生于1987年,由美國(guó)加州大學(xué)伯克利分校提出。這項(xiàng)技術(shù)的核心設(shè)計(jì)理念是RAID技術(shù)。原來的名稱是“Redundant Array of Inexpensive Disk”,最初的研制它的目的是為了組合小型的廉價(jià)磁盤來代替大的昂貴磁盤,以降低大批量數(shù)據(jù)存儲(chǔ)的費(fèi)用。同時(shí)也希望通過冗余信息的方式,使得單一磁盤失效時(shí)不會(huì)丟失數(shù)據(jù),因此開發(fā)出不同級(jí)別的RAID數(shù)據(jù)保護(hù)技術(shù),并在此基礎(chǔ)上逐漸致力于提升數(shù)據(jù)訪問速度。這個(gè)名字后來改為“Redundant Array of Independent Disk”,但仍然稱作“RAID”。
經(jīng)過多年的發(fā)展,企業(yè)中數(shù)據(jù)的價(jià)值越來越高,而承載這些數(shù)據(jù)的磁盤陣列也越發(fā)受到用戶的重視。從市場(chǎng)分布可以看出,存儲(chǔ)與服務(wù)器所占比例呈逐年上升趨勢(shì)。用戶的強(qiáng)大需求同時(shí)也給存儲(chǔ)系統(tǒng)供應(yīng)商創(chuàng)造了巨大的商機(jī)。目前市場(chǎng)上不但有老牌廠商提供的各種產(chǎn)品,也有初創(chuàng)公司新推的各種系統(tǒng)。自然,當(dāng)前市場(chǎng)上的磁盤陣列也是一番花團(tuán)錦簇的景象。在用戶有了眾多選擇的同時(shí),也有了選擇上的困惑。因此,我們就從體系結(jié)構(gòu)的角度,簡(jiǎn)要分析目前磁盤陣列的差異性,希望可以給用戶在選擇磁盤陣列時(shí)參考。
目前的磁盤接口有IDE、SATA、SCSI、SAS、FC等幾種。其中IDE接口磁盤正在被SATA接口硬盤取代,將逐漸退出歷史舞臺(tái),兩者主要多用于桌面;SAS接口磁盤也正在逐漸淘汰SCSI接口,很快將占領(lǐng)企業(yè)應(yīng)用的低端市場(chǎng);而FC(Fibre Channel,光纖)接口硬盤一出生就是專門針對(duì)高可靠、高可用、高性能的企業(yè)存儲(chǔ)應(yīng)用的,不但接口速度快,而且支持雙端口訪問,又經(jīng)過嚴(yán)格的生產(chǎn)工藝控制,可靠性很好。由于這些天生優(yōu)勢(shì),F(xiàn)C接口硬盤在企業(yè)用戶中尤其是關(guān)鍵數(shù)據(jù)存儲(chǔ)應(yīng)用中占據(jù)著絕對(duì)優(yōu)勢(shì),也是高端存儲(chǔ)應(yīng)用的首選磁盤。
基于SATA、SCSI接口的磁盤陣列大家見過很多了,這里就不再贅述,重點(diǎn)說是所光纖接口磁盤陣列。光纖磁盤陣列又可進(jìn)一步從體系結(jié)構(gòu)細(xì)分成三大類:JBOD磁盤陣列、雙控制器磁盤陣列和多控制器磁盤陣列。
RAID的英文全稱為:Redundant Array of Independent Disks。翻譯成中文即為獨(dú)立磁盤冗余陣列,或簡(jiǎn)稱磁盤陣列。由美國(guó)加州大學(xué)在1987年開發(fā)成功。
RAID的初衷主要是為大型服務(wù)器提供高端的存儲(chǔ)功能和冗余的數(shù)據(jù)安全。 我們可以這樣來理解,RAID是一種把多塊獨(dú)立的硬盤(物理硬盤)按不同方式組合起來形成一個(gè)硬盤組(邏輯硬盤),從而提供比單個(gè)硬盤更高的存儲(chǔ)性能和提供數(shù)據(jù)冗余的技術(shù)。組成磁盤陣列的不同方式成為RAID級(jí)別(RAID Levels)。在用戶看起來,組成的磁盤組就像是一個(gè)硬盤,用戶可以對(duì)它進(jìn)行分區(qū),格式化等等??傊?,對(duì)磁盤陣列的操作與單個(gè)硬盤一模一樣。不同的是,磁盤陣列的存儲(chǔ)性能要比單個(gè)硬盤高很多,而且在很多RAID模式中都有較為完備的相互校檢/恢復(fù)的措施,甚至是直接相互的鏡象備份,從而大大提高了RAID系統(tǒng)的容錯(cuò)度,提高了系統(tǒng)的穩(wěn)定冗余性,這也是Redundant一詞的由來。
不過,所有的RAID系統(tǒng)最大的優(yōu)點(diǎn)則是"熱交換"能力:用戶可以取出一個(gè)存在缺陷的驅(qū)動(dòng)器,并插入一個(gè)新的予以更換。對(duì)大多數(shù)類型的RAID來說,可以利用鏡像或奇偶信息來從剩余的驅(qū)動(dòng)器重建數(shù)據(jù)不必中斷服務(wù)器或系統(tǒng),就可以自動(dòng)重建某個(gè)出現(xiàn)故障的磁盤上的數(shù)據(jù)。這一點(diǎn),對(duì)服務(wù)器用戶以及其他高要求的用戶是至關(guān)重要的。
數(shù)據(jù)冗余的功能指的是:在用戶數(shù)據(jù)一旦發(fā)生損壞后,利用冗余信息可以使損壞數(shù)據(jù)得以恢復(fù),從而保障了用戶數(shù)據(jù)的安全性。
RAID以前一直是SCSI領(lǐng)域獨(dú)有的產(chǎn)品,因?yàn)樗?dāng)時(shí)的技術(shù)與成本也限制了其在低端市場(chǎng)的發(fā)展。今天,隨著RAID技術(shù)的不斷成熟與廠商的不斷努力,我們已經(jīng)能夠享受到相對(duì)成本低廉的多的IDE-RAID系統(tǒng),雖然穩(wěn)定與可靠性還不能與SCSI-RAID相比,但它相對(duì)于單個(gè)硬盤的性能優(yōu)勢(shì)對(duì)廣大玩家是一個(gè)不小的誘惑。隨著相關(guān)設(shè)備的擁有成本和使用成本不斷下降,這項(xiàng)技術(shù)也已獲得一般電腦用戶的青睞。 #p#page_title#e#
嚴(yán)格意義上講,JBOD還不能稱之為“陣列”。JBOD是Just Bundle of Disk的縮寫,意即只是一串磁盤的組合。這樣的“磁盤陣列”也被稱為傻盤陣列,因?yàn)镴BOD內(nèi)部既沒有控制器,也沒有緩存,磁盤之間也沒有提高性能和安全性的任何手段。每個(gè)磁盤都獨(dú)立地接收來自主機(jī)的數(shù)據(jù)訪問。如果需要實(shí)現(xiàn)RAID級(jí)別的保護(hù),主機(jī)不但要負(fù)擔(dān)磁盤讀寫等操作,還要進(jìn)行RAID算法的處理,對(duì)主機(jī)資源的占用率較大,嚴(yán)重影響系統(tǒng)整體性能。
因此,在采用光纖磁盤陣列時(shí),一般都采用帶智能磁盤控制器的磁盤陣列。磁盤控制器是介于主機(jī)和磁盤之間的控制單元,配置有專門為I/O進(jìn)行過優(yōu)化的處理器以及一定數(shù)量的cache??刂破魃系腃PU和cache共同實(shí)現(xiàn)對(duì)來自主機(jī)系統(tǒng)I/O請(qǐng)求的操作和對(duì)磁盤陣列的RAID管理。相對(duì)于JBOD磁盤陣列,控制器磁盤陣列釋放了大量主機(jī)資源,來自主機(jī)的I/O請(qǐng)求由控制器接受并處理,陣列上的cache則作為I/O緩沖池,能夠大大提高了磁盤陣列的讀寫響應(yīng)速度,顯著改善磁盤陣列的性能。又由于光纖磁盤天生擁有雙端口,所以,一般的光纖盤陣都采用雙控制器,從而充分發(fā)揮光纖磁盤的高可用特性。兩個(gè)控制器不管配置成active-active還是active-standby,都能為用戶提供高可用特性,而且大都支持熱插拔功能,能夠?qū)崿F(xiàn)簡(jiǎn)單的無單點(diǎn)故障,為用戶提供的7*24不間斷業(yè)務(wù)。
在配置了CPU和cache的磁盤陣列中,其部分高端產(chǎn)品還可以運(yùn)行基于磁盤陣列的存儲(chǔ)軟件。因此,它可以提供比較全面的基于磁盤陣列的解決方案。
磁盤控制器:管理cache和物理磁盤組之間I/O及運(yùn)行基于存儲(chǔ)的軟件解決方案。
在實(shí)際應(yīng)用時(shí),每層的控制器至少成對(duì)配置,提供全冗余特性,實(shí)現(xiàn)無單點(diǎn)故障。也可以配置多對(duì),在性能上進(jìn)行成倍擴(kuò)展。比如EMC的DMX-3最多可以配置8個(gè)前端控制器(Channel Director)、8個(gè)緩存控制器(Memory Director)、8個(gè)后端控制器(Disk Director),整個(gè)系統(tǒng)中處理器數(shù)量最多可達(dá)130顆。多級(jí)控制器分工協(xié)作,系統(tǒng)整體性能因而可以獲得最佳擴(kuò)展性。更重要的是,在多控制器體系結(jié)構(gòu)基礎(chǔ)上,提供了許多獨(dú)特存儲(chǔ)軟件解決方案。該檔次產(chǎn)品是大型關(guān)鍵業(yè)務(wù)數(shù)據(jù)中心的首選。
在當(dāng)前存儲(chǔ)市場(chǎng)上,這一類的磁盤陣列種類繁多,數(shù)量巨大,同時(shí)也在質(zhì)量和性能上也存在著巨大的差距,價(jià)格跨度也很大。其代表產(chǎn)品有IBM DS系列、HP EVA系列、EMC CLARIION系列、HDS Thunder 95系列等等。LSI也在這一檔次的磁盤陣列方面頗有建樹。尤其值得一提的是,IBM S-4000系列、STK D系列及SGI TP系列都是OEM LSI公司的E系列陣列控制器。
從體系結(jié)構(gòu)上講,這類產(chǎn)品屬于中端產(chǎn)品,但其中比較引人注目的是IBM SHARK系列產(chǎn)品。IBM的SHARK系列產(chǎn)品是典型雙控制器結(jié)構(gòu)的產(chǎn)品,其高端型號(hào)DS-8300產(chǎn)品的每個(gè)控制器是4個(gè)CPU的P570小型機(jī),雙控制器最大配置CPU數(shù)量為8個(gè)CPU。但DS-8000系列產(chǎn)品具備了許多高端產(chǎn)品應(yīng)有的特征,比如主機(jī)端口最大可達(dá)128個(gè)2Gb FC,磁盤接口多大64個(gè),緩存容量也可以達(dá)到256GB,這些特性使其可以匹敵多控制器存儲(chǔ)系統(tǒng),因此,DS-8000系列也是IBM公司參與高檔存儲(chǔ)產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)的主要武器,而且和競(jìng)爭(zhēng)對(duì)手高檔產(chǎn)品相比其價(jià)格優(yōu)勢(shì)非常明顯。
第三類是多控制器磁盤陣列:雙控制器磁盤陣列由于控制器只能配置兩個(gè),不能在同一磁盤陣列內(nèi)配置更多控制器,在一定程度上局限了其數(shù)據(jù)處理能力。多控制器磁盤陣列便應(yīng)運(yùn)而生,其體系結(jié)構(gòu)一般分為三層:
通道控制器:管理主機(jī)和cache之間I/O及運(yùn)行基于存儲(chǔ)的軟件解決方案。
全局緩存控制器:巨大的非易失性cache,它是系統(tǒng)性能超群的基礎(chǔ)之一。
目前,掌握高檔多控制器體系結(jié)構(gòu)產(chǎn)品技術(shù)的廠家,只有EMC和HDS這兩家公司。從體系結(jié)構(gòu)來看,最初的EMC和HDS公司的多控制器磁盤陣列產(chǎn)品沒有什么區(qū)別,都是基于總線結(jié)構(gòu)。后來HDS開發(fā)出了基于全交換架構(gòu)的Lightning9000/USP系列,并在內(nèi)部把控制流和數(shù)據(jù)流分開,提升了內(nèi)部的傳輸帶寬。其后EMC推出了基于直聯(lián)矩陣結(jié)構(gòu)的Symmetrix DMX系統(tǒng),在繼承低延遲特性的基礎(chǔ)之上,進(jìn)一步的提升了內(nèi)部總線的帶寬。但無論如何,這類系統(tǒng)都是以高可靠性和高可用性為訴求的高端存儲(chǔ)陣列,在這兩方面已經(jīng)達(dá)到了近乎完美,在電信和銀行等領(lǐng)域都得到了極大的認(rèn)可和廣泛的應(yīng)用。 #p#page_title#e#
很多服務(wù)器生產(chǎn)廠商也都有磁盤陣列產(chǎn)品出售。由于擁有廣泛的銷售渠道和強(qiáng)大的市場(chǎng)運(yùn)作能力,也有較高的市場(chǎng)占有率,到目前為止,所有主機(jī)廠商掌握自主知識(shí)產(chǎn)權(quán)的磁盤陣列仍然停留在雙控制器磁盤陣列這個(gè)層面。雖然HP和SUN也有的多控制器體系結(jié)構(gòu)的磁盤陣列在銷售,但都是OEM HDS產(chǎn)品。
RAID并沒有限制使用多少個(gè)盤,應(yīng)用時(shí)盤越多越好。
對(duì)于SCSI結(jié)構(gòu)的RAID來說,盤的最大數(shù)量與SCSI通道(SCSI總線)的數(shù)量有關(guān),
一般是每個(gè)通道最多裝15個(gè)盤(SCSI/3),
對(duì)于FC-AL(光纖)則是每個(gè)通道200個(gè)盤.
當(dāng)下流行的信息生命周期管理、虛擬存儲(chǔ)、存儲(chǔ)資源管理等等理念都和分級(jí)存儲(chǔ)密切相關(guān),這為用戶進(jìn)行全方位的數(shù)據(jù)管理提供了參考。用戶可以根據(jù)信息的價(jià)值采取適當(dāng)級(jí)別的磁盤陣列,制定相應(yīng)的存儲(chǔ)方案。