絞殺光纖存儲--高性價(jià)比SSD存儲器方案走入緊湊型服務(wù)器設(shè)計(jì)
Fusion-io公司不久前發(fā)布了一款新型SSD卡,現(xiàn)在,該公司正在設(shè)法把TB字節(jié)的存儲器以高性價(jià)比方式置于緊湊型服務(wù)器設(shè)計(jì)中。這項(xiàng)工作將要求服務(wù)器的操作系統(tǒng)(OS)提升其存儲器管理能力,事實(shí)上,這樣的一些工作早已在Linux系統(tǒng)中展開。
“OS的I/O架構(gòu)多年未進(jìn)行創(chuàng)新,其原因在于這無關(guān)緊要;但現(xiàn)在不同了,而且我們發(fā)現(xiàn)OS中遺留著許多陳舊而雜亂的I/O子系統(tǒng)。”Fusion-io公司CTO David Flynn表示,“這些低性能的I/O子系統(tǒng)是目前真實(shí)存在的存儲瓶頸。”
競爭者們也認(rèn)為這種方法很有道理。但他們卻提出警告,認(rèn)為這可能需要花費(fèi)數(shù)年時(shí)間,而且不太可能取代由磁盤驅(qū)動器和混合型驅(qū)動器(嵌入少量閃存)占據(jù)的大規(guī)模市場。
Fusion-io公司已經(jīng)發(fā)布了其ioDrive產(chǎn)品,該產(chǎn)品將80-640GB的NAND閃存整合在了一個(gè)PCI Express卡上,目的在于代替硬盤驅(qū)動器和傳統(tǒng)的固態(tài)驅(qū)動器(SSD)。其新穎的控制器設(shè)計(jì)使產(chǎn)品的每秒I/O操作次數(shù)(IOPS)達(dá)到10萬次,足以與其倚賴的PCI Express總線的吞吐率相匹配。
該卡拓寬了當(dāng)前服務(wù)器架構(gòu)的一些限制。僅一張F(tuán)usion-io高端640GB卡,就可以讓一個(gè)主處理器陷入基于數(shù)據(jù)塊存儲的I/O處理工作中。
“我們有機(jī)會弄清存儲器方面不明白的一些事情,而這正是我們這么做的原因,因?yàn)榇鎯ζ髡趶尿?qū)動器型向硅片型轉(zhuǎn)移。”Flynn說。
盡管與閃存相比,硬盤驅(qū)動器的成本要低得多(前者每GB大約要20美元,而后者則在0.5到2美元左右),但是它在性能和功耗方面的表現(xiàn)卻相形見絀。這些因素正在為閃存開辟計(jì)算機(jī),特別是便攜和高端服務(wù)器等新的“前沿陣地”,只要PC的基礎(chǔ)架構(gòu)支持固態(tài)技術(shù)。
如果各類操作系統(tǒng)無需在移動和復(fù)制數(shù)據(jù)塊存儲結(jié)構(gòu)上花費(fèi)太多時(shí)間,那么它們將可以處理更多的數(shù)據(jù)量,F(xiàn)lynn說。這可能會為今天的刀片式服務(wù)器打開新的大門,即“塞入”足夠多的Fusion-io 公司的Express卡,在現(xiàn)有的10U服務(wù)器的局部機(jī)架空間內(nèi)制造一個(gè)20TB的“存儲場”。
目前,這樣的存儲量需要裝滿4個(gè)機(jī)架的旋轉(zhuǎn)式硬盤,在與Fibre Channel交換機(jī)相連的Fibre Channel陣列專有網(wǎng)絡(luò)上進(jìn)行連接才能實(shí)現(xiàn)。建立和運(yùn)行這樣網(wǎng)絡(luò)的成本高達(dá)100萬美元,也就是說每GB需要80美元。與之相比,只要進(jìn)行適當(dāng)?shù)腛S修改,把Fusion-io卡置于服務(wù)器內(nèi)實(shí)現(xiàn)同樣存儲量的成本約為3萬美元,即每GB僅需30美元。
“我們正在把存儲區(qū)域網(wǎng)絡(luò)融入到服務(wù)器中。”Flynn介紹。
Fusion-io公司正在與Linux社團(tuán)(Linux community)合作,以期針對需求對OS進(jìn)行修改。這些改動可能要到今年年底才能完成。據(jù)稱,微軟也在考慮對視窗服務(wù)器進(jìn)行類似的修改。但是截至本文完稿,微軟都未對此事發(fā)表任何評論。
這些改變歸根結(jié)底是為了建立一種更高效的塊存儲新方法。Flynn認(rèn)為,可以把數(shù)據(jù)塊存儲結(jié)構(gòu)提升到更高的OS水平,例如在文件中創(chuàng)建偏移地址。這樣的處理能力也要求對Fusion-io公司已經(jīng)設(shè)計(jì)好的硬件控制器進(jìn)行適當(dāng)修改。
“我們認(rèn)為在PCI Express卡上集成存儲器非常有意義,但問題是這種方法什么時(shí)候能實(shí)現(xiàn)。”美國Stec公司負(fù)責(zé)營銷和業(yè)務(wù)開發(fā)的副總裁Pat Wilkison表示,“在未來18個(gè)月內(nèi),這種方法還不會成為現(xiàn)實(shí)。”
Wilkison指出:“現(xiàn)在沒有用來處理Express上驅(qū)動的協(xié)議。在軟件方面需要進(jìn)行一些大的改變,而這將需要依靠微軟等大公司才能實(shí)現(xiàn)。”
Stec公司制造Zeus固態(tài)驅(qū)動器,該產(chǎn)品把500GB閃存封裝在外表與功能都與3.5英寸硬盤驅(qū)動器相似的殼體內(nèi),并利用標(biāo)準(zhǔn)的3Gbps串行ATA和串行連接SCSI(SAS)驅(qū)動器進(jìn)行互聯(lián)。該公司聲稱,使用8kB數(shù)據(jù)包,該驅(qū)動器的處理速度可達(dá)4萬IOPS。
在2008年早期,OEM們將使用閃存驅(qū)動器將等量的存儲區(qū)域網(wǎng)絡(luò)置于服務(wù)器底架上,而且無需修改操作系統(tǒng),Wilkison說。“借助Zeus產(chǎn)品,行業(yè)內(nèi)正在發(fā)生這種變化,而且對這些高端SSD的采納情況目前看起來還不錯(cuò)。”他說。 #p#page_title#e#
事實(shí)上,甚至希捷科技公司等領(lǐng)先的硬盤驅(qū)動器制造商,也計(jì)劃在近期進(jìn)入SSD市場,但是目前它們尚未披露具體細(xì)節(jié)。
“我們計(jì)劃在2008 財(cái)年付運(yùn)SSD產(chǎn)品,”希捷公司的一名發(fā)言人表示,“展望未來,分析師和用戶都認(rèn)為,從發(fā)貨數(shù)量及字節(jié)來看,硬盤驅(qū)動器仍然是居主導(dǎo)地位的存儲方案,排在其后的是混合硬盤驅(qū)動器,再后是固態(tài)驅(qū)動器。”
在Flynn來看,SSD的設(shè)計(jì)者們都弄錯(cuò)了。“通過SATA總線和SCSI協(xié)議傳送數(shù)據(jù)塊的人沒有抓住關(guān)鍵。”他說。
數(shù)據(jù)塊協(xié)議(block protocol)和驅(qū)動器互聯(lián)是制約閃存通過Express提供更高性能的瓶頸。Fusion-io公司使用了一種直接內(nèi)存訪問(DMA)事務(wù)處理(用于處理器緩存操作)的方法來移動大塊數(shù)據(jù),實(shí)現(xiàn)了每秒10萬次IOPS性能。
“CPU跟不上這樣的I/O速度,因?yàn)橛刑嗟臄?shù)據(jù)塊處理任務(wù)需要在OS中進(jìn)行處理。”Flynn說。
單芯片控制器
Fusion-io公司以單芯片方式實(shí)現(xiàn)了其閃存控制器,其中包含一個(gè)嵌入式1GHz PowerPC 405 內(nèi)核、一個(gè)DMA引擎、一個(gè)PCI Express模塊及各種控制邏輯。該控制器管理把Express卡上各個(gè)閃存裸片(最高可達(dá)160個(gè))連接起來的固定且交織的陣列。
這些多達(dá)160個(gè)的連接被分成多個(gè)層,各層接續(xù)地執(zhí)行給定的事務(wù)。不同層之間相互獨(dú)立并以并行方式工作,從而保持內(nèi)部總線滿負(fù)荷。該總線的寬度為160比特,工作頻率為50MHz,可使閃存芯片的速度與2.5Gbps Express的吞吐能力相匹配。
“基本上,它在NAND閃存中以并行方式推進(jìn)160個(gè)不同的進(jìn)程,”Flynn說。
Fusion-io公司是支持多級單元(MLC)閃存的少數(shù)供應(yīng)商之一。MLC比更為流行的單級單元(SLC)閃存要便宜30到40% ,但壽命更短。
這家新興公司聲稱,其MLC驅(qū)動器將比傳統(tǒng)的硬盤驅(qū)動器壽命更長。Fusion-io公司尚未測試其MLC產(chǎn)品的吞吐速度,但相信可能低于其SLC設(shè)計(jì)的10萬IOPS。
“我們支持MLC,但我們尚不確定我們的混合產(chǎn)品將會是什么樣的。”Flynn說。