固態(tài)盤SSD存儲技術加速起飛
大約在10年前,SSD公司和SSD驅動器是炙手可熱的日用品,但是到了2000年到2002年的時候,這項技術走向了衰落,以至于幾乎完全銷聲匿跡了。由于很多原因,SSD使用起來并不容易,所以為什么基于閃存的SSD會突然熱起來?這些設備是否會重蹈上一代產(chǎn)品的覆轍?
我很早就開始使用SSD了,那個時候我還在克雷研究所(Cray Research)工作,所以我對這項技術有著很長時間的體驗,這些體驗有好也有壞。我可以告訴你一些關于基準的故事,我用了一些實際操作中不會采用的方式來使用SSD,但是基準原則允許這種做法,而這樣做會導致性能測試結果的變化。我最近看到很多廠商宣稱的固態(tài)存儲設備產(chǎn)品的性能指標,我對測試環(huán)境很好奇,因為在我看來,這些測試的數(shù)據(jù)太過美好,以至于顯得不真實。至少在你買車的時候,你會被告知你所購買汽車的英里數(shù)可能會變化。
既然它的成本要比閃存高出很多,那么它是否能成為存儲層級中的一部分呢?當然,SSD的性能也比磁盤驅動器要高出很多。如果你使用今天標準的15K 2.5英寸SAS驅動器的話,每個驅動器的任意IOPS大約為250。網(wǎng)絡調查顯示SSD廠商聲稱,他們的設備的寫入IOPS比這個數(shù)值高出10倍以上,最高甚至可以達到72倍,而讀IOPS則可以超過200倍。這能夠節(jié)省大量的磁盤驅動器、能耗、RAID控制器、磁盤trays和連接。
但是固態(tài)驅動器卻存在著一些可靠性方面的問題,如果你希望將它用在貴公司的企業(yè)存儲環(huán)境之中的話,你就需要認真考慮這些問題。
寫入限制和損耗均衡
網(wǎng)上現(xiàn)在有大量關于閃存和損耗均衡的信息。只要進行一次簡單的搜索就能夠查到主流廠商的文件(晟碟(SanDisk)、東芝(Toshiba)以及其他廠商)。重要的是要理解閃存單元即使使用了最新的閃存零件,也只能被寫入100000次左右。在100000次之后,閃存開始出現(xiàn)錯誤,故障率將和硬盤驅動器的硬件故障率差不多。損耗均衡的作用就是根據(jù)損耗限制輪換使用塊。
讓我們假設你有一個32GB閃存SSD,它使用的是SATA接口。例如,如果你以100MB/秒的速度對同一位置進行寫入,最高寫入次數(shù)限制為100000次的話,那么這個1MB大小的空間將在1000秒后達到使用極限。顯然這是無法接受的,而且也不太可能出現(xiàn)這樣的情況。損耗均衡的任務是輪流使用塊,這樣你就不會反復寫入同一位置。你的32GB SSD可能是40GB SSD,其中包含了32GB用戶可用數(shù)據(jù)。剩余8GB的空間是由SSD接口動態(tài)管理的,以分配不同位置的塊,避免你總是向同一位置寫入數(shù)據(jù)。這就是損耗均衡的含義,那么問題就變成了損耗均衡是否能夠解決你遇到的所有問題?
比如,我決定使用Mtron。這是一家南韓的公司,該公司生產(chǎn)高性能SSD。Tom的硬件對它進行了一次非常好的檢驗。點擊這一鏈接你可以在Mtron的網(wǎng)站上找到更多詳細信息。我從中提取了一些相關的信息:
需要注意的是,Mtron提供的信息和其他廠商一樣多,甚至可能更多,Mtron提供的這些信息和其他廠商提供的信息非常相似。如同前面所提到的,Mtron 32 GB SSD的最高寫性能為80MB/秒。Mtron可以用很小的塊實現(xiàn)這一點,比如說小于128KB的塊。不過,最有趣的性能指標應當是該產(chǎn)品的寫入持久性為140年。這個時間是根據(jù)每天進行50GB連續(xù)寫入的情況計算出的。我相信這意味著在同一個塊地址上連續(xù)寫入50GB的數(shù)據(jù)。每天寫入50GB的數(shù)據(jù)平均計算起來就是一整天的時間里都以0.59MB/秒的速度寫入數(shù)據(jù)。
我個人并不認為這樣的寫入速度對于寫操作密集的環(huán)境來說有多大,比如對于文件系統(tǒng)元數(shù)據(jù)或者正在重新編制索引的大型數(shù)據(jù)庫。如果SAS 15K 2.5英寸驅動器可以在512字節(jié)隨意I/O的情況下實現(xiàn)250 IOPS,也就是每秒128000字節(jié)的I/O,剛剛超過SSD寫預算的20%。這和廠商所宣傳的10倍或72倍的使用數(shù)據(jù)相去甚遠,但是SSD的反應時間自然是優(yōu)秀不少。在我看來,Mtron宣稱的寫預算毫無用處。讓我們考慮一下最高性能——128K I/O,然后重新計算一下更合理的寫預算期望值。Tom的硬件文章表示,轉換率最低為73.8 MB/秒,平均為74.2MB/秒,最高為76.5MB/秒,這一速度和其他的閃存設備或者SATA硬件驅動器的最低和平均性能相比而言可以算是非??炝?。在我看來,最大值和平均值之間的差距簡直好到難以置信。 #p#page_title#e#
如果你按照50 GB x 365天 x 140年來計算寫成本,或者根據(jù)Mtron提供的信息,按照2555000GB進行計算的話,用最低性能值計算出來的時間僅僅為410.3天(2555000 x 1024= MB/(73.8 x 3600秒/小時x 24小時/天)= 410.3天)。使用最大值76.5 MB/秒來計算的話,得到的結果也剛剛超過一年,也就是395.8天。當然,這遠遠小于140年,但是必須考慮到很少有應用會一直以這樣的速度進行寫操作。我認為對于寫密集的環(huán)境來說,4-5年的使用期是比較合理的值??紤]到絕大部分RAID系統(tǒng)的生命周期,很多站點不會將磁盤驅動器使用超過5年的時間,因為性能和密度在這段時間中會發(fā)生巨大的變化。所以如果Mtron提供的數(shù)據(jù)是正確的話,那么該設備對于有大量處理數(shù)據(jù)的環(huán)境來說非常有用。
SMART問題
SMART(自我監(jiān)控、分析和報告技術,Self-Monitoring, Analysis, and Reporting Technology)是磁盤驅動器制造商都支持的一種標準。今天,我發(fā)現(xiàn)一些閃存制造商也開始支持SMART監(jiān)控標準了,但是因為SMART是一個針對磁盤驅動器開發(fā)出來的標準,閃存中可能出現(xiàn)的一些錯誤情況也許無法在SMART框架中覆蓋。而且在同RAID設備集成的時候,需要進行前瞻性的故障分析以確保高可靠性,那么RAID廠商就必須將閃存廠商的SMART集成到他們的監(jiān)控和管理架構之中。
我相信這很可能會是個比較大的問題,因為目前針對閃存的SMART統(tǒng)計還沒有標準。SMART和閃存的整個領域需要在未來的幾年中攜手解決這個問題,但是我懷疑除非大公司進入SSD閃存設備市場,否則這個問題就難以得到解決。只有當大公司進入了這個市場之后,才會有人愿意承擔開發(fā)標準的費用、時間和工作。未來可能出現(xiàn)的一種情況是RAID廠商們面對前瞻性故障分析的需求,團結在一起強迫SSD廠商們創(chuàng)建一個標準。我認為這是確保SSD閃存設備在企業(yè)環(huán)境中的可靠性和可用性的一個關鍵問題,亟待解決。
我相信SSD閃存設備未來會成為我們存儲層級中的一部分。它們非常小而且非常昂貴,因此難以解決所有的問題。我認為,它的增長路徑和成本路徑和傳統(tǒng)旋轉式存儲(磁盤)也并無太多不同。是的,閃存設備的密度正在提高,但磁盤也是如此,不過也許在目前兩者提高的速度不同而已,但是從我通過閱讀了解到的情況看,增長路徑將變得平穩(wěn)。無論如何,SSD閃存將在我們的未來中占據(jù)一席之地,但是早期用戶必須慎重考慮上面提到的問題和各種局限。損耗均衡和監(jiān)控對于SSD閃存設備的可靠性至關重要,我不確信現(xiàn)在這些問題是否都得到妥善處理了。