數(shù)據(jù)備份 目前存儲管理中最重要的操作
對于許多企業(yè)的IT網(wǎng)管來說,數(shù)據(jù)的備份/恢復(fù)仍是目前存儲管理中最令人頭疼的操作。每天,接近三分之二的時間與精力用于應(yīng)付失敗的備份操作和解決磁帶及其他媒介的錯誤。讓我們來回顧一下備份/恢復(fù)發(fā)展的歷史,也許會對解決IT管理員們的這一煩惱有所幫助。
上世紀(jì)70年代,IT革命處于萌芽階段。那時的數(shù)據(jù)量很小,通常只有幾十兆到幾百兆。當(dāng)時的硬盤成本更是接近天價,每兆硬盤空間的售價超過了3000美元,購買一個容量小于10兆的硬盤所需的費用,甚至超過了一個系統(tǒng)程序員全年的工資。另一方面,基于硬盤的存儲技術(shù)卻還剛剛起步?;谏鲜鲈?,當(dāng)初進行備份/恢復(fù)操作時,往往采用磁帶作為備份介質(zhì)。
基于磁帶的“備份/恢復(fù)”面臨的問題
進入21世紀(jì)的海量數(shù)據(jù)時代,與30年前相比,數(shù)據(jù)量已經(jīng)從幾十、幾百兆增長至幾千TB;而且由于數(shù)據(jù)備份和恢復(fù)操作幾乎是貫穿全年的例行工作(Routine Job),如果現(xiàn)在仍然以磁帶作為最基本的備份介質(zhì),不僅會耗費管理員大量的時間和精力,同時也會產(chǎn)生諸多問題。主要表現(xiàn)在以下幾方面:
工作量巨大
數(shù)據(jù)備份和恢復(fù)操作貫穿全年365天
備份/恢復(fù)的工作量占整個存儲管理的60%-70%
數(shù)據(jù)很難有效恢復(fù)
由于備份窗口或介質(zhì)失效等原因,備份作業(yè)的成功率只有70%左右
恢復(fù)時間太長,從磁帶中恢復(fù)單個文件往往要花費幾個小時甚至1天
本質(zhì)上是一項“體力活”
磁帶庫內(nèi)磁帶的循環(huán)更新,將磁帶拿進取出,不可避免仍需要大量人工干預(yù)
進行離場保護時,大量磁帶在數(shù)據(jù)中心和異地之間的來回運輸,需要耗費大量的人力
“一體化數(shù)據(jù)保護”是解決問題的最佳途徑
好在時至今日,隨著數(shù)據(jù)量的成倍增長,計算機技術(shù)也有了突飛猛進。硬件尤其是硬盤的價格與早期相比有了大幅下降,不斷刷新的硬盤容量也令人驚喜?;诖疟P的存儲新技術(shù)(如快照、鏡象等)日益涌現(xiàn)。調(diào)查顯示,目前超過80%的恢復(fù)請求是在數(shù)據(jù)丟失后48小時內(nèi)提出的,這意味著恢復(fù)速度更快的基于磁盤的存儲技術(shù)開始成為主流。而由于磁帶在某些方面仍具有不可取代的優(yōu)勢,如價格低廉、適合數(shù)據(jù)的長久保留等,因此采用以磁盤和磁帶技術(shù)相結(jié)合的所謂“一體化數(shù)據(jù)保護”方案,成為很多企業(yè)在進行數(shù)據(jù)保護時的最佳做法。實施步驟見下圖:
下面,我們對上圖中的每一模塊進行詳細(xì)解釋。
本地鏡象(快速恢復(fù)卷):
在某一時間點,對生產(chǎn)數(shù)據(jù)進行同步,然后斷開,以保留生產(chǎn)數(shù)據(jù)在該時間點的靜止?fàn)顟B(tài)
用于對保留期內(nèi)整個數(shù)據(jù)的快速恢復(fù)
一天可做一次或若干次本地快速恢復(fù)卷,保留24小時
磁盤消耗量高(100%)
對應(yīng)用影響較大
數(shù)據(jù)快照:
采用Copy-on-Write的方法保留與前一基準(zhǔn)點相比已變化的數(shù)據(jù)
基準(zhǔn)點數(shù)據(jù)出現(xiàn)問題就無法使用
用于保留期內(nèi)對少量數(shù)據(jù)的快速恢復(fù)
使用頻率較高, 例如:每2小時快照一次,常保留24—48小時
磁盤消耗量較低(5%-20%)
對應(yīng)用影響較小
異地鏡象:
對生產(chǎn)數(shù)據(jù)的100%異地鏡像
對由于邏輯錯誤而丟失的數(shù)據(jù)沒有保護作用
常用于對生產(chǎn)站點的容災(zāi)保護
采用連續(xù)復(fù)制以保持與生產(chǎn)數(shù)據(jù)一致
同步復(fù)制方式
異步復(fù)制方式
近線存儲:
用于對生產(chǎn)數(shù)據(jù)進行備份
常采用廉價的ATA/SATA磁盤陣列作為備份設(shè)備,以提高速度和可靠性
通常數(shù)據(jù)保留時間為1周-1個月,然后,被遷至磁帶庫作更長時間的保留或歸檔
磁帶庫:
磁帶是數(shù)據(jù)長久保留/歸檔的最佳選擇
磁帶上的數(shù)據(jù)往往被視為數(shù)據(jù)保護的最后防線
由于磁帶可以在物理上與生產(chǎn)系統(tǒng)脫離,磁帶可以用于數(shù)據(jù)離場保護
磁帶存儲成本仍然是最低的
某世界著名的大型石油公司的“一體化數(shù)據(jù)保護”做法就很值得借鑒:每天上午8點,對重要的SAP數(shù)據(jù)做一次“克隆”,產(chǎn)生本地鏡象;之后每隔4小時對數(shù)據(jù)變化量進行快照,每個快照保留48小時。每天晚上12點,將快照中的數(shù)據(jù)備份到近線存儲設(shè)備,保留兩周。兩周后,將數(shù)據(jù)拷貝到磁帶庫中保留一年。磁帶庫中的數(shù)據(jù)同時復(fù)制有多個副本,其中一個數(shù)據(jù)副本作離場保護,妥善保管到異地的倉庫或辦公室。與此同時,這些數(shù)據(jù)也采用復(fù)制的方式產(chǎn)生異地鏡象,以實現(xiàn)容災(zāi)保護。 #p#page_title#e#
可想而知,在上述“一體化數(shù)據(jù)保護”措施的周密保全下,該公司面對各種情況下的數(shù)據(jù)丟失都能從容應(yīng)對:若需要恢復(fù)48小時內(nèi)丟失的數(shù)據(jù),可從本地鏡象和快照中恢復(fù);若需恢復(fù)兩周內(nèi)遺失的數(shù)據(jù),可從近線存儲設(shè)備中恢復(fù);而兩周以后的數(shù)據(jù)則可以從磁帶庫中進行恢復(fù);萬一發(fā)生了火災(zāi)或類似“9.11”之類的大型災(zāi)難,也不必驚慌失措,則可以切換到容災(zāi)點(異地鏡象),也可以從離場保護的磁帶副本中恢復(fù)所有數(shù)據(jù)。
CommVault能幫助客戶更好地實現(xiàn)“一體化數(shù)據(jù)保護”
上面提到的例子生動地展示了“一體化數(shù)據(jù)保護”的顯著優(yōu)勢。然而真正實施起來卻是非常困難的。原因在于,上面提到的所謂數(shù)據(jù)復(fù)制(異地鏡象)、數(shù)據(jù)克隆、數(shù)據(jù)快照等技術(shù)都依賴于磁盤硬件,所以不同的廠商就會有不同的實現(xiàn)方式,使得用戶使用起來非常困難——要求IT管理員必須同時掌握多種管理軟件,在不同的操作界面中來回切換,而且需要大量的手工操作(比如編寫腳本)來實現(xiàn)多種技術(shù)的協(xié)同工作,因此不僅大大增加了使用成本,同時也非常容易出錯。
美國慷孚系統(tǒng)公司(CommVault Systems Inc.)一直以來致力于研究如何有效地進行數(shù)據(jù)管理,它的“統(tǒng)一數(shù)據(jù)管理”平臺為真正實現(xiàn)“一體化數(shù)據(jù)保護”提供了有效的解決方案。通過CommVault的“統(tǒng)一數(shù)據(jù)管理”平臺,在一個單一的圖形化管理界面中,用戶只需要針對所需要的各種數(shù)據(jù)副本,包括本地鏡象、數(shù)據(jù)快照、異地鏡象、數(shù)據(jù)備份等制定相應(yīng)的策略(如存放在什么設(shè)備上、保留多久、何時存放等),CommVault的軟件會自動地協(xié)調(diào)相應(yīng)的硬件設(shè)備進行工作,真正實現(xiàn)完美的“一體化數(shù)據(jù)保護”。