導(dǎo)讀:3000美元,購買一個容量小于10兆的硬盤所需的費(fèi)用,甚至超過了一個系統(tǒng)程序員全年的工資,
最令人頭疼的操作:數(shù)據(jù)備份與恢復(fù)
。另一方面,基于硬盤的存儲技術(shù)卻還剛剛起步;谏鲜鲈,當(dāng)初進(jìn)行備份/恢復(fù)操作時,往往采用磁帶作為備份介質(zhì)。 基于磁帶的"備份/恢復(fù)"面臨的問題 進(jìn)入21世紀(jì)的海量數(shù)據(jù)時代,與30年前相比,數(shù)據(jù)量已經(jīng)從幾十、幾百兆增長至幾千TB;而且由于數(shù)據(jù)備份和恢復(fù)操作幾乎是貫...正文:上世紀(jì)70年代,IT革命處于萌芽階段。那時的數(shù)據(jù)量很小,通常只有幾十兆到幾百兆。當(dāng)時的硬盤成本更是接近天價,每兆硬盤空間的售價超過了3000美元,購買一個容量小于10兆的硬盤所需的費(fèi)用,甚至超過了一個系統(tǒng)程序員全年的工資。另一方面,基于硬盤的存儲技術(shù)卻還剛剛起步;谏鲜鲈,當(dāng)初進(jìn)行備份/恢復(fù)操作時,往往采用磁帶作為備份介質(zhì)。
基于磁帶的"備份/恢復(fù)"面臨的問題
進(jìn)入21世紀(jì)的海量數(shù)據(jù)時代,與30年前相比,數(shù)據(jù)量已經(jīng)從幾十、幾百兆增長至幾千TB;而且由于數(shù)據(jù)備份和恢復(fù)操作幾乎是貫穿全年的例行工作(Routine Job),如果現(xiàn)在仍然以磁帶作為最基本的備份介質(zhì),不僅會耗費(fèi)管理員大量的時間和精力,同時也會產(chǎn)生諸多問題。主要表現(xiàn)在以下幾方面:
工作量巨大
數(shù)據(jù)備份和恢復(fù)操作貫穿全年365天
備份/恢復(fù)的工作量占整個存儲管理的60%-70%
數(shù)據(jù)很難有效恢復(fù)
由于備份窗口或介質(zhì)失效等原因,備份作業(yè)的成功率只有70%左右
恢復(fù)時間太長,從磁帶中恢復(fù)單個文件往往要花費(fèi)幾個小時甚至1天
本質(zhì)上是一項"體力活"
磁帶庫內(nèi)磁帶的循環(huán)更新,將磁帶拿進(jìn)取出,不可避免仍需要大量人工干預(yù)
進(jìn)行離場保護(hù)時,大量磁帶在數(shù)據(jù)中心和異地之間的來回運(yùn)輸,需要耗費(fèi)大量的人力
"一體化數(shù)據(jù)保護(hù)"是解決問題的最佳途徑
好在時至今日,隨著數(shù)據(jù)量的成倍增長,計算機(jī)技術(shù)也有了突飛猛進(jìn)。硬件尤其是硬盤的價格與早期相比有了大幅下降,不斷刷新的硬盤容量也令人驚喜。基于磁盤的存儲新技術(shù)(如快照、鏡象等)日益涌現(xiàn)。調(diào)查顯示,目前超過80%的恢復(fù)請求是在數(shù)據(jù)丟失后48小時內(nèi)提出的,這意味著恢復(fù)速度更快的基于磁盤的存儲技術(shù)開始成為主流。而由于磁帶在某些方面仍具有不可取代的優(yōu)勢,如價格低廉、適合數(shù)據(jù)的長久保留等,因此采用以磁盤和磁帶技術(shù)相結(jié)合的所謂"一體化數(shù)據(jù)保護(hù)"方案,成為很多企業(yè)在進(jìn)行數(shù)據(jù)保護(hù)時的最佳做法。
本地鏡象(快速恢復(fù)卷):
在某一時間點(diǎn),對生產(chǎn)數(shù)據(jù)進(jìn)行同步,然后斷開,以保留生產(chǎn)數(shù)據(jù)在該時間點(diǎn)的靜止?fàn)顟B(tài)
用于對保留期內(nèi)整個數(shù)據(jù)的快速恢復(fù)
一天可做一次或若干次本地快速恢復(fù)卷,保留24小時
磁盤消耗量高(100%)
對應(yīng)用影響較大
數(shù)據(jù)快照:
采用Copy-on-Write的方法保留與前一基準(zhǔn)點(diǎn)相比已變化的數(shù)據(jù)
基準(zhǔn)點(diǎn)數(shù)據(jù)出現(xiàn)問題就無法使用
用于保留期內(nèi)對少量數(shù)據(jù)的快速恢復(fù)
使用頻率較高, 例如:每2小時快照一次,常保留24-48小時
磁盤消耗量較低(5%-20%)
對應(yīng)用影響較小
異地鏡象:
對生產(chǎn)數(shù)據(jù)的100%異地鏡像
對由于邏輯錯誤而丟失的數(shù)據(jù)沒有保護(hù)作用
常用于對生產(chǎn)站點(diǎn)的容災(zāi)保護(hù)
采用連續(xù)復(fù)制以保持與生產(chǎn)數(shù)據(jù)一致
同步復(fù)制方式
異步復(fù)制方式
近線存儲:
用于對生產(chǎn)數(shù)據(jù)進(jìn)行備份
常采用廉價的ATA/SATA磁盤陣列作為備份設(shè)備,以提高速度和可靠性
通常數(shù)據(jù)保留時間為1周-1個月,然后,被遷至磁帶庫作更長時間的保留或歸檔
磁帶庫:
磁帶是數(shù)據(jù)長久保留/歸檔的最佳選擇
磁帶上的數(shù)據(jù)往往被視為數(shù)據(jù)保護(hù)的最后防線
由于磁帶可以在物理上與生產(chǎn)系統(tǒng)脫離,磁帶可以用于數(shù)據(jù)離場保護(hù)
磁帶存儲成本仍然是最低的
某世界著名的大型石油公司的"一體化數(shù)據(jù)保護(hù)"做法就很值得借鑒:每天上午8點(diǎn),對重要的SAP數(shù)據(jù)做一次"克隆",產(chǎn)生本地鏡象;之后每隔4小時對數(shù)據(jù)變化量進(jìn)行快照,每個快照保留48小時,
電腦資料
《最令人頭疼的操作:數(shù)據(jù)備份與恢復(fù)》(http://www.oriental01.com)。每天晚上12點(diǎn),將快照中的數(shù)據(jù)備份到近線存儲設(shè)備,保留兩周。兩周后,將數(shù)據(jù)拷貝到磁帶庫中保留一年。磁帶庫中的數(shù)據(jù)同時復(fù)制有多個副本,其中一個數(shù)據(jù)副本作離場保護(hù),妥善保管到異地的倉庫或辦公室。與此同時,這些數(shù)據(jù)也采用復(fù)制的方式產(chǎn)生異地鏡象,以實現(xiàn)容災(zāi)保護(hù)。可想而知,在上述"一體化數(shù)據(jù)保護(hù)"措施的周密保全下,該公司面對各種情況下的數(shù)據(jù)丟失都能從容應(yīng)對:若需要恢復(fù)48小時內(nèi)丟失的數(shù)據(jù),可從本地鏡象和快照中恢復(fù);若需恢復(fù)兩周內(nèi)遺失的數(shù)據(jù),可從近線存儲設(shè)備中恢復(fù);而兩周以后的數(shù)據(jù)則可以從磁帶庫中進(jìn)行恢復(fù);萬一發(fā)生了火災(zāi)或類似"9.11"之類的大型災(zāi)難,也不必驚慌失措,則可以切換到容災(zāi)點(diǎn)(異地鏡象),也可以從離場保護(hù)的磁帶副本中恢復(fù)所有數(shù)據(jù)。