圖 1) 一個未更改的相同文件在四周內(nèi)的完整備份。如果沒有做重復數(shù)據(jù)刪除,同一文件會有四個分散的副本。通過重復數(shù)據(jù)刪除,您只會擁有一個副本。這樣可獲得大量的空間節(jié)省,但同時這個唯一副本的可靠保存也變得更為關(guān)鍵。

市場上重復數(shù)據(jù)刪除方面的產(chǎn)品多種多樣。有些只有軟件并可能用到多種基礎(chǔ)硬件;有些包括軟硬件(通過許可或 OEM 協(xié)議,從多種來源獲得)。在做出決定之前,您應評估軟件成熟度、基礎(chǔ)硬件的可靠性以及兩者的集成情況。

NetApp 可靠性

憑借 NetApp® 存儲,重復數(shù)據(jù)刪除已是 Data ONTAP® 運行環(huán)境中不可或缺的一部分,貫穿整個產(chǎn)品系列。15 年來,Data ONTAP 隨著 NetApp 硬件平臺一直在不斷發(fā)展。NetApp WAFL® 技術(shù)的獨特功能確實簡化了重復數(shù)據(jù)刪除的實施,它可以刪除任何存儲數(shù)據(jù)(而不僅是備份數(shù)據(jù))中的重復數(shù)據(jù)。

根據(jù) NetApp 安裝信息庫的測量表明,公認的 NetApp 軟硬件特有的高可靠性使數(shù)據(jù)可用性高達 99.999%。最近一份分析報告描述了 NatApp 的方法以及影響 NatApp 可靠性的許多功能。

我們非常重視細節(jié),眾所周之,隨著時間推移,磁盤驅(qū)動器位錯誤會形成,這甚至也會在磁盤驅(qū)動器的制造過程中出現(xiàn)。每個驅(qū)動器都有內(nèi)置的糾錯機制來檢測此類位錯誤,并通常會予以糾正。如果一連串過多的錯誤令 ECC 無法處理,驅(qū)動器就會報告此扇區(qū)不可讀,此時 RAID 算法將根據(jù)其他扇區(qū)中存儲的信息修復該錯誤。然而,NetApp 還采用校驗和方案進一步保護,我們將驅(qū)動器的額外部分作為開銷來存儲在整個系統(tǒng)中隨數(shù)據(jù)移動的校驗和,以檢查寫入的數(shù)據(jù)是否能在數(shù)據(jù)恢復過程中完整返回。實質(zhì)上,我們還提供第三層保護。

為了保護提交到磁盤的數(shù)據(jù)的可靠性,NetApp 還開發(fā)了高性能的 RAID-DPTM,這是一個具有雙奇偶校驗的 RAID 6 實施,可以在不犧牲寫入性能的情況防范雙磁盤故障。有關(guān)防范磁盤驅(qū)動器誤操作的 RAID-DP 和 NetApp 增強功能的更多信息,請參閱上一篇 Tech OnTap 文章。

結(jié)論

為了保護備份的數(shù)據(jù),重復數(shù)據(jù)刪除技術(shù)必須使用合適的算法來避免廢棄唯一的數(shù)據(jù)塊,同時還應提供可靠的基礎(chǔ)軟硬件,以便安全地存儲經(jīng)過重復數(shù)據(jù)刪除處理的數(shù)據(jù),用于以后的恢復。

由于 NetApp 重復數(shù)據(jù)刪除技術(shù)不僅用于主數(shù)據(jù)存儲,而且還用于備份數(shù)據(jù),因此我們格外注意確保數(shù)據(jù)的可靠性。NetApp 重復數(shù)據(jù)刪除技術(shù)結(jié)合使用指紋和數(shù)據(jù)塊逐個字節(jié)的比較,從而絕不會由于哈希沖突而誤刪任何唯一的數(shù)據(jù)塊。經(jīng)過重復數(shù)據(jù)刪除處理的數(shù)據(jù)存儲在 NetApp 存儲系統(tǒng)中,多年的實踐證明該系統(tǒng)采用的硬件和軟件不僅可靠而且富有彈性。因此我們相信您一定能在恢復數(shù)據(jù)時取回已備份的數(shù)據(jù)。

分享到

lixuyang

相關(guān)推薦