備份與歸檔:為什么知道差異很重要
數(shù)據(jù)的備份和歸檔具有不同的功能,很多人沒有認(rèn)識(shí)到兩者之間的差異,這可能導(dǎo)致訪問問題,甚至法律問題。而對(duì)于備份人員來說,備份和歸檔之間的差別非常明顯,很容易理解。
什么是備份?
備份是為了在損壞或丟失的情況下恢復(fù)所述數(shù)據(jù)而創(chuàng)建的數(shù)據(jù)副本。在備份完成后,不會(huì)刪除原始數(shù)據(jù)。
備份的例子包括筆記本電腦或臺(tái)式機(jī)上所有文件的每次備份,或者iPhone上的所有照片都會(huì)被復(fù)制到iCloud,以防數(shù)據(jù)隨著手機(jī)丟失而丟失。人們還將備份文件服務(wù)器(非結(jié)構(gòu)化數(shù)據(jù))和數(shù)據(jù)庫(結(jié)構(gòu)化數(shù)據(jù))。備份可能會(huì)更加關(guān)注數(shù)據(jù),如數(shù)據(jù)庫轉(zhuǎn)儲(chǔ)、服務(wù)器的操作系統(tǒng)、裸機(jī)備份,或兩者都支持VMware 的VMDK文件的備份。
備份的定義實(shí)際上歸結(jié)為目的,備份的目的始終是相同的:如果發(fā)生某些事情,則恢復(fù)數(shù)據(jù)。例如,RAID 6存儲(chǔ)陣列的三個(gè)磁盤可能存在故障,并且需要還原其所有數(shù)據(jù)。有人可能會(huì)意外或惡意刪除VMware、Hyper-V或AWS EC2配置中的一個(gè)或多個(gè)虛擬機(jī),并且需要還原它們。人們可能有一天會(huì)意識(shí)到組織中的每個(gè)文件都已被勒索軟件包加密。如果沒有良好的備份系統(tǒng),其最終的選擇只能是支付贖金。而有了良好的備份系統(tǒng),則可以找到勒索軟件所勒索的數(shù)據(jù),然后恢復(fù)所有數(shù)據(jù),而無需支付黑客勒索費(fèi)用。
什么是歸檔?
歸檔是為參考目的而創(chuàng)建的數(shù)據(jù)副本。雖然不是必需的,但在進(jìn)行歸檔后通常會(huì)刪除原件。
如果備份的目的是將某些數(shù)據(jù)恢復(fù)到平時(shí)的樣子,那么歸檔可以用于多種目的。最常見的目的是幫助人們找到很久以前的一些數(shù)據(jù)。它可能是單個(gè)文件,其中包含一個(gè)非常重要的項(xiàng)目,例如幾年前客戶簽署的合同。它可能是一組相關(guān)的數(shù)據(jù),例如某個(gè)建筑物的所有結(jié)構(gòu)圖?;蛘咚赡苁瞧髽I(yè)過去制作的都已經(jīng)過時(shí)的所有CAD圖紙。
另一個(gè)相關(guān)數(shù)據(jù)集可能是可以證明給定點(diǎn)的所有電子郵件和/或文件。也許一名員工被解雇了,這是因?yàn)楣菊J(rèn)為他實(shí)施了沒有許可的行為,然后。企業(yè)的訴訟可能會(huì)發(fā)出一個(gè)電子發(fā)現(xiàn)請(qǐng)求,要求所有發(fā)送給他們的電子郵件,其中非工作時(shí)間或他們將要兼職的公司名稱。其他人可能正試圖證明其工作狀態(tài),并希望查看來自特定管理人員的所有電子郵件,這些管理人員的電子郵件將會(huì)列出。
歸檔可以幫助人們完成所有這些任務(wù)。某人可能擁有企業(yè)所提供的每個(gè)銷售訂單、報(bào)價(jià)或合同的歸檔??梢栽诰€保留當(dāng)前的合同和訂單,但是將所有這些合同和訂單保存在歸檔中,歸檔應(yīng)該有一個(gè)索引,允許通過這些訂單的內(nèi)容檢索訂單和合同?;蛘吣橙艘部赡軗碛泄景l(fā)送或接收的每封電子郵件的歸檔。
某些電子郵件歸檔系統(tǒng)可以從電子郵件服務(wù)器中清除已存檔的電子郵件,這些電子郵件可以通過超過一定大小,或在n天內(nèi)未被訪問等條件進(jìn)行消除。這有助于保持電子郵件系統(tǒng)的精簡,節(jié)省計(jì)算和存儲(chǔ)資源,并使備份工作更容易。如果法律不要求人們保留所有電子郵件,那么這甚至可能是歸檔的目的。
恢復(fù)與檢索
即使歸檔的目的是節(jié)省主存儲(chǔ)空間,它也需要能夠執(zhí)行檢索而不是恢復(fù)(如果要將其稱為存檔)。備份系統(tǒng)還原和歸檔系統(tǒng)檢索。
還原時(shí),它通常是單個(gè)文件、服務(wù)器或數(shù)據(jù)庫。當(dāng)人們檢索某些內(nèi)容時(shí),它通常是相關(guān)數(shù)據(jù)的集合,可能存儲(chǔ)也可能不存儲(chǔ)在同一服務(wù)器上,甚至可能存儲(chǔ)在相同的格式中。還可以對(duì)單個(gè)時(shí)間點(diǎn)執(zhí)行還原,例如將數(shù)據(jù)庫還原到某天的樣子。檢索使用一段時(shí)間的數(shù)據(jù),例如過去三年的所有電子郵件。
數(shù)據(jù)恢復(fù)需要人們了解文件或數(shù)據(jù)備份時(shí)的大部分內(nèi)容,否則很難找到它。人們需要知道它所在的服務(wù)器的名稱,它所在的數(shù)據(jù)庫或目錄,要返回的文件或表的名稱,以及上次查看的日期。檢索不需要這些信息,人們只需要知道所有與一組參數(shù)匹配的文件或記錄。例如提供過去三年中創(chuàng)建的包含特定短語或由特定人員創(chuàng)作的所有文件或電子郵件。
差異為何重要
許多人嘗試將他們的備份系統(tǒng)用作歸檔系統(tǒng),這意味著他們將備份保存多年,甚至永遠(yuǎn)。在***次獲得真正的檢索請(qǐng)求時(shí),人們會(huì)發(fā)現(xiàn)從執(zhí)行恢復(fù)的操作中執(zhí)行檢索是多么困難。這將使檢索花費(fèi)更多、更長的時(shí)間,可能是幾個(gè)月而不是幾分鐘,并且花費(fèi)更多的成本,甚至高達(dá)數(shù)百萬美元。
如果檢索是針對(duì)來自訴訟的電子發(fā)現(xiàn)請(qǐng)求,并且無法及時(shí)滿足,那么可能會(huì)有法院發(fā)出不利推理指令的風(fēng)險(xiǎn)。人們花費(fèi)六個(gè)月的時(shí)間來滿足他們所知道的簡單要求,而卻遠(yuǎn)遠(yuǎn)沒有完成。法官推斷其試圖隱瞞什么。比較聞名的例子是摩根士丹利的訴訟案例,他們在這種情況下?lián)p失了數(shù)十億美元。
因此,不要將備份用作歸檔。如果人們有著長期存儲(chǔ)需求,請(qǐng)采用一個(gè)實(shí)際的歸檔系統(tǒng)。這將有一個(gè)前期成本,但從長遠(yuǎn)來看它將是值得的。