云和虛擬化技術興起下的IT容災策略
服務器虛擬化和云計算技術的興起并不意味著我們不再需要良好的IT容災規(guī)劃,以及這些規(guī)劃中可能使用到的磁帶技術。以下是Jon Toigo在其Storage Decisions會議的主題發(fā)言中所提及的部分容災技巧。
作為Toigo Partners International的執(zhí)行總裁和管理合作伙伴,Toigo認為新技術和預算的削減不應當成為IT管理者降低對容災關注的理由,容災必須優(yōu)先獲得關注。
“這其中***的干擾聲音來自服務器虛擬化和Hypervisor管理程序的供應商,”Toigo在其IT災難恢復規(guī)劃的演說中提到,“這些供應商正盡量讓你覺得你可以不再需要災難恢復系統(tǒng)了”。Toigo同時反駁磁帶已經(jīng)是落后技術的說法,他認為磁帶是IT災難恢復規(guī)劃中必不可少的部分。“磁帶消亡的說法簡直就是胡說八道,”Toigo說。他表示磁盤容易損壞或出現(xiàn)故障,我們仍需要磁帶來保存數(shù)據(jù)。
Toigo給出的一些建議可以有效地保護數(shù)據(jù),并使得你的容災系統(tǒng)走上正軌。他提出的***項建議就是先進行完整的備份。Toigo說,你或許會很驚訝地發(fā)現(xiàn)有那么多企業(yè)沒有完整和及時的備份,其中主要原因就是由于預算的削減和工作負荷的增大。
“讓自己至少完成最基本的數(shù)據(jù)保護,”他提到。
他同時建議管理員應當更多的記錄宕機事件作為教訓。“通過觀察這些引起中斷的事件,你可以從中學習到如何更有效地運營存儲體系結構,以及在以后需要做什么來避免這些風險,”他補充道。
記錄下事件本身,起因以及導致的宕機時間和經(jīng)濟損失同樣可以幫助你建立一個基于事實的容災論證以進行管理。收集統(tǒng)計你公司自身的宕機事件較使用業(yè)內標準的統(tǒng)計數(shù)據(jù)更為有效。
他同時告知聽眾應當更認真地對待數(shù)據(jù)歸檔,將很少使用的數(shù)據(jù)從生產(chǎn)設備上下線,并將這些數(shù)據(jù)和日常數(shù)據(jù)的保護過程分開,比如復制備份。Toigo還希望參會者相信,當恢復應用時,所有的數(shù)據(jù)都將是必須的。
他使用微軟的Exchange作為一個例子,指出你不僅需要郵件數(shù)據(jù),還必須有設備驅動、郵箱配置以及活動目錄設置。“這項應用并不只是其數(shù)據(jù)的集合,”Toigo解釋道,“這些都是附加數(shù)據(jù)。你要恢復整個環(huán)境的話,就必須獲取所有數(shù)據(jù)。”
Toigo同時勸告其聽眾對其數(shù)據(jù)鏡像進行測試,以確保鏡像操作能夠正常進行,因為負責容災的人員或許很少能及時了解卷文件何時被移走或者應用何時被遷移或增加。“停止鏡像,并進行一致性檢查,這樣你會發(fā)現(xiàn)你希望鏡像的是否正確地被鏡像保護了,”他說,“最糟糕的是在發(fā)生災難時你才發(fā)現(xiàn)出了問題。”
其它的一些關于容災的建議包括:
• 使用存儲虛擬化來避免被某家存儲供應商鎖定,以及在存儲層進行本地和區(qū)域范圍內的中斷保護。
• 對主站點和復制站點進行三相檢查,因為城域網(wǎng)的延遲會影響交易以及數(shù)據(jù)庫數(shù)據(jù)的保護模式。
• 30天內的數(shù)據(jù)進行磁盤間的備份以快速回復用戶操作引起的災難,比如錯誤的文件刪除。
• 將你的小型容災站點用于測試,有些技術你可能沒有經(jīng)費在生產(chǎn)站點進行部署,但可以部署在測試站點。Toigo同時提到虛擬桌面以及IP電話等技術就可以這樣部署。