災(zāi)備計(jì)劃—你的數(shù)據(jù)中心準(zhǔn)備好了嗎
人類(lèi)最不可抗拒的就是大自然的力量,臺(tái)風(fēng)、海嘯、泥石流、地震、火災(zāi)等,當(dāng)他們中的隨便一個(gè)發(fā)生時(shí),都不是我們能夠承受的,當(dāng)然還包括一些突發(fā)的意外事件,如爆炸。這是近期發(fā)生的一件大事,但是在這里我不想多說(shuō),愿逝者長(zhǎng)已。在這里主要想提到的是如何在災(zāi)后保全數(shù)據(jù)中心,因?yàn)槊看螢?zāi)難過(guò)后的數(shù)據(jù)中心多少都會(huì)留下遺憾。
數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),是企業(yè)業(yè)務(wù)系統(tǒng)與數(shù)據(jù)資源的有機(jī)組合,它的作用不可小覷!一旦災(zāi)害發(fā)生時(shí),我們的數(shù)據(jù)被迫中斷,那么數(shù)據(jù)的丟失幾乎是不可避免的,損失也將大到無(wú)法預(yù)估。
回顧往昔,發(fā)現(xiàn)類(lèi)似的事件還真是不少:
2008年3月,美國(guó),火災(zāi)
結(jié)果: 威斯康辛的數(shù)據(jù)中心遭遇大火燒毀75臺(tái)服務(wù)器、路由器和交換機(jī)等設(shè)備,引發(fā)大量站點(diǎn)癱瘓,歷時(shí)10天得以修復(fù)。
2009年9月,土耳其,洪水
結(jié)果:伊斯坦布爾遭遇的暴雨,進(jìn)而引發(fā)洪水,Vodafone數(shù)據(jù)中心遭殃,大量手機(jī)用戶(hù)因該數(shù)據(jù)中心被淹而無(wú)法使用通信服務(wù)。
2010年,澳大利亞,暴雨
結(jié)果: Datacom主機(jī)代管中心的天花板被暴雨沖毀,服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)備都遭損壞。
2011年3月,日本,地震
結(jié)果: 日本8.9級(jí)大地震,引發(fā)的海嘯影響了日本東北部沿岸地區(qū)。許多公司在那一帶建設(shè)的數(shù)據(jù)中心受到了破壞。
2012年10月,美國(guó),颶風(fēng)
結(jié)果:颶風(fēng)桑迪襲擊美國(guó)東海岸,支持著當(dāng)?shù)毓I(yè)園運(yùn)轉(zhuǎn)的數(shù)據(jù)中心在颶風(fēng)中因斷電而癱瘓,造成了巨大損失。
2013年1月,加拿大,故障
結(jié)果:TSS的一個(gè)數(shù)據(jù)中心故障崩潰,導(dǎo)致Visa卡暫停服務(wù),促使加拿大人民無(wú)法進(jìn)行網(wǎng)絡(luò)交易,給當(dāng)?shù)亟鹑跇I(yè)帶來(lái)了巨大損失。
2014年5月,美國(guó),爆炸
結(jié)果: 美國(guó)德克薩斯州的一家名為T(mén)hePlanet H1的數(shù)據(jù)中心,電力短路引發(fā)爆炸,一舉停擺9000臺(tái)服務(wù)器
2015年,天津,事件
……
如果有組織,提前計(jì)劃,及時(shí)關(guān)閉數(shù)據(jù)中心設(shè)施,結(jié)果肯定是令人欣慰的,但是面臨突發(fā)狀況時(shí),根本來(lái)不及多想的情況下,一套具備可操作性的關(guān)閉計(jì)劃就顯得尤為重要了。
現(xiàn)在,自然災(zāi)害的發(fā)生越來(lái)越頻繁,而且破壞性越來(lái)越強(qiáng),突然事件也是接二連三,因此,災(zāi)備中心的建設(shè)是十分重要的。今年1月10日,由華為、北京郵電大學(xué)、中治研國(guó)際信息技術(shù)研究院和中國(guó)郵政存儲(chǔ)集團(tuán)聯(lián)合發(fā)起的 “災(zāi)備技術(shù)產(chǎn)業(yè)聯(lián)盟”在北京的成立,也預(yù)示著政府、行業(yè)、企業(yè)都已經(jīng)認(rèn)識(shí)了災(zāi)備的重要性,以及災(zāi)備的價(jià)值。
那么關(guān)于災(zāi)備有什么技術(shù)手段得以實(shí)施呢?
目前數(shù)據(jù)中心整體災(zāi)備技術(shù)可以分為以下五種:冷備、暖備、熱備和雙活、多活。
但是隨著發(fā)展,冷備技術(shù),已經(jīng)越來(lái)越無(wú)法適應(yīng)數(shù)據(jù)中心高要求的發(fā)展,逐漸成為一種淘汰的技術(shù)方式,而暖備技術(shù)工作效果也不是很理想,因?yàn)樗鞘止し绞竭\(yùn)作,需要人員24小時(shí)值守,熱備技術(shù)相比暖備是實(shí)現(xiàn)了整體自動(dòng)切換,但是比起雙活技術(shù)來(lái)說(shuō)還是遜色一籌。雙活技術(shù)可以實(shí)現(xiàn)主備數(shù)據(jù)中心均對(duì)外提供服務(wù),正常工作時(shí)兩個(gè)數(shù)據(jù)中心的業(yè)務(wù)可根據(jù)權(quán)重負(fù)載分擔(dān),沒(méi)有主備之分,當(dāng)一個(gè)數(shù)據(jù)中心出現(xiàn)故障時(shí),另一個(gè)數(shù)據(jù)中心將承擔(dān)所有業(yè)務(wù)。而多活技術(shù)的***特點(diǎn)是業(yè)務(wù)在多個(gè)數(shù)據(jù)中心上同時(shí)運(yùn)行,當(dāng)一個(gè)或多個(gè)數(shù)據(jù)中心故障時(shí),其他數(shù)據(jù)中心將自動(dòng)接管所有應(yīng)用業(yè)務(wù),在具體實(shí)現(xiàn)上,多活技術(shù)部署了很多檢測(cè)故障的方式,如:ICMP Monitor、TCP Monitor、HTTP Monitor、FTP Monitor,還可以實(shí)時(shí)檢測(cè)服務(wù)器的運(yùn)行狀態(tài)、服務(wù)器負(fù)載均衡情況等,其***特點(diǎn)即是不會(huì)造成數(shù)據(jù)中心的資源浪費(fèi),顯然多活比雙活可靠性更高,但投入成本也會(huì)相應(yīng)變高,實(shí)現(xiàn)技術(shù)也更為復(fù)雜。但是,現(xiàn)在在金融行業(yè)、互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)中心更多愿意采用的還是多活技術(shù),因?yàn)榉€(wěn)定性是最重要的。
進(jìn)入云計(jì)算時(shí)代,災(zāi)備與云服務(wù)相結(jié)合也是一條值得探索的新路。新崛起的國(guó)內(nèi)災(zāi)備廠(chǎng)商英方軟件剛剛發(fā)布了英方云,其產(chǎn)品特色包括:字節(jié)級(jí)數(shù)捕獲,實(shí)時(shí)復(fù)制,連續(xù)數(shù)據(jù)保護(hù),幫助用戶(hù)恢復(fù)歷史數(shù)據(jù),加密/壓縮傳輸,確保數(shù)據(jù)安全等,在災(zāi)備云服務(wù)方面也是一個(gè)有益的嘗試。
當(dāng)然數(shù)據(jù)中心的選址也是很重要的,遠(yuǎn)離危險(xiǎn)區(qū)域很必要(地震帶、港口、機(jī)場(chǎng)、易燃易爆區(qū)等),大自然不可抗,突發(fā)事件不可避免,那么我們能做到的就是防患于未然,全面部署,以積極應(yīng)對(duì)災(zāi)害給我們帶來(lái)的損失,災(zāi)備計(jì)劃~你的數(shù)據(jù)中心準(zhǔn)備好了嗎?