應(yīng)對(duì)云服務(wù)中斷的五個(gè)技巧
亞馬遜***技術(shù)官Werner Vogels表示:“一切都可能出現(xiàn)故障。”
在去年四月,亞馬遜遭遇了一次為期四天的服務(wù)中斷,隨后在八月份又出現(xiàn)了一次中斷。今年二月,微軟公司的Windows Azure云平臺(tái)出現(xiàn)停機(jī)問(wèn)題。盡管云服務(wù)供應(yīng)商們都在努力改進(jìn)系統(tǒng)以***限度地減小云中斷的風(fēng)險(xiǎn),相信在2012年和以后,我們?nèi)匀粚⒉豢杀苊獾臅?huì)遭遇服務(wù)中斷。
專(zhuān)家表示企業(yè)IT部門(mén)應(yīng)該采取以下五個(gè)措施來(lái)盡量避免云服務(wù)中斷帶來(lái)的風(fēng)險(xiǎn):
1、使用多個(gè)可用區(qū)
亞馬遜在各個(gè)地區(qū)為其每個(gè)服務(wù)都提供可用區(qū)(AZ),該公司介紹說(shuō),可用區(qū)在不同的獨(dú)立的基礎(chǔ)設(shè)施上運(yùn)行,“它們實(shí)際上是分開(kāi)的,即使發(fā)生非常罕見(jiàn)的災(zāi)難,例如火災(zāi)、龍卷風(fēng)或者洪水,都只會(huì)影響單個(gè)可用區(qū)。”在去年亞馬遜的服務(wù)中斷中,僅使用單個(gè)可用區(qū)用于關(guān)系數(shù)據(jù)庫(kù)服務(wù)的客戶(hù)中,大約有45%受到了中斷的影響,而使用多個(gè)可用區(qū)的客戶(hù),只有不到3%受到影響。在去年的中斷事故后,該公司對(duì)可用區(qū)服務(wù)進(jìn)行了改善,允許在不同可用區(qū)間使用共同的設(shè)計(jì)和API,讓用戶(hù)可以更容易地使用多個(gè)可用區(qū)的方法。
2、選擇多個(gè)地區(qū)
亞馬遜擁有一個(gè)跨八個(gè)地區(qū)的網(wǎng)絡(luò),包括:美國(guó)東部(北弗吉尼亞州)、美國(guó)西部(俄勒岡州)、美國(guó)西部(北加州)、歐洲(愛(ài)爾蘭)、亞太地區(qū)(新加坡)、亞太地區(qū)(東京)、南非(圣保羅)和AWS GovCloud。除了采用多可用區(qū)的方法獲得額外的安全和保護(hù)外,用戶(hù)還可以將工作負(fù)載分布在多個(gè)地區(qū)。但是這并不像將工作負(fù)載分布在多個(gè)可用區(qū)一樣簡(jiǎn)單,因?yàn)椴煌牡貐^(qū)需要單獨(dú)的API調(diào)用。
3、選擇多個(gè)云服務(wù)供應(yīng)商
采用多可用區(qū)、多地區(qū)的方法,仍然覺(jué)得不夠安全?Gartner云分析師Drue Reeves建議說(shuō),還可以選擇多個(gè)云服務(wù)供應(yīng)商。但是需要注意的是,一些云服務(wù)供應(yīng)商共享相同的數(shù)據(jù)中心資源。Reeves表示,客戶(hù)可以檢查云供應(yīng)商是否與其他供應(yīng)商共享資源。
4、服務(wù)水平協(xié)議
除了采用這些技術(shù)措施外,用戶(hù)還可以利用非技術(shù)性的措施,例如與云服務(wù)供應(yīng)商協(xié)商有關(guān)服務(wù)水平協(xié)議(SLA)的問(wèn)題,如果出現(xiàn)服務(wù)中斷應(yīng)該支付多少罰款。如果用戶(hù)使用云服務(wù)供應(yīng)商用于災(zāi)難恢復(fù)服務(wù),服務(wù)水平協(xié)議還可以強(qiáng)制要求高達(dá)99.999%的可用性。
5、考慮是否應(yīng)該使用云服務(wù)
如果用戶(hù)非常關(guān)心云端數(shù)據(jù)和應(yīng)用程序的高可用性,IDC分析師Steve Hendrick表示,也許這意味著客戶(hù)并沒(méi)有準(zhǔn)備好使用公共云服務(wù)。Hendrick表示,這是一個(gè)簡(jiǎn)單的等式:越是關(guān)鍵任務(wù)型的數(shù)據(jù)和計(jì)算資源,客戶(hù)就應(yīng)該部署更多的保護(hù)和確保高可用性。