阿里云午夜再宕機(jī) 云服務(wù)商99.99%的安全性有多可靠
原標(biāo)題:阿里云再次宕機(jī)回應(yīng)稱(chēng)已全部修復(fù)
阿里云并未公開(kāi)詳細(xì)賠償細(xì)節(jié);業(yè)內(nèi)人士稱(chēng),用戶可選擇“多云”部署,以避免宕機(jī)損失
阿里云又宕機(jī)了,這一次發(fā)生在午夜。
3 月 2 日 23 時(shí) 55 分左右,阿里云開(kāi)始出現(xiàn)大規(guī)模故障,位于華北地區(qū)的多家互聯(lián)網(wǎng)公司的 IT 運(yùn)維人員發(fā)現(xiàn)多個(gè) App 和網(wǎng)站開(kāi)始陷入卡頓。隨后一批程序員趕往公司加班。58 高級(jí)架構(gòu)師沈劍在針對(duì)此次宕機(jī)的回憶文章中稱(chēng),這場(chǎng)事故持續(xù)了三個(gè)小時(shí)左右,事后觀察了兩個(gè)小時(shí)。
3 月 3 日早間,阿里云開(kāi)始發(fā)布公告,開(kāi)始全面排查。截至目前披露的結(jié)果是,華北 2 地域可用區(qū)C部分的 ECS 服務(wù)器(云服務(wù)器)等實(shí)例出現(xiàn) IO HANG(IO 不響應(yīng)),經(jīng)緊急排查處理后已全部恢復(fù)。阿里云方面向記者證實(shí)了這一結(jié)果,并表示其他區(qū)域未發(fā)現(xiàn)此類(lèi)情況。
針對(duì)故障,阿里云表示,將根據(jù) SLA 協(xié)議(服務(wù)合同),盡快處理賠償事宜。但阿里云并未公開(kāi)詳細(xì)的賠償細(xì)節(jié)。而根據(jù)阿里云開(kāi)發(fā)者論壇上的網(wǎng)友說(shuō)法,賠償通常是按照故障時(shí)間的 100 倍進(jìn)行的,而方案則根據(jù)包年包月預(yù)付費(fèi)模式和按量付費(fèi)模式有所不同,但總額不超過(guò)支付的單臺(tái)云服務(wù)器費(fèi)用總額。
這是一場(chǎng)發(fā)生在周末的宕機(jī)時(shí)間,因微博的傳播而備受關(guān)注。第三方機(jī)構(gòu) Forrester 分析師戴鯤告訴記者,華北 2 地域是阿里云最早開(kāi)通服務(wù)的華北地域之一,而 ECS 服務(wù)器又是阿里云最為核心的 IaaS(基礎(chǔ)設(shè)施即服務(wù))之一,影響程度應(yīng)當(dāng)是相對(duì)較大的。
2018 年 6 月,阿里云曾出現(xiàn)技術(shù)故障。盡管官方最終給出的故障時(shí)間僅為 30 分鐘,而恢復(fù)時(shí)間需要 1 小時(shí)。但阿里云最終仍將其定義為 S1 級(jí)別事故,即核心業(yè)務(wù)重要功能不可用,影響了部分用戶,造成了一定損失。
2019 年 1 月,第三方機(jī)構(gòu) IDC 報(bào)告數(shù)據(jù)顯示,2018 年上半年中國(guó)公有云廠商中,阿里云以 43% 的市場(chǎng)占有率***,相當(dāng)于第二名至第九名的總和;騰訊排名第二,市場(chǎng)占有率為 11.2%。
延展
99. 99% 的安全性有多可靠?
事實(shí)上,宕機(jī)事件頻繁發(fā)生。僅 2018 年一年,全球主流云計(jì)算廠商曾發(fā)生數(shù)十起宕機(jī)事故。對(duì)于宕機(jī)的原因,亞馬遜 AWS 稱(chēng)因數(shù)據(jù)中心硬件問(wèn)題,微軟 Azure 數(shù)據(jù)中心則因高溫和打雷,騰訊云因運(yùn)營(yíng)和硬盤(pán)故障,谷歌則因自動(dòng)化失效。
但與此同時(shí),多家云服務(wù)商仍在承諾 99.99% 的安全可靠性。對(duì)此,有技術(shù)專(zhuān)家表示,這一數(shù)字是經(jīng)過(guò)驗(yàn)證的,而且通過(guò)部署反饋,故障率的確在 0.01% 以下。并且,一旦出現(xiàn)故障,云服務(wù)商也都有相應(yīng)的容災(zāi)方案,可以及時(shí)解決問(wèn)題。
沈劍在上述文章中表示,更換其他方案,也會(huì)遇到其他的問(wèn)題,而自建機(jī)房,更是沒(méi)有信心比阿里云更好。目前大多數(shù)公司仍在業(yè)務(wù)階段,考慮投入產(chǎn)出比,所以多機(jī)房模式并不適合所有公司。
如何避免宕機(jī)事故造成重大損失?有業(yè)內(nèi)人士稱(chēng),需要將重要業(yè)務(wù)分別放在不同的“籃子”里,也就是選擇多個(gè)供應(yīng)商,進(jìn)行“多云”部署。負(fù)責(zé)運(yùn)營(yíng)微軟云服務(wù)落地的世紀(jì)互聯(lián)藍(lán)云***執(zhí)行官柯文達(dá)表示,真正的企業(yè)級(jí)市場(chǎng)中,用戶一定是希望“多云”部署。
不過(guò),也有行業(yè)人士認(rèn)為,“多云”部署,會(huì)帶來(lái)管理、開(kāi)發(fā)、人員培訓(xùn)的復(fù)雜性,也可以選擇多區(qū)域部署的方式。
市場(chǎng)對(duì)云計(jì)算的需求仍在增長(zhǎng)
云計(jì)算取代舊有 IT 部署的趨勢(shì)已不可逆。Gartner 數(shù)據(jù)顯示,云計(jì)算占全球總 IT 支出的規(guī)模正在不斷增加。從 2010 年的 1.99%,上升到 2018 年的8%,而未來(lái)幾年向云轉(zhuǎn)移將會(huì)直接或間接影響超過(guò) 1 萬(wàn)億美元的 IT 支出。
這一切變化發(fā)生在過(guò)去十年中。十多年前,無(wú)論是跨國(guó)巨頭,還是創(chuàng)業(yè)公司,部署 IT 架構(gòu)的思路都是相同的,即購(gòu)買(mǎi)服務(wù)器,部署一套系統(tǒng),支撐公司業(yè)務(wù)和戰(zhàn)略。此時(shí),IT 只是一項(xiàng)運(yùn)營(yíng)成本。
但現(xiàn)在這些企業(yè),尤其是初創(chuàng)公司通過(guò)租用云服務(wù)的方式,就能獲取 IT 能力。
在中國(guó)市場(chǎng),阿里云就提供這種服務(wù)。與此同時(shí),騰訊、百度、電信運(yùn)營(yíng)商等紛紛進(jìn)入這一市場(chǎng)。2015 年中國(guó)云計(jì)算市場(chǎng)爆發(fā)后,多家公司曾以年增長(zhǎng)率超過(guò)三位數(shù)的速度增長(zhǎng)。不僅如此,從 2015 年下半年開(kāi)始,云計(jì)算服務(wù)商已經(jīng)將客戶瞄向大型企業(yè)和政府機(jī)關(guān)。
從整體來(lái)看,云計(jì)算取代舊有 IT 部署模式已成為產(chǎn)業(yè)共識(shí),尤其是按需付費(fèi)的公有云更是對(duì) IT 成本最有效的節(jié)省。Gartner 研究報(bào)告預(yù)計(jì),2017 年到 2020 年公有云行業(yè)增速將維持在 15% 以上,2020 年將達(dá)到 3834 億美元的規(guī)模,而云代替的總規(guī)模也將達(dá)到 2160 億美元。
一位行業(yè)分析師告訴記者,對(duì)于如電信、金融等一些關(guān)鍵領(lǐng)域的巨頭公司,這類(lèi)宕機(jī)事件仍將是影響其快速轉(zhuǎn)向云計(jì)算隊(duì)伍的阻礙,他們可能拿出一些非核心業(yè)務(wù)在云計(jì)算上嘗試,但很難馬上全部轉(zhuǎn)向云計(jì)算。




















