誰(shuí)動(dòng)了我的車(chē)票 宕機(jī)是否是主要原因?!
春運(yùn),這一號(hào)稱(chēng)人類(lèi)歷史上規(guī)模最大的周期性人類(lèi)大遷徙,2011年如期而至,在從1月19日開(kāi)始為期40天左右的時(shí)間內(nèi),鐵道部預(yù)計(jì)客流量將達(dá)28.5億人次,快要把我國(guó)大眾運(yùn)個(gè)來(lái)回了。如此浩大的客流,再加上一些其他因素,造就了一票難求的現(xiàn)狀。
無(wú)助,悲憤,相信這是每一名排隊(duì)買(mǎi)票同仁們都有過(guò)的感受。
春運(yùn)期間本來(lái)就一票難求,若是售票系統(tǒng)還癱瘓無(wú)疑是雪上加霜。今年1月23日中午,北京鐵路的售票系統(tǒng)就癱瘓1小時(shí)。據(jù)悉此次有設(shè)備故障引發(fā)的售票系統(tǒng)癱瘓導(dǎo)致北京西站、北京站、北京南站的所有售票點(diǎn)均無(wú)法出票。多家火車(chē)票代售點(diǎn),代售點(diǎn)均表示,昨日12點(diǎn)半至下午1點(diǎn)半,均無(wú)法出票。
“全北京所有的售票點(diǎn)聯(lián)網(wǎng),當(dāng)然都不能出票。”一位代售點(diǎn)的工作人員說(shuō)。為了應(yīng)對(duì)這突如其來(lái)的事故,三大火車(chē)站均啟動(dòng)應(yīng)急售票系統(tǒng),應(yīng)急售票窗口出售的為當(dāng)天的車(chē)票。北京南站為京津城際列車(chē)啟用臨時(shí)車(chē)票:“用粉紅色的紙撕成的票,比普通票小一半,上面寫(xiě)著字。拿票進(jìn)站,上哪趟車(chē)都可以,不用管座位號(hào)。”
圖一 北京南站的手寫(xiě)票
在售票系統(tǒng)癱瘓的這一個(gè)小時(shí)內(nèi),居然沒(méi)有出現(xiàn)排隊(duì)混亂,要知道每年的春運(yùn)排隊(duì)都是異常擁擠,各大售票點(diǎn)排隊(duì)人群的壯觀程度和密集程度讓人嘆為觀止:密集的排隊(duì)大軍中排隊(duì)4、5小時(shí)是常事,蕭瑟冷風(fēng)中也許你可以見(jiàn)著批被子的獨(dú)特風(fēng)景。環(huán)顧四周,或許還可以見(jiàn)到持刀插隊(duì)的買(mǎi)票者,廈門(mén)站就出現(xiàn)了這樣的兩名男子。
圖二 春運(yùn)排隊(duì)購(gòu)票
除了排隊(duì)買(mǎi)票外,網(wǎng)上訂票也成為了一種買(mǎi)票方式,只是由于鐵道部還沒(méi)有推出購(gòu)票系統(tǒng),目前網(wǎng)上訂票大多是代購(gòu)和轉(zhuǎn)讓。聯(lián)想到奧運(yùn)售票系統(tǒng),即便是鐵道部推出購(gòu)票系統(tǒng)也大概也只能是擺設(shè),如此巨大的購(gòu)票人群,沒(méi)有那個(gè)系統(tǒng)能承受得起吧,網(wǎng)上購(gòu)票不同于排隊(duì)買(mǎi)票,排隊(duì)即使再怎么人多,再怎么擁擠,售票還是能進(jìn)行的。網(wǎng)上購(gòu)票就不一樣了,服務(wù)器會(huì)由于負(fù)載過(guò)大而直接宕機(jī)了事。
北京奧運(yùn)售票系統(tǒng)就是個(gè)活生生的例子,奧運(yùn)售票系統(tǒng)開(kāi)放的第一天就被熱情的搶票大軍沖跨。相比春運(yùn),奧運(yùn)門(mén)票的區(qū)區(qū)700萬(wàn)和28.5億比起來(lái)可謂小巫見(jiàn)大巫。而且網(wǎng)站服務(wù)器宕機(jī)致死原因還不止流量負(fù)載過(guò)大這一個(gè)。
前不久的1月14日,蘋(píng)果推出特惠活動(dòng),沒(méi)想到就在那天蘋(píng)果在線商店(apple store)上不去,究竟是在線人數(shù)太多被刷爆還是另有原因?沒(méi)有正式的官方解釋。蘋(píng)果在線商店宕機(jī)影響不過(guò)是蘋(píng)果的特惠活動(dòng)趕不上,大不了過(guò)段時(shí)間再買(mǎi),試想如果火車(chē)票售票系統(tǒng)癱瘓后果不堪設(shè)想。
相比此次蘋(píng)果事件,服務(wù)器宕機(jī)在國(guó)內(nèi)外各大IT企業(yè)網(wǎng)站時(shí)有發(fā)生。服務(wù)器宕機(jī)致死一般有幾種原因,除了前面引發(fā)這次北京鐵路售票系統(tǒng)提到的設(shè)備(硬件)故障外,還有電源故障、軟件故障、流量負(fù)載過(guò)大,遭受黑客攻擊等。
#p#
致死原因一:電源故障
停電自然會(huì)引起服務(wù)器宕機(jī),還沒(méi)有哪個(gè)服務(wù)器不用電的吧。在剛剛過(guò)去的2010年,閃電、風(fēng)暴、洪水、轉(zhuǎn)換開(kāi)關(guān)的失誤都是今年數(shù)據(jù)中心停電的罪魁禍?zhǔn)祝罅康纳鐣?huì)媒體網(wǎng)站,如Twitter、Facebook以及一些免費(fèi)托管的服務(wù)器群都有嚴(yán)重的斷電現(xiàn)象。在2010年,主要電子商務(wù)商服務(wù)的服務(wù)器就出現(xiàn)了四次嚴(yán)重?cái)嚯?,?dǎo)致數(shù)百萬(wàn)美元的交易流產(chǎn),甚至連政府服務(wù)網(wǎng)站也出現(xiàn)宕機(jī)事件。
iWeb的CL數(shù)據(jù)中心因火災(zāi)迫使3000臺(tái)虛擬服務(wù)器主機(jī)轉(zhuǎn)用發(fā)電機(jī)設(shè)備進(jìn)行供電,其中三臺(tái)發(fā)電機(jī)正常啟動(dòng),另外一臺(tái)因轉(zhuǎn)換開(kāi)關(guān)故障而啟動(dòng)失敗。一旦UPS電源被耗盡,該數(shù)據(jù)中心將有三分之一的設(shè)備宕機(jī)。大約一小時(shí)后電力恢復(fù),但至少有450臺(tái)的服務(wù)器沒(méi)有重新啟動(dòng),需要進(jìn)行人工操作,一直持續(xù)到4日的下午4點(diǎn)所有的服務(wù)器才開(kāi)始正常運(yùn)行。通過(guò)這一事件,iWeb在博客中表示,該公司每星期都會(huì)對(duì)備用電力設(shè)備進(jìn)行測(cè)試,防止同類(lèi)情況發(fā)生。
在此前的9月16日,網(wǎng)上銀行門(mén)戶網(wǎng)站Chase.com在遭遇了14號(hào)和15號(hào)漫長(zhǎng)的停電而停機(jī)后重新上線,但是冗長(zhǎng)的等待過(guò)程導(dǎo)致了定期支付賬單無(wú)法按時(shí)交易。該網(wǎng)上銀行門(mén)戶網(wǎng)站表示:將退客戶還在此期間產(chǎn)生的的滯納金,并對(duì)此事件進(jìn)行公開(kāi)道歉。
在5月初,Amazon云計(jì)算服務(wù)4次因停電而發(fā)生故障,5月4日的兩次故障的原因則分別是一個(gè)UPS單元故障和人為操作失誤;5月8日因配電屏電氣接地和短路引發(fā)的停電曾導(dǎo)致部分用戶失去服務(wù)長(zhǎng)達(dá)7個(gè)小時(shí),而且還導(dǎo)致極少量用戶的數(shù)據(jù)丟失。而在5月11日,停電故障則是因?yàn)橐惠v汽車(chē)撞倒了Amazon數(shù)據(jù)中心附近的高壓電線桿,而數(shù)據(jù)中心的配電開(kāi)關(guān)又未能正常地從公用電網(wǎng)切換到內(nèi)部的備用發(fā)電機(jī)(配電自動(dòng)化系統(tǒng)錯(cuò)誤地將停電原因理解為電氣接地)。
#p#
致死原因二:硬件故障
在去年的12月12日,亞馬遜旗下英國(guó)、法國(guó)、德國(guó)和西班牙網(wǎng)站晚間宕機(jī)超過(guò)一個(gè)半小時(shí),有報(bào)道稱(chēng),由于亞馬遜停止向維基解密網(wǎng)站提供服務(wù),亞馬遜歐洲購(gòu)物網(wǎng)站引發(fā)黑客攻擊而出現(xiàn)訪問(wèn)障礙。但是在第二天,亞馬遜女發(fā)言人馬麗·奧薩科(MaryOsako)在一份電子郵件中談及所謂的遭受拒絕服務(wù)攻擊時(shí)表示:“今天早些時(shí)候公司歐洲零售網(wǎng)站出現(xiàn)短暫的訪問(wèn)中斷,是由于我們歐洲數(shù)據(jù)中心網(wǎng)絡(luò)硬件出現(xiàn)故障,并非遭受分布式拒絕服務(wù)攻擊(DDOS)。”
無(wú)獨(dú)有偶,美國(guó)最大的在線支付平臺(tái)PayPal在2010年10月29日也因硬件故障發(fā)生宕機(jī)事故。宕機(jī)發(fā)生于美國(guó)東部時(shí)間上周五上午11時(shí),當(dāng)天下午12時(shí)30分故障解決。但是,下午2時(shí)30分,故障再度發(fā)生,并持續(xù)了近一個(gè)小時(shí)?;謴?fù)和失效備援系統(tǒng)未能立即發(fā)揮作用。故障期間,PayPal的所有用戶均無(wú)法使用該網(wǎng)站的服務(wù)。
#p#
致死原因三:軟件故障
2010年2月18日下午(美國(guó)當(dāng)?shù)貢r(shí)間),美國(guó)博客服務(wù)平臺(tái)WordPress網(wǎng)站發(fā)生服務(wù)故障,此次故障持續(xù)時(shí)間達(dá)110分鐘,使約1020萬(wàn)家使用WordPress服務(wù)的博客網(wǎng)站受到影響,受到影響的網(wǎng)頁(yè)瀏覽數(shù)量高達(dá)550萬(wàn)個(gè)。WordPress創(chuàng)始人馬特·穆倫維格(MattMullenweg)在該公司官方博客中表示,故障原因是由于WordPress數(shù)據(jù)中心服務(wù)商對(duì)一臺(tái)主要路由器參數(shù)進(jìn)行了調(diào)整。
穆倫維格當(dāng)時(shí)還表示,希望下次WordPress發(fā)生大規(guī)模服務(wù)故障的時(shí)間至少也在“四年之后”。但出乎穆倫維格意料的是,僅僅不到四個(gè)月之后,WordPress再次發(fā)生大規(guī)模服務(wù)故障。在6月10日晚(美國(guó)當(dāng)?shù)貢r(shí)間)發(fā)生的那次故障,導(dǎo)致超過(guò)1000萬(wàn)家使用WordPress服務(wù)的博客受到影響,其中包括知名科技博客TechCrunch、GigaOm等網(wǎng)站一度無(wú)法正常訪問(wèn)。穆倫維格表示導(dǎo)致此次故障的原因是:WordPress對(duì)一部分所托管博客網(wǎng)站的代碼進(jìn)行了調(diào)整。
早在2000年,亞馬遜公司也曾發(fā)生過(guò)軟件故障引起的宕機(jī)事故,那年的感恩節(jié)前后的兩周,亞馬遜網(wǎng)站在不到兩周時(shí)間里出現(xiàn)第三次癱瘓,對(duì)此,亞馬遜表示出現(xiàn)故障的原因是網(wǎng)站的內(nèi)部軟件有問(wèn)題。亞馬遜發(fā)言人表示:“我們?cè)谕粫r(shí)間運(yùn)行了兩個(gè)軟件,結(jié)果證明這兩個(gè)軟件無(wú)法兼容,于是導(dǎo)致網(wǎng)站出現(xiàn)癱瘓,現(xiàn)在我們已對(duì)這一問(wèn)題進(jìn)行了確認(rèn)和分析,而且已排除了故障。”
#p#
致死原因四:“鴨梨”過(guò)大 消化不了
相比其他原因,網(wǎng)站服務(wù)器宕機(jī)事故是較為常見(jiàn)的原因是流量負(fù)載過(guò)大而引發(fā)。就好比春運(yùn)一樣,短時(shí)間內(nèi)大量人員的流動(dòng)導(dǎo)致了鐵路部門(mén)的緊張,而突發(fā)性高并發(fā)量訪問(wèn)則使得系統(tǒng)服務(wù)器癱瘓宕機(jī)。
流量過(guò)大,往往在網(wǎng)游中會(huì)出現(xiàn),魔獸世界在中國(guó)的代理商由九城變更為網(wǎng)易,與九城服務(wù)器經(jīng)常宕機(jī)不無(wú)關(guān)系,但是換作網(wǎng)易后服務(wù)器也是經(jīng)常宕機(jī)。以下是2010年10月11日魔獸世界服務(wù)器故障時(shí)官網(wǎng)論壇上游戲玩家的“賀電”截圖,看著這些刷屏帖,魔獸世界的火爆程度可見(jiàn)一斑了:
圖三 WOW網(wǎng)友刷屏“賀電”
與游戲服務(wù)器有著類(lèi)似,近來(lái)越來(lái)越流行的網(wǎng)上購(gòu)物也使得大型購(gòu)物網(wǎng)站面臨著此類(lèi)宕機(jī)風(fēng)險(xiǎn),此類(lèi)網(wǎng)站經(jīng)常有由于突發(fā)性高并發(fā)量而宕機(jī)的案例,尤其是在感恩圣誕等購(gòu)物旺季。
沃爾瑪Walmart.com幾乎每年黑色星期五期間都會(huì)被巨大的流量沖擊致死,09年沃爾瑪網(wǎng)站集中添加了基于Flash、OpenLaszlo和其他創(chuàng)新技術(shù)的互動(dòng)功能試圖讓顧客便捷地瀏覽內(nèi)容,然后迅速地結(jié)賬走人,試圖改變這種狀況,但是呢,黑色星期五這個(gè)網(wǎng)購(gòu)高峰來(lái)臨時(shí),情況依舊,Walmart.com被相當(dāng)于去年年同期7倍的網(wǎng)絡(luò)流量沖垮了,癱瘓長(zhǎng)達(dá)10小時(shí)
圖四 ebay網(wǎng)宕機(jī)
不僅沃爾瑪,作為美國(guó)數(shù)一數(shù)二的電子商務(wù)網(wǎng)站ebay在同時(shí)期也發(fā)生了宕機(jī)事故,09年11月22日,eBay網(wǎng)站出現(xiàn)宕機(jī),導(dǎo)致賣(mài)家至少損失了當(dāng)日銷(xiāo)售額的80%。eBay發(fā)言人表示,一名員工修改系統(tǒng)后,eBay搜索引擎當(dāng)天無(wú)法使用,出現(xiàn)宕機(jī)故障。技術(shù)故障“與待售商品激增有關(guān)”。
每年感恩節(jié)和圣誕節(jié)前夕,網(wǎng)站上待售商品都會(huì)大幅增加,但是經(jīng)過(guò)兩年的經(jīng)濟(jì)低迷后,eBay低估了增加的幅度。但是那年圣誕臨近時(shí)eBay網(wǎng)站上有超過(guò)2億件待售商品,這個(gè)數(shù)字比上一年同期多出33%,正是這激增的33%的待售商品導(dǎo)致eBay網(wǎng)站不堪重負(fù)而宕機(jī)。
早在2007年圣誕購(gòu)物旺季,雅虎電子商務(wù)系統(tǒng)就因網(wǎng)絡(luò)購(gòu)物流量過(guò)大而出現(xiàn)宕機(jī)事故,雅虎發(fā)言人表示,從美國(guó)東部時(shí)間11月26日5:30(北京時(shí)間11月26日18:30)開(kāi)始,支撐雅虎商家解決方案業(yè)務(wù)的基礎(chǔ)設(shè)施因網(wǎng)絡(luò)購(gòu)物流量過(guò)大而出現(xiàn)故障。受此影響,依賴(lài)于這一解決方案的約4萬(wàn)個(gè)網(wǎng)站無(wú)法正常完成訂單。
#p#
除了游戲和購(gòu)物網(wǎng)站外,其他類(lèi)型的網(wǎng)站呢?
視頻網(wǎng)站優(yōu)酷網(wǎng)也發(fā)去年發(fā)生宕機(jī)事件,超過(guò)3小時(shí)無(wú)法訪問(wèn)。據(jù)報(bào)道稱(chēng),此次宕機(jī)事件起源于“地球一小時(shí)”活動(dòng),優(yōu)酷網(wǎng)為響應(yīng)次活動(dòng),全站采用關(guān)燈模式,意在借此提醒網(wǎng)民注重環(huán)保與節(jié)約。但此舉令網(wǎng)友一時(shí)無(wú)法適應(yīng),大量網(wǎng)友頻繁刷新頁(yè)面導(dǎo)致優(yōu)酷網(wǎng)服務(wù)器崩潰。想法是好的,可惜事實(shí)難料,網(wǎng)友們看視頻追求的清晰,而不是節(jié)能。為了配合“地球一小時(shí)”活動(dòng)而宕機(jī)超過(guò)3小時(shí),倒不如直接停止服務(wù)一小時(shí)。
圖五 優(yōu)酷網(wǎng)宕機(jī)
Google旗下的Gmail也經(jīng)常發(fā)生宕機(jī)事件,09年9月2日,宕機(jī)長(zhǎng)達(dá)1個(gè)半小時(shí),流量過(guò)大導(dǎo)致服務(wù)器過(guò)載是此次事故的原因,Google做出了一些改進(jìn)以改善服務(wù)器及路由流量,將網(wǎng)絡(luò)查詢轉(zhuǎn)發(fā)至合適的Gmail服務(wù)器,而就在數(shù)臺(tái)Gmail服務(wù)器離線進(jìn)行例行升級(jí)時(shí),服務(wù)器出現(xiàn)了流量過(guò)載。在當(dāng)年的2月份、3月份和5月份,Gmail也先后出現(xiàn)宕機(jī)故障。
亞馬遜,雅虎、谷歌都發(fā)生都發(fā)生過(guò)宕機(jī)事故,那么另一巨頭微軟呢?在09年7月16日時(shí),微軟在線商店就因流量過(guò)大而停止服務(wù),此次流量過(guò)大是微軟Windows7操作系統(tǒng)在歐洲市場(chǎng)的預(yù)售表現(xiàn)火爆引起的。
微軟Hotmail服務(wù)在2010年2月17日出現(xiàn)宕機(jī)事故,持續(xù)約1個(gè)小時(shí)。在09年12月4日,微軟的另一個(gè)服務(wù)搜素引擎Bing在2.0版發(fā)布后的第二天就出現(xiàn)了訪問(wèn)故障。從下面的宕機(jī)頁(yè)面大概能猜測(cè)出宕機(jī)的原因是負(fù)載過(guò)大吧。
圖六 Bing宕機(jī)
目前中國(guó)最大的微博平臺(tái)新浪微博在2010年12月1日發(fā)生宕機(jī)4小時(shí),新浪官方解釋說(shuō):之所以掉線幾小時(shí),是因?yàn)橛脩粼鲩L(zhǎng)超出預(yù)期,服務(wù)器倍感壓力。
此次事件中,自上午10點(diǎn)起,用戶無(wú)法登陸,新浪的報(bào)錯(cuò)頁(yè)面幾次更改,最初的“微博正在升級(jí),將于11:30恢復(fù)”,然后改為“12:00恢復(fù)”,過(guò)了一段時(shí)間,干脆改為“稍后恢復(fù)”,這樣總不會(huì)錯(cuò)了。從下面這張網(wǎng)友惡搞圖片就能知道。
圖七 時(shí)間一改再改
然而,估計(jì)是看不到恢復(fù)希望,提示信息又改為“微博系統(tǒng)壓力過(guò)大正在搶修,我們深表歉意”。悲劇的是“歉意”竟然寫(xiě)成了“謙意”,于是又有了下面這張圖:
圖八 鴨梨過(guò)大導(dǎo)致錯(cuò)別字
#p#
致死原因五:黑客攻擊
新浪微博宕機(jī)事件中,從事件開(kāi)始時(shí)就有人猜測(cè)是被競(jìng)爭(zhēng)對(duì)手黑的,直到新浪官方解釋是由于系統(tǒng)壓力過(guò)大所致,也還有人懷疑。不過(guò)黑客攻擊致使網(wǎng)站宕機(jī)的案例也不少。
相信大家對(duì)去年年初的百度被黑事件記憶尤新吧,2010年1月12日晨有網(wǎng)友發(fā)現(xiàn)百度無(wú)法打開(kāi)。下面圖片是那次事件的進(jìn)展。
圖九 百度癱瘓進(jìn)展
圖十 百度被黑頁(yè)面
此次是伊朗網(wǎng)軍在一個(gè)月內(nèi)的第二次攻擊著名網(wǎng)站,09年12月18日,在美國(guó)當(dāng)?shù)貢r(shí)間晚10點(diǎn)左右,知名微博網(wǎng)站Twitter遭到黑客攻擊,其首頁(yè)遭到篡改,Twitter因此而宕機(jī)數(shù)小時(shí)。
圖十一 Twitter被黑
#p#
致死原因六:通信運(yùn)營(yíng)商原因?
2010年年尾的新浪微博4小時(shí)宕機(jī)讓5000萬(wàn)的微博用戶體驗(yàn)到了微博在他們生活中是多么重要的一部分;10月份的魔獸世界國(guó)服取的大面積停服讓網(wǎng)游愛(ài)好者體會(huì)到了網(wǎng)易的作用;年初的百度大癱瘓更是讓中國(guó)網(wǎng)民感嘆百度搜索原來(lái)這么方便,而騰訊自然也不會(huì)落下,一定也會(huì)有大面積的宕機(jī),要不然怎么讓廣大網(wǎng)民知道騰訊的或不可缺呢,怎么體現(xiàn)騰訊在中國(guó)互聯(lián)網(wǎng)的重要地位呢?
09年6月25日下午17點(diǎn)后,部分用戶互聯(lián)網(wǎng)訪問(wèn)出現(xiàn)故障,出現(xiàn)互聯(lián)網(wǎng)擁堵現(xiàn)象,騰訊QQ服務(wù)一度中斷。據(jù)說(shuō),這一事件是由搜狗與騰訊輸入法一案引起的,2009年6月25日下午17點(diǎn)47分,搜狗發(fā)動(dòng)了歷史以來(lái)最大黑客攻擊,到18點(diǎn)16分,攻擊還在持續(xù),騰訊所有的服務(wù)器全部癱瘓,所有的騰訊產(chǎn)品均無(wú)法使用。
另有說(shuō)法稱(chēng)事件始發(fā)于兩個(gè)游戲“私服”為爭(zhēng)奪玩家而相互攻擊,在無(wú)法“黑”掉競(jìng)爭(zhēng)對(duì)手網(wǎng)站的情況下,一方干脆對(duì)服務(wù)器進(jìn)行了狂轟濫炸,導(dǎo)致QQ大量掉線。由于國(guó)內(nèi)《魔獸世界》正處于停服狀態(tài),多個(gè)“私服”人流量近日已連創(chuàng)新高。
不過(guò)在6月25日晚間,騰訊科技發(fā)布公告稱(chēng),由于電信互聯(lián)網(wǎng)骨干網(wǎng)出現(xiàn)故障,導(dǎo)致騰訊部分服務(wù)不能正常使用。
圖十二 騰訊通告
類(lèi)似的情況在08年的平安夜(12月24日晚)也發(fā)生過(guò),網(wǎng)友反映,除了IM軟件、支付系統(tǒng)和部分Web服務(wù)之外,騰訊的手機(jī)QQ服務(wù)以及多款網(wǎng)絡(luò)游戲也出現(xiàn)了無(wú)法連接到服務(wù)器的情況。此次事件有猜測(cè)是黑客攻擊所致,巧合的是,騰訊官方解釋也是由于運(yùn)營(yíng)商線路故障??磥?lái)騰訊的運(yùn)營(yíng)商總是出問(wèn)題。
#p#
致死原因七:未知
全球最大的社交網(wǎng)站Facebook今年1月14日上午發(fā)生的歐洲多個(gè)國(guó)家發(fā)生宕機(jī)事故。宕機(jī)事故主要發(fā)生在英國(guó)、挪威和瑞典等國(guó),蘋(píng)果的iPhoneFacebook應(yīng)用也是如此,而且問(wèn)題持續(xù)5個(gè)小時(shí)以上。目前還不清楚是安全問(wèn)題,還是基礎(chǔ)設(shè)施問(wèn)題所致。而且到目前為止Facebook也沒(méi)有給出解釋?zhuān)啾热ツ?月23日的那場(chǎng)宕機(jī)事故中,F(xiàn)acebook官方在當(dāng)天就發(fā)出了宕機(jī)事故說(shuō)明,可以理解為此次Facebook是未知原因致死。
類(lèi)似的未知原因的致死事件還發(fā)生在亞馬遜。2010年6月29日(周二),亞馬遜網(wǎng)站出現(xiàn)大范圍宕機(jī),持續(xù)時(shí)間超過(guò)3小時(shí),在此期間用戶只能瀏覽空白和部分產(chǎn)品頁(yè)面。周二中午,亞馬遜主頁(yè)圖片無(wú)法顯示,只在屏幕左側(cè)顯示有分類(lèi)列表。搜索功能無(wú)法使用,購(gòu)物車(chē)和產(chǎn)品保存列表也出現(xiàn)暫時(shí)性空白。有數(shù)據(jù)表明亞馬遜年收入近270億美元,這意味著一旦網(wǎng)站宕機(jī),亞馬遜的損失為每分鐘5.14萬(wàn)美元??梢?jiàn)宕機(jī)事故對(duì)知名網(wǎng)站的損失有多大。
講了這么多,此次事件的原因呢?亞馬遜沒(méi)有正式的公告,甚至事件的猜測(cè)各大網(wǎng)站上都未見(jiàn)報(bào)道。只是大談特談宕機(jī)的損失。暫且將此次事件也歸為未知原因致死吧。
圖十三 亞馬遜宕機(jī)
#p#
總結(jié):服務(wù)器經(jīng)常宕機(jī)?
服務(wù)器宕機(jī),這是每個(gè)網(wǎng)站都有可能遇到的問(wèn)題,但是作為服務(wù)器,穩(wěn)定性還是挺高的,即使是文中提到次數(shù)最多的亞馬遜,一年的故障時(shí)間也在10小時(shí)以內(nèi)。而且有些致死事件是完全可以避免的。
服務(wù)器不比個(gè)人電腦,死機(jī)重啟沒(méi)什么影響,但像上面的亞馬遜,宕機(jī)一分鐘就損失上萬(wàn)美元。因此我們要最大程度的避免宕機(jī),對(duì)于不可控的因素,比如通信運(yùn)營(yíng)商的原因、未知原因,我們無(wú)能為力。但對(duì)于誤操作引起的電源故障,硬件問(wèn)題,或者是某處的設(shè)置出錯(cuò),我們是可以避免的。對(duì)于黑客攻擊和鴨梨過(guò)大這兩個(gè)致死原因,考慮到經(jīng)費(fèi)問(wèn)題。我們只能是盡力避免吧,人家真是下功夫黑你,能怎么辦呢,金無(wú)赤足人無(wú)完人,無(wú)懈可擊的系統(tǒng)也是沒(méi)有的吧;鴨梨過(guò)大,我們可以說(shuō)既喜又怕,沒(méi)有哪個(gè)網(wǎng)站不追求流量吧??墒强紤]到經(jīng)費(fèi)問(wèn)題,我們又不可能為幾星期甚至幾天準(zhǔn)備而足夠的冗余,只能自求多福。
網(wǎng)絡(luò)訂票何時(shí)實(shí)現(xiàn)?
鐵道部為什么沒(méi)有推出網(wǎng)上售票系統(tǒng)呢?很大原因在于節(jié)假日客流的高并發(fā)量上,事實(shí)上,北京曾有過(guò)網(wǎng)上訂票的嘗試。
2000年,當(dāng)時(shí)的北京鐵路分局“認(rèn)定”的北京首鐵在線電子商務(wù)有限公司成立,開(kāi)通“首鐵在線”網(wǎng)站,提供火車(chē)票查詢、預(yù)訂等多項(xiàng)服務(wù)。
在2005五一期間,因?yàn)榫W(wǎng)上購(gòu)票人數(shù)過(guò)多,“首鐵在線”服務(wù)器出現(xiàn)故障,許多客戶無(wú)法網(wǎng)上訂票。當(dāng)年春運(yùn)高峰時(shí),網(wǎng)站也曾癱瘓過(guò)。2008年,“首鐵在線”放棄火車(chē)票余額查詢、網(wǎng)絡(luò)訂票、電話訂票功能,只余部分信息查詢服務(wù)。多名曾在首鐵在線訂票的網(wǎng)友說(shuō),遇到春運(yùn)等特殊時(shí)期,在網(wǎng)上經(jīng)常訂不到,平時(shí)緊俏線路也很難訂,還不如在窗口買(mǎi)靠譜。
下圖是該網(wǎng)站現(xiàn)在的公告:
圖十四 首鐵在線網(wǎng)上訂票取消
不過(guò)在去年,7月28日舉行的“中國(guó)高速鐵路成就”暨第七屆世界高速鐵路大會(huì)新聞發(fā)布會(huì)上,鐵道部運(yùn)輸局綜合部主任李軍他表示,鐵道部正在積極推進(jìn)網(wǎng)上訂票,不久的將來(lái)就可以在中國(guó)實(shí)現(xiàn)網(wǎng)絡(luò)訂票。
不知“不久的將來(lái)”有多快,而到時(shí)候系統(tǒng)服務(wù)器能否承受每年春運(yùn)如此之大的流量壓力呢?是否會(huì)和“首鐵在線”一樣壓力過(guò)大宕機(jī)致死?只能是希望這個(gè)不久不要很久,而且訂票系統(tǒng)時(shí)候別宕機(jī),這樣或許能緩解一下買(mǎi)票難的壓力。
51CTO觀點(diǎn):鐵道部的網(wǎng)上售票系統(tǒng)至今還是浮云,顯而易見(jiàn),這位編輯同仁對(duì)“春運(yùn)”還是有很深的情結(jié)的。宕機(jī)的原因有很多種,但并不能成為不努力把此事做好的借口。雖然本文大多數(shù)是在介紹服務(wù)器軟的硬件宕機(jī)原因,但小編還是能感覺(jué)出作者醉翁之意不在酒的意境,畢竟我們都有過(guò)相似的經(jīng)歷。
在網(wǎng)絡(luò)異常發(fā)達(dá)的今天,在奪得異常牛X的超算第一后,在實(shí)力異常雄厚的鐵道部旗下,能否做出一部能為國(guó)民服務(wù)的沒(méi)有“異常”的售票系統(tǒng)?我們的要求并不算高,我們只是一只想要回家的小鳥(niǎo)。
【編輯推薦】