服務(wù)器宕機(jī)造成英國(guó)航空史上最嚴(yán)重的大混亂
英國(guó)國(guó)家航空服務(wù)公司(NATS)在去年12月份發(fā)生一起嚴(yán)重事故。由于其兩條系統(tǒng)航班服務(wù)器通道均發(fā)生故障,導(dǎo)致數(shù)百架航班無(wú)法起飛。
據(jù)一份內(nèi)部報(bào)告顯示,此次混亂共造成120架航班被取消,500架航班被耽擱了45分鐘,總共影響約10000萬(wàn)名旅客。
據(jù)內(nèi)部人員透露,此次事故的發(fā)生是一臺(tái)運(yùn)行航班數(shù)據(jù)處理系統(tǒng)的IBM S/390主機(jī)宕機(jī)造成的。內(nèi)部報(bào)告顯示,在14點(diǎn)44分,一臺(tái)為航空指揮控制人員提供數(shù)據(jù)的計(jì)算機(jī)發(fā)生故障;14點(diǎn)45分,所有離開(kāi)倫敦機(jī)場(chǎng)的航班被叫停;15點(diǎn)整,整個(gè)歐洲所有計(jì)劃經(jīng)過(guò)英國(guó)領(lǐng)空的航班被叫停。在當(dāng)天的20點(diǎn)10分,系統(tǒng)才恢復(fù)正常。
所有倫敦區(qū)域的操控人員都有著一個(gè)唯一的身份標(biāo)識(shí)--原子函數(shù)(Atomic Function),其確保航班服務(wù)器系統(tǒng)給每個(gè)工作站提供正確的信息和通信保障。但系統(tǒng)中某個(gè)潛在的漏洞導(dǎo)致原子函數(shù)的***值被錯(cuò)誤的設(shè)置成151,而正確的數(shù)字是193.
報(bào)告顯示,航班服務(wù)器系統(tǒng)認(rèn)為它有著比原子函數(shù)的***值更大的上限,而這種情況是不允許出現(xiàn)的。當(dāng)出現(xiàn)這種情況時(shí),航班服務(wù)器系統(tǒng)就會(huì)自動(dòng)關(guān)閉,以防止提供錯(cuò)誤的數(shù)據(jù)給工作站。當(dāng)這種情況傳送到第二套運(yùn)行觀察模式的航班服務(wù)器系統(tǒng)時(shí),觸發(fā)了同樣的錯(cuò)誤。
NATS否認(rèn)對(duì)其忽略IT系統(tǒng)投入的指控,該公司于2001年成為與英國(guó)政府公私合營(yíng)伙伴關(guān)系的企業(yè)。
該起事故的最終報(bào)告將會(huì)在2015年2月14日前發(fā)布。