運(yùn)維不迷茫,請(qǐng)收好這篇事件、故障排查處理思路_IT技術(shù)周刊第684期
在講解事件、故障處理思路前,先講一個(gè)故障場(chǎng)景(以呼叫中心系統(tǒng)作為一例子):
業(yè)務(wù)人員反映呼叫中心系統(tǒng)運(yùn)行緩慢,部份電話在自助語(yǔ)言環(huán)節(jié)系統(tǒng)處理超時(shí),話務(wù)轉(zhuǎn)人工座席,人工座席出現(xiàn)爆線情況。
運(yùn)維人員開(kāi)始忙活了,查資源使用情況、查服務(wù)是否正常、查日志是否報(bào)錯(cuò)、查交易量還有沒(méi)有……時(shí)間不知不覺(jué)的在敲鍵盤(pán)、敲鍵盤(pán)、敲鍵盤(pán)中過(guò)去,但是原因還未定位。
經(jīng)理過(guò)來(lái)了解情況:“系統(tǒng)恢復(fù)了嗎?”、“故障影響是什么?”、“交易中斷了嗎?”……
運(yùn)維人員趕緊敲鍵盤(pán),寫(xiě) SQL,看交易量;敲鍵盤(pán),寫(xiě)命令,看系統(tǒng)資源、情況……