運(yùn)維必備制度:故障分級(jí)和處罰規(guī)范
作者簡(jiǎn)介
唐文,《海量運(yùn)維、運(yùn)營(yíng)規(guī)劃之道》一書(shū)作者,關(guān)于海量運(yùn)維、運(yùn)營(yíng)規(guī)劃,我想業(yè)界都沒(méi)有準(zhǔn)確的定義,假如說(shuō)互聯(lián)網(wǎng)的架構(gòu)師用能否設(shè)計(jì)多高的摩天大樓來(lái)衡量架構(gòu)能力,那運(yùn)維、運(yùn)營(yíng)更多的是在關(guān)注互聯(lián)網(wǎng)服務(wù)的質(zhì)量、效率、成本、故障、瓶頸,用戶的忍耐、抱怨等問(wèn)題。
在接下來(lái)的日子里,將以質(zhì)量、效率、成本為核心,從運(yùn)營(yíng)規(guī)劃、管理、流程/規(guī)范、系統(tǒng)/平臺(tái),監(jiān)控、告警、安全、優(yōu)化、考核等幾個(gè)維度結(jié)合案例來(lái)與大家分享自己的體會(huì),內(nèi)容大致如下所示。
編者按:一個(gè)好的制度是可操作、可執(zhí)行的,不是高高掛起的。每個(gè)公司情況不同,制度需要定期根據(jù)公司自身情況進(jìn)行適當(dāng)修改,以下文章算是一個(gè)制度的模板,僅供參考,要想使用肯定還需要修改。
正文
互聯(lián)網(wǎng)產(chǎn)品提供7*24小時(shí)服務(wù),而因人為操作、程序Bug等原因?qū)е路?wù)不可用是影響服務(wù)持續(xù)運(yùn)行的重要原因,為了提高各業(yè)務(wù)產(chǎn)品的運(yùn)維和運(yùn)營(yíng)質(zhì)量,規(guī)范各業(yè)務(wù)線的服務(wù)、故障響應(yīng),擬定和發(fā)布“故障分級(jí)和處罰規(guī)范”是非常必要的。
故障分級(jí)標(biāo)準(zhǔn)
運(yùn)營(yíng)故障中,對(duì)非不可抗力所造成的故障歸類為“故障”,對(duì)于故障將追究故障的分級(jí),故障責(zé)任人,及故障處理結(jié)果。下面將就各類故障級(jí)別進(jìn)行定義說(shuō)明,由于故障可能在多方面體現(xiàn)影響,所以故障的綜合等級(jí)評(píng)定原則,取各個(gè)方面中嚴(yán)重等級(jí)***者為該故障綜合嚴(yán)重等級(jí),故障分級(jí)如下所示。
故障分級(jí)表
故障獎(jiǎng)懲制度
運(yùn)營(yíng)故障處理評(píng)定是根據(jù)相關(guān)責(zé)任人對(duì)故障的響應(yīng)、處理、完成結(jié)果等因素來(lái)對(duì)故障的處理情況進(jìn)行綜合評(píng)定,部門(mén)內(nèi)會(huì)依據(jù)這個(gè)評(píng)定來(lái)對(duì)故障處罰等級(jí)進(jìn)行調(diào)整。該評(píng)定只用于由部門(mén)內(nèi)決定的故障處罰分級(jí),公司的處罰條例不受此約束。符合下面條件者,可以對(duì)故障處罰等級(jí)進(jìn)行適當(dāng)降級(jí),具體所降等級(jí)由部門(mén)領(lǐng)導(dǎo)決定,故障升級(jí)制如下所示。
故障升級(jí)制度表
對(duì)于所出現(xiàn)的各級(jí)運(yùn)營(yíng)故障,如果運(yùn)營(yíng)故障的主要原因由人為工作疏忽/失誤所導(dǎo)致,參照以下處罰標(biāo)準(zhǔn)對(duì)個(gè)人和項(xiàng)目組進(jìn)行相關(guān)懲處,任何運(yùn)營(yíng)故障,要及時(shí)通報(bào)相關(guān)領(lǐng)導(dǎo)或相關(guān)處理人員,對(duì)于延報(bào)、瞞報(bào)故障者,將從嚴(yán)處罰,故障分級(jí)及處罰如下所示。
故障分級(jí)表



























