新概念運(yùn)維之強(qiáng)迫癥會(huì)害死系統(tǒng)管理員
原創(chuàng)【51CTO精選譯文】編者按:系統(tǒng)管理員是一個(gè)需要細(xì)致的工種,其細(xì)致程度往往到了一種謹(jǐn)慎強(qiáng)迫癥的地步。但是,凡事都有過猶不及。下面這篇文章總結(jié)了一些系統(tǒng)管理員們因?yàn)閺?qiáng)迫癥而做過的蠢事兒,證明了一味追求各方面井井有條的做法為什么會(huì)適得其反,給廣大系統(tǒng)管理員們做個(gè)借鑒。本文作者Paul Venezia是Infoworld資深編輯,有著豐富的運(yùn)維與咨詢經(jīng)驗(yàn)。以下為正文:
有時(shí)候,你就是抗拒不了想把事情安排得井井有條的念頭,盡管這么做其實(shí)沒有必要;有時(shí)候,你決定處理某個(gè)微不足道或者幾乎就不存在問題,到頭來卻平添了一大堆的工作;有時(shí)候,你希望在其他方面也能像操作計(jì)算機(jī)時(shí)摁Undo按鈕那樣可以撤銷操作;有時(shí)候,系統(tǒng)明明沒壞掉,你卻決定無論如何要修復(fù)系統(tǒng)。
遺憾的是,我也犯過很多這樣的毛病。
蠢事兒一:重新擺弄電源線導(dǎo)致弄壞了交換機(jī)
有一次,一條電源線不正確地穿過數(shù)據(jù)架的背面,使得后面的機(jī)箱門無法正常關(guān)閉。電源線拉到了一臺(tái)僅與后端管理鏈路相連接的交換機(jī)上。我為了重新布線,將那臺(tái)交換機(jī)的電源也拔下來了一會(huì)兒,因?yàn)橛X得應(yīng)該沒什么關(guān)系。事情就是這樣發(fā)生的。
當(dāng)交換機(jī)重新接上后,忽然導(dǎo)致電源系統(tǒng)出現(xiàn)故障,這臺(tái)交換機(jī)當(dāng)場(chǎng)就報(bào)廢了。幸運(yùn)的是,這是只“廉價(jià)的”24口10/100交換機(jī),只要跑一趟Staples買來一只新的換掉就行。但是,當(dāng)時(shí)是晚上10點(diǎn)后進(jìn)行深夜維護(hù)的時(shí)段,所以只好等到第二天才能去買。
可是,在接下來的維護(hù)工作中,我們還需要那幾條管理鏈路。我***從會(huì)議室借來了一只交換機(jī),確保完成當(dāng)晚剩余的工作。
可以從兩個(gè)角度來看待這件事。***個(gè)角度是,我本來就不該畫蛇添足拔那根線,否則一切都正常。第二個(gè)角度是,我加快了那個(gè)電源故障的發(fā)生,讓問題在我們都在場(chǎng)的時(shí)候暴露出來,而不是在未來某個(gè)也許很不走運(yùn)的時(shí)間點(diǎn)。從第二個(gè)角度看來這倒是件好事,不過要是讓我從頭來過,我肯定不會(huì)去動(dòng)那條電源線。
蠢事兒二:更新強(qiáng)迫癥導(dǎo)致系統(tǒng)無法運(yùn)行
在生產(chǎn)系統(tǒng)上,你偶爾會(huì)一時(shí)心血來潮,想更新固件以及/或者軟件。這種情況下,你對(duì)交換機(jī)、路由器或服務(wù)器進(jìn)行的是全然不同的操作;你注意到某個(gè)軟件或交換機(jī)固件有了一兩個(gè)更新版本。隨后,你決定采用這個(gè)新版本。十之八九,更新軟件或固件不會(huì)造成任何問題,一切按計(jì)劃進(jìn)行(不過實(shí)際上,這個(gè)固件更新根本不在原本的計(jì)劃內(nèi))。但是也不排除更新后系統(tǒng)反而運(yùn)行不了的小概率事情。
蠢事兒三:強(qiáng)迫改善某幾項(xiàng)配置參數(shù)導(dǎo)致搞砸了整個(gè)配置
在某個(gè)重要項(xiàng)目、應(yīng)用軟件或其他系統(tǒng)的部署階段,所有必要的部分均已落實(shí)到位,概念證明工作也在順利地開展,部署到生產(chǎn)環(huán)境的工作一切看起來很正常。在你決定仔細(xì)檢查系統(tǒng)、確保一切都盡善盡美之前,系統(tǒng)確實(shí)堪稱***。
在有點(diǎn)強(qiáng)迫癥似地力求改進(jìn)的這個(gè)期間,你看到有幾個(gè)參數(shù)似乎沒有設(shè)置好——比如像輔助NTP(網(wǎng)絡(luò)時(shí)間協(xié)議)服務(wù)器字段出現(xiàn)拼寫錯(cuò)誤,或者某個(gè)配置參數(shù)缺少描述條目,等等這些無關(guān)緊要的問題。這些本身其實(shí)都不是什么嚴(yán)重問題,只不過還不是很正確,你覺得應(yīng)該弄弄好。
于是,你屁顛屁顛地改正了NTP地址,或者在文本字段添加了一個(gè)簡短的描述,隨后保存了配置。這時(shí)候,你突然認(rèn)識(shí)到自己沒有備份之前的配置;而不知什么原因,另一名管理員一直在搗鼓另外一些設(shè)置。你保存好了配置,實(shí)際上破壞了整個(gè)系統(tǒng)之前沒什么問題的配置。但是你就是覺得那個(gè)輔助NTP服務(wù)器字段非改正過來不可。
結(jié)論
所有這些強(qiáng)迫癥其實(shí)基本上是直冒傻氣的行為——IT行當(dāng)?shù)倪@個(gè)現(xiàn)象就相當(dāng)于,有人看到墻上貼著一張紙,看著不順眼就一把扯下來,結(jié)果在墻紙上留下了一個(gè)碩大的洞;或者是看到一根線絲露在羊毛衫外頭,忍不住把它扯下來,結(jié)果搞得一團(tuán)糟,真是弄巧成拙。
其實(shí)許多時(shí)候,大的方面很容易搞定。事先又沒有考慮充分地改動(dòng)小細(xì)節(jié),只會(huì)把事情搞砸了。這對(duì)于有不同程度強(qiáng)迫癥的系統(tǒng)管理員而言,一定要引以為鑒。即使真的無法忍受某些不***的地方,在進(jìn)行任何修改之前,一定要按照標(biāo)準(zhǔn)的流程做好備份,確保系統(tǒng)的可回滾性。
你有哪些因強(qiáng)迫癥而做過的蠢事?不妨與我們分享一下。
【51CTO.com譯文,轉(zhuǎn)載請(qǐng)注明原文作譯者和出處?!?/p>
原文:Admin tip: Leave well enough alone, dummy
【有關(guān)新概念運(yùn)維】
在日常的系統(tǒng)管理運(yùn)維工作中,每個(gè)人對(duì)于系統(tǒng)、工具、應(yīng)用、命令、架構(gòu)等方面都會(huì)有自己的理解。理解方式的不同也意味著不同的認(rèn)知,因此,這種理解方式的交流,也可能碰撞出更多思維的火花,讓每個(gè)人從另一個(gè)角度了解自己每天從事的工作。51CTO系統(tǒng)頻道從日常和運(yùn)維人員的交流中收集這些理解方式,組合成短文集,名為《新概念運(yùn)維》。
《新概念運(yùn)維》欄目接受投稿,有意者請(qǐng)聯(lián)系 yangsai@51cto.com 。
【編輯推薦】















 
 
 
 
 
 
 