數(shù)據(jù)中心運(yùn)營計(jì)劃的基本原則
企業(yè)需要為數(shù)據(jù)中心成功的運(yùn)營制定一個(gè)有效且適應(yīng)性強(qiáng)的計(jì)劃,需要采取具體的原則來指導(dǎo)IT人員全面考慮其運(yùn)營目標(biāo)以及如何實(shí)現(xiàn)這些目標(biāo)。但很多企業(yè)的數(shù)據(jù)中心運(yùn)營的規(guī)劃與努力絕大多數(shù)是放在結(jié)構(gòu)設(shè)計(jì)和開發(fā)方面,而在初始目標(biāo)完成后,往往卻忘記其最終目標(biāo)是什么。
如今,人們?cè)絹碓疥P(guān)注數(shù)據(jù)中心運(yùn)行的重要性。為了提高數(shù)據(jù)中心運(yùn)營規(guī)劃水平,人們需要記住以下五個(gè)基本原則:
原則一:經(jīng)驗(yàn)是***的老師
就像生活中許多重要的事情一樣,工作人員需要回想一下自己在職業(yè)生涯中犯了哪些運(yùn)營錯(cuò)誤,將如何避免,并讓這些經(jīng)驗(yàn)教訓(xùn)為今后的運(yùn)營工作奠定基礎(chǔ)。在某些情況下,這可能意味著企業(yè)的工作人員沒有有效地運(yùn)行設(shè)備,或者供應(yīng)商的服務(wù)沒有到企業(yè)的要求。無論如何,以往支持關(guān)鍵任務(wù)環(huán)境的經(jīng)驗(yàn)使人們認(rèn)識(shí)到,數(shù)據(jù)中心的卓越運(yùn)營是一個(gè)全面和持續(xù)的過程,它反映在以下幾方面:
- 高效的設(shè)施設(shè)計(jì)。
- 有效的移交后和正在進(jìn)行的培訓(xùn)。
- 采用合適的工具。
原則二:從運(yùn)營人員的角度出發(fā)進(jìn)行設(shè)計(jì)
有效的運(yùn)營計(jì)劃始于操作人員的頭腦開始,或者更簡單地說,"需要的成功是什么?"雖然這個(gè)問題似乎可以給出一個(gè)簡單的答案,但是通常會(huì)發(fā)現(xiàn)這通常是一些配套查詢答案的匯編。
顯然,數(shù)據(jù)中心設(shè)施本身需要進(jìn)行優(yōu)化,以加強(qiáng)有效的維護(hù)和故障排除。換句話說,Tier III級(jí)數(shù)據(jù)中心的并發(fā)可維護(hù)性必不可少,這是至關(guān)重要的。其程序本身應(yīng)該簡單明了,這是出于運(yùn)營工作人員的角度出發(fā),而不是工程師。日本質(zhì)量管理專家推出的一個(gè)術(shù)語Poka Yoke(防誤防錯(cuò))更好地描述了制定流程和程序的最終目標(biāo)。這是一個(gè)在工作過程中采用自動(dòng)作用、報(bào)警、提醒等手段防止運(yùn)營人員疏忽或誤操作而出現(xiàn)失誤的方法,它意味著可以***程度地減少人為錯(cuò)誤。而對(duì)于這樣的情況,當(dāng)超過70%的中斷仍然可以追溯到是運(yùn)營人員失誤的時(shí)候,那么在整個(gè)簡化過程中還有很長的路要走。
行動(dòng)的持續(xù)性應(yīng)該被接受和適應(yīng)。如果沒有其他原因,平均數(shù)據(jù)中心每3-5年進(jìn)行一次硬件更新,那么數(shù)據(jù)中心就是一個(gè)動(dòng)態(tài)的環(huán)境,"一直這樣做"并不能完全達(dá)到持續(xù)改進(jìn)的目標(biāo)。反饋環(huán)路證明了消除不必要步驟的有效機(jī)制,并確定了執(zhí)行操作的更有效的方法。
原則三:靈活性和控制
靈活性和控制雖然看起來很寬泛,但這個(gè)概念真的很簡單。特別是供應(yīng)商的人員活動(dòng)安排必須與企業(yè)工作節(jié)奏保持一致。運(yùn)營要求必須圍繞企業(yè)的具體需求來執(zhí)行。同樣的原則也適用于運(yùn)營人員和安全的人員配備水平。
原則四:培訓(xùn)和認(rèn)證
培養(yǎng)人才是一個(gè)持續(xù)改進(jìn)的目標(biāo)。不斷提高專業(yè)知識(shí)水平不僅可以激勵(lì)工作人員,還提高了工作人員的整體技能水平,確保運(yùn)營的可靠性。
培養(yǎng)一個(gè)更加自信、更有能力、更有效的運(yùn)營維護(hù)人員的方法需要一個(gè)基于角色的培訓(xùn)計(jì)劃,其中包括:
- 正式的課程。
- 客觀的衡量理解。
- 不斷更新和完善的持續(xù)流程。
這一方案的客觀目標(biāo)應(yīng)該是建立在不斷提高的認(rèn)證水平的"主題專家"基礎(chǔ)上:
- 過程上的困難
- 重要性
- 性能
原則五:專注于消除錯(cuò)誤
在以往,技術(shù)人員一手拿著手電筒,另一手拿著技術(shù)手冊(cè)試圖診斷和修復(fù)設(shè)備問題,這樣的維護(hù)方法不利于快速有效的解決問題,但這代表了許多現(xiàn)有的數(shù)據(jù)中心標(biāo)準(zhǔn)的運(yùn)營和維護(hù)模式。顯然,在這種情況下,帶來人為錯(cuò)誤的機(jī)會(huì)是無數(shù)的。
有許多方法可以實(shí)現(xiàn)這個(gè)目標(biāo)。一種方法是使用將所有的程序轉(zhuǎn)換成數(shù)字清單這樣的技術(shù)解決方案。通過平板電腦和手機(jī)進(jìn)行訪問,其中包括有關(guān)危險(xiǎn)步驟的警報(bào)、訪問視頻、圖像和文檔以供現(xiàn)場參考,技術(shù)人員在執(zhí)行操作每個(gè)步驟之后,并且在進(jìn)行到下一步之前必須確認(rèn)完成,這種操作大大減少了人為錯(cuò)誤的可能性。
結(jié)語
對(duì)數(shù)據(jù)中心的運(yùn)營進(jìn)行規(guī)劃是數(shù)據(jù)中心流程的一個(gè)關(guān)鍵且經(jīng)常被忽視的因素。有效的業(yè)務(wù)流程和程序并不是嚴(yán)格遵守過去的運(yùn)營模式的結(jié)果。要為數(shù)據(jù)中心的成功運(yùn)營制定一個(gè)有效且適應(yīng)性強(qiáng)的計(jì)劃,需要采取具體的原則進(jìn)行指導(dǎo),需要IT部門全面考慮其運(yùn)營目標(biāo),以及需要實(shí)現(xiàn)這些目標(biāo)進(jìn)行努力。