藍(lán)汛張?zhí)焓鹤詣?dòng)化運(yùn)維核心是戰(zhàn)略 工具則是武器
云計(jì)算與虛擬化在企業(yè)中不斷落地,它們?cè)谔嵘齀T資源利用率的同時(shí),也增加了IT系統(tǒng)的復(fù)雜度,加大了運(yùn)維難度和運(yùn)維成本,降低了運(yùn)維效率。這基本上成了所有企業(yè)IT部門必須直面的難題。如今,越來(lái)越多的企業(yè)IT部門開始升級(jí)運(yùn)維戰(zhàn)略,從傳統(tǒng)IT運(yùn)維向云運(yùn)維、自動(dòng)化運(yùn)維過度。
那么,什么才是自動(dòng)化運(yùn)維的關(guān)鍵?
在剛剛結(jié)束的2016年可信云服務(wù)性能與運(yùn)維論壇,北京藍(lán)汛通信技術(shù)有限責(zé)任公司云中心運(yùn)維總經(jīng)理張?zhí)焓硎荆?ldquo;自動(dòng)化運(yùn)維可以解讀成將多個(gè)可獨(dú)立運(yùn)行的模塊,根據(jù)業(yè)務(wù)需求,從邏輯上組成一個(gè)業(yè)務(wù)系統(tǒng)的思路。而其核心則是戰(zhàn)略性思維和高效的工具。”
張?zhí)焓J(rèn)為,傳統(tǒng)IT運(yùn)維都是在IT故障發(fā)生以后,由運(yùn)維人員采取相應(yīng)措施,這種運(yùn)維管理方式有時(shí)候讓運(yùn)維部門很頭疼。首先是運(yùn)維人員被動(dòng),效率低;其次,運(yùn)維人員缺乏一套高效運(yùn)維機(jī)制。目前很多企業(yè)在IT運(yùn)維管理過程當(dāng)中,都缺少一些自動(dòng)化管理模式,也沒有明確的角色定義和責(zé)任劃分,使得一些問題出現(xiàn)后,很難快速準(zhǔn)確的找到問題發(fā)生的根本原因。發(fā)生問題時(shí)不能及時(shí)的找到一些相應(yīng)的人修復(fù)和處理問題,或者在問題發(fā)現(xiàn)以后,沒有流程化的故障處理機(jī)制。在處理問題的時(shí)候,也沒有進(jìn)行全面的分析,無(wú)規(guī)范化的解決方案;第三,缺乏高效的IT運(yùn)維技術(shù)工具。隨著信息化建設(shè)深入,企業(yè)IT系統(tǒng)也是日趨復(fù)雜,越聚越多的網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、運(yùn)維系統(tǒng),讓IT人員很難從容應(yīng)對(duì),即使加班加點(diǎn)部署管理,也會(huì)因?yàn)槌霈F(xiàn)一些設(shè)備故障,而導(dǎo)致業(yè)務(wù)的中斷,嚴(yán)重影響了企業(yè)的正常運(yùn)轉(zhuǎn)。出現(xiàn)這些問題的原因,是由于企業(yè)缺乏高效IT運(yùn)維工具,沒有IT運(yùn)維技術(shù)工具做支持的話,故障也很難得到準(zhǔn)確及時(shí)的處理。
“工欲善其事,必先利其器“解決傳統(tǒng)IT的難點(diǎn)就是需要有戰(zhàn)略性思維思考自動(dòng)化運(yùn)維,并且有高效的工具進(jìn)行輔助。眾所周知,自動(dòng)化運(yùn)維的愿景就是如何讓多個(gè)系統(tǒng)之間以***的方式實(shí)現(xiàn)聯(lián)動(dòng),自動(dòng)化運(yùn)維的目的,就是提升IT運(yùn)維的質(zhì)量,降低成本。而沒有好的工具,很難實(shí)現(xiàn)自動(dòng)化運(yùn)維。例如傳統(tǒng)的的玉米豐收是靠人工一點(diǎn)一滴去割玉米、剝玉米等等經(jīng)歷幾個(gè)過程之后,才會(huì)將玉米田里的玉米變成玉米粒,而高效的玉米收割可以采用玉米直收機(jī),將玉米直接收割、剝皮、切碎、回填,極大地提高了玉米的收割效率。這其中玉米收割機(jī)這一高效工具在實(shí)現(xiàn)自動(dòng)化中起到關(guān)鍵的作用。
基于這一戰(zhàn)略思想,藍(lán)汛在自動(dòng)化運(yùn)維取得突出成效。藍(lán)汛成立于1998年,2010年在美國(guó)納斯達(dá)克上市,是中國(guó)CDN行業(yè)在美國(guó)上市的***家云服務(wù)提供商。截止到目前,藍(lán)汛云共服務(wù)客戶數(shù)量800余家,包括政企、游戲、電商等多個(gè)行業(yè)。這些客戶的業(yè)務(wù)量是上千臺(tái)服務(wù)器所支撐,如此規(guī)模的業(yè)務(wù)量,如果單由IT人員人工運(yùn)營(yíng)的話,很費(fèi)時(shí)費(fèi)力,為了保證業(yè)務(wù)可持續(xù)性,藍(lán)汛云引入了自動(dòng)化運(yùn)維系統(tǒng)。
藍(lán)汛運(yùn)維自動(dòng)化架構(gòu)包括監(jiān)控系統(tǒng)、調(diào)動(dòng)系統(tǒng)、自動(dòng)化配置系統(tǒng)、信息展示系統(tǒng)等。監(jiān)控系統(tǒng)從四個(gè)方面對(duì)整套系統(tǒng)做了監(jiān)控,包括物理硬件、虛擬化業(yè)務(wù)、業(yè)務(wù)系統(tǒng)應(yīng)用;調(diào)度系統(tǒng)就是起了承上啟下的作用,一個(gè)是向數(shù)據(jù)庫(kù)和自動(dòng)化配置系統(tǒng)傳遞需求,二是向監(jiān)控系統(tǒng)反饋需求,信息數(shù)據(jù)庫(kù)中儲(chǔ)存了一些與運(yùn)維相關(guān)的信息;自動(dòng)化配置系統(tǒng)是一個(gè)需求的執(zhí)行過程,業(yè)務(wù)系統(tǒng)整套云業(yè)務(wù)所使用的底層應(yīng)用系統(tǒng)和管理系統(tǒng);信息展示系統(tǒng)是整套自動(dòng)化運(yùn)維的展示界面,展示的是所有與自動(dòng)化運(yùn)維系統(tǒng)相關(guān)的信息,包括用戶的資源使用情況等等。
正是這樣的戰(zhàn)略思想幫助藍(lán)汛運(yùn)維系統(tǒng)實(shí)現(xiàn)了自動(dòng)化修復(fù)功能,能夠自我檢測(cè),發(fā)現(xiàn)問題以后,實(shí)現(xiàn)自我修復(fù);一鍵式自動(dòng)化操作,讓同一個(gè)運(yùn)維團(tuán)隊(duì)可以同時(shí)維護(hù)多個(gè)系統(tǒng)和產(chǎn)品,真正實(shí)現(xiàn)低成本運(yùn)維