運籌帷幄 網(wǎng)絡運維管理系統(tǒng)選型指南
隨著信息化不斷深入,信息化正在深刻地改變著我們的社會,特別是在各企業(yè)中IT對業(yè)務發(fā)展、效率提升和成本降低等的影響也日益明顯,IT建設和IT運維同時成為了提高員工工作效率的重要手段。與此同時,我們也看到隨著企業(yè)規(guī)模壯大、網(wǎng)絡設備的增多,網(wǎng)絡運維管理成為了IT部門普遍頭痛的問題,如何提高網(wǎng)絡運維的自動化,改變被動低效率手工救火式的工作狀態(tài),就成為了擺在企業(yè)CIO和管理人員面前的首要問題。為此IT168專門采訪了業(yè)界相關廠商及第三方機構,旨在為大家介紹一些業(yè)界優(yōu)秀的產(chǎn)品及目前整個網(wǎng)絡運維市場的趨勢、挑戰(zhàn)和選型建議。
回顧IT運維發(fā)展 分析國內(nèi)IT運維發(fā)展
回顧IT運維發(fā)展的歷史,有一條很清楚的主線貫穿其中--運維管理,在企業(yè)IT管理的早期,更側(cè)重于對網(wǎng)絡、硬件等設備的管理,那時的IT管理就是通過某種方式對網(wǎng)絡進行管理,使網(wǎng)絡能正常高效地運行。早期的這種IT管理是面向基礎架構的管理階段,主要的面向目標就是底層的基礎網(wǎng)絡設備?;A架構管理是對網(wǎng)絡中的底層設備進行實時、統(tǒng)一的監(jiān)控。當網(wǎng)絡中出現(xiàn)了問題或者即將出現(xiàn)問題的時候,管理系統(tǒng)向網(wǎng)絡管理者提出故障定位和報警,這樣做無疑大大方便了網(wǎng)絡管理員的工作。但是,這種系統(tǒng)對于網(wǎng)絡上運行的各種業(yè)務系統(tǒng)以及業(yè)務系統(tǒng)的用戶只能做一些簡單的管理。
隨著企業(yè)IT系統(tǒng)的日益成熟和復雜,企業(yè)的關注點已從單點管理到綜合管理角度的轉(zhuǎn)變,從關注單一網(wǎng)絡到對業(yè)務系統(tǒng)的關注。原因在于,越來越多的企業(yè)意識到,業(yè)務系統(tǒng)涉及環(huán)節(jié)逐漸增多,單一的網(wǎng)絡運維管理已經(jīng)不足以滿足管理需求,需要落實如何保障業(yè)務系統(tǒng)的各個環(huán)節(jié)。在滿足對IT資源進行統(tǒng)一管理、降低運行成本、提高突發(fā)事件應對能力、提高服務質(zhì)量和效率的基礎上,更需要保障業(yè)務系統(tǒng)的正常運行,才可以保證IT投資的價值體現(xiàn)。同時,在國內(nèi)IT 管理領域,伴隨著用戶IT規(guī)模的擴大、IT技術的發(fā)展和用戶需求的提高,原有的網(wǎng)絡管理系統(tǒng)已經(jīng)遠遠不能滿足當前的用戶需求。
在這里不得不說一下ITIL(Information Technology Infrastructure,ITIL,信息技術基礎架構庫),ITIL是用來管理信息技術 (IT) 的架構設計,研發(fā)和操作的一整套概念和思想,為企業(yè)的IT服務管理實踐提供了一個客觀、嚴謹、可量化的標準和規(guī)范,企業(yè)的IT部門和最終用戶可以根據(jù)自己的能力和需求定義自己所要求的不同服務水平,參考ITIL來規(guī)劃和制定其IT基礎架構及服務管理,從而確保IT服務管理能為企業(yè)的業(yè)務運作提供更好的支持。
國內(nèi)IT運維管理系統(tǒng)的設計都融合了ITIL理念,并根據(jù)國內(nèi)實際情況作出來合理優(yōu)化,不僅解決IT資源所面臨的種種問題,而且做到對業(yè)務系統(tǒng)有效保障,同時對企業(yè)來說,能夠理解ITIL理念并且實施的最大意義在于把IT與業(yè)務緊密地結合起來了,從而讓企業(yè)的IT投資回報最大化。

最后我們可以將IT運維管理總結為五個階段,第一階段,IT運維完全是圍繞網(wǎng)管人員展開的,所有的IT運維工作,都是由人工完成的,當IT運維人員出現(xiàn)了問題,就會全面影響企業(yè)的IT運維。第二階段,IT運維開始初步的制度化運作,人員的變化對部門的影響度降低。第三階段,IT運維完全按照制度運作,人員的變化對部門的影響已經(jīng)很小。但是,在此階段容易發(fā)生管理僵化的問題,存在共性問題是所有部門都只關注自身的目標,而在這個目標之外則缺乏足夠的關注。第四階段,企業(yè)的IT運維已經(jīng)能夠按照服務的質(zhì)量和成本來動態(tài)的調(diào)整整個資源的投入,這個時候,企業(yè)的IT運維已經(jīng)非常成熟,已經(jīng)能夠動態(tài)的幫助企業(yè)分配最合適的資源到最有價值的業(yè)務中了。此階段主要是要解決服務質(zhì)量參差不齊的問題。第五個階段,IT成為業(yè)務的一部分,IT運維已經(jīng)不僅僅是關注服務質(zhì)量和服務成本,而是根據(jù)企業(yè)的關注點,迅速調(diào)整IT部門的工作重點,甚至是引領企業(yè)最新的業(yè)務。
而從國內(nèi)目前IT運維的發(fā)展來說,國內(nèi)大部分的企業(yè)的IT運維處在第二階段到第三階段之間,少量的如金融、電信等大型企業(yè)的IT運維處于從第三階段向第四階段發(fā)展的階段,因此,總體上來看,我國IT運維發(fā)展的水平仍然較低。
運維管理系統(tǒng)市場分析
Gartner預計,中國企業(yè)IT市場的支出將從2013年的1,178億增長至2016年的1,724億,年均復合增長率達到8%,高于全球同期3%的增長率。2013年,隨著各種行業(yè)政策的利好以及產(chǎn)業(yè)技術的革新,未來IT運維管理產(chǎn)品市場的優(yōu)勝劣汰必將持續(xù),同時,隨著大數(shù)據(jù)、虛擬化、業(yè)務管理等IT運維需求的猛增,2013年也成為了IT運維管理廠商“收獲”頗豐的一年。
據(jù)榮之聯(lián)PMO項目管理部部門經(jīng)理楊明所述,“從運維管理市場產(chǎn)品份額來看,以北塔軟件為代表的第三方平臺產(chǎn)品占據(jù)市場份額約50%,以華為為代表的網(wǎng)絡廠商專業(yè)網(wǎng)絡工具占據(jù)市場份額約20%,第三方系統(tǒng)集成商開發(fā)的占據(jù)市場份額約10%,此外還有大型互聯(lián)網(wǎng)公司自主開發(fā)網(wǎng)絡運維系統(tǒng)占據(jù)市場份額約5%,其余市場份額由開源工具或其他工具占據(jù)。”
運維管理系統(tǒng)技術概述
為滿足企業(yè)用戶需求,國內(nèi)外IT管理產(chǎn)品基本上都具有三個特點,第一點是監(jiān)控功能,包括網(wǎng)絡設備性能、數(shù)據(jù)庫中間件等,大約70%以上的企業(yè)用戶都有這些需求,還有一些獨立特殊的,例如空調(diào)監(jiān)控、電力監(jiān)控、安防監(jiān)控等;第二點是預警功能,由于IT設備眾多,企業(yè)用戶不僅需要實時監(jiān)控,還需要有報警預知功能,第三方平臺都有建議參考值,但還是要求企業(yè)用戶逐漸調(diào)控震蕩,已達到最優(yōu)狀態(tài);第三點是事件觸發(fā)管理機制,IT規(guī)模大、結構復雜的時候出現(xiàn)問題的根源就存在多種可能,出現(xiàn)問題的時候系統(tǒng)自動進入事件管理、通知相關人員盡快處理,以保障業(yè)務的最低中斷。
為應對不斷變化的IT網(wǎng)絡,Gartner發(fā)布的2013年對眾多公司和組織機構具有戰(zhàn)略意義的十大技術與趨勢,關于IT運維管理的包含以下六大趨勢:
趨勢1:支撐數(shù)據(jù)大集中管理
2013年,大數(shù)據(jù)成為IT界最受關注的話題之一,大數(shù)據(jù)正在從專注于個別項目向?qū)ζ髽I(yè)戰(zhàn)略信息架構的影響上轉(zhuǎn)移,對數(shù)據(jù)量、種類、速度和復雜性的處理正迫使許多傳統(tǒng)方法需要發(fā)生改變。同時為企業(yè)內(nèi)部和運維產(chǎn)品提供商帶來前所未有的難題,大數(shù)據(jù)時代,隨著企業(yè)IT架構的不斷擴展,服務器、存儲設備的數(shù)量越來越多,網(wǎng)絡也變得更加復雜,從而給運維工作帶來了巨大的挑戰(zhàn),特別是分支機構眾多的大型企業(yè)或垂直層級較多的政府單位,為了保障良好的用戶體驗和數(shù)據(jù)時效性,運維工作顯得十分艱巨。IT監(jiān)控系統(tǒng)每分鐘要進行上萬個數(shù)據(jù)采集已非易事,而對采集上來的海量數(shù)據(jù)進行處理和分析才是更難的挑戰(zhàn)。如果數(shù)據(jù)未經(jīng)過處理,這就對運維沒有任何意義和價值。因此,在大數(shù)據(jù)集中趨勢越來越明顯的2013年,在此背景下具備實時采集和海量分析能力的IT運維管理產(chǎn)品將會成為數(shù)據(jù)分析應用的新增長點。
趨勢2:虛擬化監(jiān)控管理同等對待
在虛擬化誘人的高額回報面前,相對滯后的IT運維管理已經(jīng)讓眾多CIO熬過了艱難的2012.在虛擬化后,IT運維部門需要對新增的虛擬網(wǎng)絡、數(shù)據(jù)存儲、虛擬機、ESX/ESXi主機數(shù)量、集群對象提供一種全新的管理方式。而這種方式就是消除虛擬化主機“不可見”的特殊性,尤其是在支持邊緣應用的虛擬機和支撐核心應用的物理服務器同時存在環(huán)境中,IT運維產(chǎn)品需要具備“同等對待”的能力。很多方法可以實現(xiàn)這種管理模式,比如,在虛擬交換機和虛擬機之間仍然采用“實體連接”的方式進行管理,等等,這樣才能消除虛擬化運維的死角,才能支撐傳統(tǒng)數(shù)據(jù)中心全面升級換代至“云數(shù)據(jù)中心”.
趨勢3:存儲系統(tǒng)融入一體化監(jiān)控
大數(shù)據(jù)、虛擬化對運維人員來說如臨大敵,存儲則是所有企業(yè)面臨的另一個挑戰(zhàn)。其穩(wěn)定性、性能都是確保核心任務運行關鍵,存儲系統(tǒng)發(fā)生事故、災難往往給企業(yè)形象和業(yè)務連續(xù)性帶來極大的威脅。
趨勢4:主機監(jiān)控更加細化
在Gartner發(fā)布的2013預測中,IT操作流程自動化成為了影響數(shù)據(jù)中心發(fā)展的技術之一,而實現(xiàn)IT管理流程自動化仍是IT管理人員降低IT操作成本和復雜性的一個關鍵目標。另外,在影響數(shù)據(jù)中心的技術中配置管理數(shù)據(jù)庫(CMDB)將繼續(xù)在企業(yè)IT運營基礎設施中扮演重要的角色。這些對主機系統(tǒng)更加完備運維工具可以幫助IT運營的建立、維護、可視化和監(jiān)視邏輯應用程序或者服務拓撲管理和跨系統(tǒng)的依賴性。
“工欲善其事,必先利其器”,利用自動化的IT運維工具力爭出錯率趨近于零,可以有效減輕人工控制流程的負擔,同時也對提高業(yè)務服務質(zhì)量起到事半功倍的效果。而在主機層面的監(jiān)控只有做到精細化,便可有效的預測、預防、隔離、診斷和解決發(fā)生的問題,掌握各種系統(tǒng)資源的利用情況。另外,IT運維產(chǎn)品的發(fā)展趨勢決定了,要在企業(yè)復雜的異構網(wǎng)絡環(huán)境和系統(tǒng)面前毫不畏懼,有這種實力才能實現(xiàn)業(yè)務系統(tǒng)所依托的網(wǎng)絡平臺資源、服務器資源、應用系統(tǒng)資源、信息服務資源等進行統(tǒng)一綜合管理。
趨勢5:BSM運維產(chǎn)品認可度攀升
從IT運維管理在企業(yè)收益價值鏈的位置來看,以往的IT基礎設施管理、IT設備維護和管理、IT服務流程管理等,只是對業(yè)務發(fā)揮著間接輔助作用。而唯有IT與業(yè)務融合的創(chuàng)新管理模型,才能對用戶業(yè)務開展有直接價值,這也正是2012年眾多企業(yè)用戶對BSM理念進行了廣泛討論和最佳實踐的原因。而在廠商層面,必須將產(chǎn)品與BSM理念耦合度做到最緊密,才能幫助那些缺少IT運維項目實施經(jīng)驗企業(yè)實現(xiàn)這個終極目標。我們從更多的用戶層面上了解到,在2013年的起點處開始,許多CIO極其所帶領的團隊都希望利用BSM產(chǎn)品將業(yè)務清晰化、視圖化,并在此基礎之上才更好地執(zhí)行SLA(Service-Level Agreement,服務等級協(xié)議)在企業(yè)中的兌現(xiàn)。
趨勢6:運維產(chǎn)品緊跟企業(yè)發(fā)展步伐
IT運維管理的需求是隨著企業(yè)規(guī)模與成長速度逐步調(diào)整形成的,從技術與管理兩個維度來分析,企業(yè)IT運維管理一般可分為三個階段:IT基礎設施管理階段、綜合業(yè)務管理階段、全域集中管理階段。而在實際運維中,企業(yè)則可以通過對著三階段的了解,“對號入座”.
根據(jù)據(jù)IDC預測,2013年58%的新IT投資決策將由企業(yè)高管直接參與,而這個趨勢在過去三年里上漲了80%.那么,企業(yè)高層在規(guī)劃IT投資時,為了避免“失控”, IT運維部門就需要向決策層提供這種準確的戰(zhàn)略信息, 因此,IT運維工具必須要能提供每個分支機構的IT運維狀況,真正起到大海撈針的作用,在剔除非關鍵信息的基礎上完成決策支撐。
業(yè)界專家觀點:
對于目前的網(wǎng)絡運維市場,無論是第三方平臺產(chǎn)品還是網(wǎng)絡廠商專業(yè)工具,都在不斷發(fā)展,對于兩種產(chǎn)品的未來發(fā)展趨勢,作為網(wǎng)絡廠商的華為表示,“每種管理系統(tǒng)或者工具都有自己的定位,在企業(yè)領域,因為各個企業(yè)所在的行業(yè)業(yè)務、企業(yè)規(guī)模自身的規(guī)模大小、企業(yè)對管理的需求等方面存在明顯差異,所以當前市場上存在各種管理系統(tǒng)和工具應該說是合理的。”
但作為第三方平臺化代表北塔軟件產(chǎn)品副總監(jiān)王南卻表示,“專業(yè)工具是解決用戶的某一個技術問題的,不過隨著網(wǎng)絡技術的發(fā)展和更新,新的技術會不斷的涌現(xiàn),專業(yè)工具所面臨的技術更替也較頻繁。當過去的網(wǎng)絡技術問題不再重要,舊的專業(yè)工具就會變得沒有價值,而被市場所淘汰。而平臺工具與專業(yè)工具關心的方向不一樣,專業(yè)工具是解決用戶的某一個技術問題,而平臺工具是觀察用戶整體IT運維環(huán)境的狀況”.
同為第三方平臺的蟻巡網(wǎng)絡科技總經(jīng)理張明表示,“IT運維管理市場是一個非常廣闊、且仍然在高速發(fā)展的市場。這樣的市場必然會演化為眾多不同的細分市場。無論是網(wǎng)絡廠商自己的工具,還是第三方廠商工具、開源運維工具,只要在市場中找準自己的定位,就可以良好的生存下去,且都會有良好的發(fā)展前景。”
作為網(wǎng)絡廠商代表銳捷網(wǎng)絡IT管理事業(yè)部咨詢顧問李莊表示,“在當前的運維管理市場中,國內(nèi)、國外產(chǎn)品很多,各個網(wǎng)絡設備廠商也有自己配套的管理軟件,再加上眾多大大小小的開源產(chǎn)品,這個市場可謂是百家爭鳴。不過每家產(chǎn)品基于自己不同的定位和方向,存在很大差異。目前也沒有統(tǒng)一的標準告訴大家運維管理產(chǎn)品該做成什么樣。因此,在這個市場中,誰能夠更加貼近用戶,滿足用戶應用需求,誰就能成為這個市場的領導者。”
同樣楊明也表示,“從橫向看企業(yè)運維管理市場,不僅有北塔軟件、摩卡軟件等第三方專業(yè)平臺產(chǎn)品,還有網(wǎng)絡廠商推出的專業(yè)網(wǎng)絡管理工具,由于運維管理市場需求不斷加大,所以說網(wǎng)絡運維與管理的市場發(fā)展空間依舊還很大。”
企業(yè)IT運維管理選型建議
華為建議:企業(yè)在選擇運維和管理工具時,首先要考慮當前企業(yè)的IT系統(tǒng)處于何種水平,在IT系統(tǒng)建設初期,設備數(shù)量少,問題也少,這時簡單的用幾個人就可以解決。隨著IT系統(tǒng)的增多,各種關聯(lián)的系統(tǒng),復雜度成幾何量級增長時,就需要陸續(xù)引入管理系統(tǒng)以保障IT系統(tǒng)能夠正常的提供業(yè)務。應該從以下幾個角度考慮如何選擇和建設運維管理系統(tǒng):
首先應該考慮集中的監(jiān)控功能,快速發(fā)現(xiàn)問題,并且進行跟蹤處理,保障每個故障都獲得根本解決,以減輕IT系統(tǒng)故障對企業(yè)業(yè)務的影響;
其次應該是快速的診斷和排障功能,在發(fā)現(xiàn)問題的基礎上,快速找到問題根源,并且及時將問題解決;
然后就應該IT考慮長期的優(yōu)化和建設的規(guī)劃,持續(xù)降低IT系統(tǒng)的故障率,提高IT系統(tǒng)的使用率。
H3C建議:網(wǎng)絡運維管理見仁見智,各家關注點各有不同。但是必須注重以下三點:
快:發(fā)現(xiàn)設備速度快,打開速度快,故障定位速度快。
準:在客戶的復雜網(wǎng)絡環(huán)境中拓撲發(fā)現(xiàn)準確,告警上報準確。
穩(wěn):系統(tǒng)長時間穩(wěn)定運行。
如果管理軟件不能達到以上基本要求,它的其他管理就缺乏堅實的根基,難以實際應用。
銳捷網(wǎng)絡建議:在選擇運維管理工具時,除了要看運維管理工具是否可以對企業(yè)內(nèi)使用的IT資源進行全面的監(jiān)控管理,同時還要關注是否基于業(yè)務視角的管理,IT服務于業(yè)務,避免管理層面與業(yè)務相脫離。另外由于大中型企業(yè)的IT規(guī)模較大,甚至有可能是跨地域范圍的,所以在選型時,也要關注一下運維管理工具的架構和性能是否可以監(jiān)控大規(guī)模網(wǎng)絡節(jié)點,能否滿足企業(yè)中分級、分權限管理的需求等等。
蟻巡網(wǎng)絡建議:還是要根據(jù)自身的實際情況來選擇,一般來說,運維工具可以分為運維監(jiān)控工具、運維流程管理工具、廠商專業(yè)工具等幾類。
當企業(yè)的IT運維工程師不是很多時(6-7人以下),可以無需引入運維流程管理工具,而用OA、郵件等輔助工具可以達到類似的效果。目前市面上沒有很好的開源的運維流程管理工具,當必須要引入運維流程管理工具時,使用國產(chǎn)化的商業(yè)工具幾乎是必然的選擇。
運維監(jiān)控工具幾乎是每個企業(yè)都必須的,它可以在達到較高運維質(zhì)量的同時基本不增加運維的人力成本。開源的運維監(jiān)控工具如Nagios等更適用于精通Linux、很專業(yè)的運維工程師。選擇商業(yè)工具時,可以根據(jù)企業(yè)的具體情況和產(chǎn)品的特色來決定。比如如果需要監(jiān)控一些比較新的開源軟件,蟻巡運維平臺幾乎是唯一的選擇。
值得注意的是,由于目前市面上的免費的開源運維工具完善程度都不是很高,所以在人員技術能力一般的情況下采用開源運維工具并不能節(jié)約成本,反而可能會因?qū)嵤碗s和無法得到技術支持而給企業(yè)的運維帶來困擾。
楊明最后指出,“企業(yè)選擇網(wǎng)絡運維與管理來說,一般100臺交換機企業(yè)來說,若是產(chǎn)品比較單一,建議選擇廠商專屬工具,一般200臺到300臺交換機的企業(yè)來說,建議選擇第三方平臺管理產(chǎn)品。優(yōu)秀網(wǎng)絡運維和管理產(chǎn)品包括:華為eseSight、華三iMC、銳捷網(wǎng)絡RIIL、北塔軟件、摩卡軟件、蟻巡平臺等等。”