解構(gòu)BMC應(yīng)用管理 BSM是基石
原創(chuàng)當(dāng)企業(yè)實(shí)現(xiàn)了IT基礎(chǔ)架構(gòu)自動(dòng)化、IT流程監(jiān)控后,他還能做什么呢?近兩年開(kāi)始,應(yīng)用管理的市場(chǎng)需求不斷升溫,企業(yè)不再只追求基礎(chǔ)架構(gòu)方面的監(jiān)控,而更多開(kāi)始往上層應(yīng)用發(fā)展,畢竟,應(yīng)用才是企業(yè)的核心業(yè)務(wù)。但是應(yīng)用管理在國(guó)內(nèi)發(fā)展成熟度還不高,很多企業(yè)沒(méi)有真正認(rèn)識(shí)到應(yīng)用管理究竟是用來(lái)做什么的?近日,記者專訪了BMC軟件北亞區(qū)***顧問(wèn)畢巍,來(lái)分享他對(duì)應(yīng)用管理的認(rèn)知以及BMC在應(yīng)用管理方面的解決方案和特色。
BMC軟件北亞區(qū)***顧問(wèn)畢巍
解讀應(yīng)用管理
應(yīng)用管理的全生命周期可以分為兩大階段,開(kāi)發(fā)測(cè)試階段和運(yùn)行維護(hù)階段,開(kāi)發(fā)測(cè)試階段包括開(kāi)發(fā)與功能測(cè)試和集成測(cè)試環(huán)節(jié),運(yùn)行維護(hù)階段要涉及應(yīng)用發(fā)布、配套基礎(chǔ)架構(gòu)變更、基礎(chǔ)監(jiān)控、應(yīng)用監(jiān)控等環(huán)節(jié)。一個(gè)應(yīng)用在功能開(kāi)發(fā)測(cè)試后,要經(jīng)過(guò)集成測(cè)試才能從開(kāi)發(fā)中心進(jìn)入到數(shù)據(jù)中心進(jìn)行發(fā)布;應(yīng)用發(fā)布完后,配套的基礎(chǔ)架構(gòu)要有相應(yīng)的變更,部署應(yīng)用的時(shí)候需要調(diào)節(jié)網(wǎng)絡(luò)、服務(wù)器等基礎(chǔ)架構(gòu),當(dāng)應(yīng)用上線后,就要進(jìn)入到應(yīng)用監(jiān)控以及與應(yīng)用相關(guān)的基礎(chǔ)架構(gòu)監(jiān)控。
應(yīng)用管理的全生命周期
2011年,調(diào)研公司Forrester發(fā)布了關(guān)于應(yīng)用管理的分析報(bào)告,其中羅列了行業(yè)內(nèi)比較常用的十種技術(shù)。用戶體驗(yàn)監(jiān)控:包括主動(dòng)式和被動(dòng)式;應(yīng)用監(jiān)控:應(yīng)用代碼診斷和優(yōu)化、應(yīng)用平臺(tái)監(jiān)控和套裝軟件監(jiān)控;應(yīng)用基礎(chǔ)架構(gòu)監(jiān)控和監(jiān)控:技術(shù)架構(gòu)監(jiān)控、數(shù)據(jù)庫(kù)監(jiān)控、中間件監(jiān)控、IaaS云環(huán)境監(jiān)控;以及儀表盤(pán)與報(bào)表。
如果將Forrester羅列的十種技術(shù)在全生命周期中有個(gè)定位的話,在開(kāi)發(fā)與功能測(cè)試階段有應(yīng)用代碼診斷和優(yōu)化,在運(yùn)行維護(hù)階段,應(yīng)用監(jiān)控包括主動(dòng)式用戶體驗(yàn)監(jiān)控、被動(dòng)式用戶體驗(yàn)監(jiān)控、應(yīng)用平臺(tái)監(jiān)控、套裝軟件監(jiān)控,基礎(chǔ)架構(gòu)運(yùn)行階段主要是基礎(chǔ)建構(gòu)監(jiān)控、數(shù)據(jù)庫(kù)監(jiān)控、中間件監(jiān)控以及IaaS云環(huán)境監(jiān)控。此外,BMC也有自己的一套應(yīng)用管理技術(shù),在Forrester的技術(shù)基礎(chǔ)之上,BMC還增加了應(yīng)用發(fā)布環(huán)節(jié)的應(yīng)用自動(dòng)化發(fā)布管理,應(yīng)用監(jiān)控階段還包括應(yīng)用日志監(jiān)控和解讀、應(yīng)用故障診斷與定位、應(yīng)用擴(kuò)容預(yù)測(cè)與管理,在配套基礎(chǔ)架構(gòu)變更環(huán)節(jié)包括配套基礎(chǔ)架構(gòu)自動(dòng)化變更管理,在運(yùn)行維護(hù)階段,還有基于應(yīng)用業(yè)務(wù)影響分析模型的綜合監(jiān)控,以及端到端的應(yīng)用運(yùn)行狀態(tài)儀表盤(pán)展示。
諸如一般典型的大型銀行,每年的應(yīng)用變更在六千次左右,當(dāng)出現(xiàn)問(wèn)題后,要做深度的應(yīng)用代碼的診斷與優(yōu)化是否可以在生產(chǎn)系統(tǒng)直接進(jìn)行呢?畢巍告訴記者,現(xiàn)在市場(chǎng)傳遞的信息比較混亂,造成理解的錯(cuò)誤。“如果出現(xiàn)錯(cuò)誤,將應(yīng)用代碼的診斷與優(yōu)化運(yùn)行在生產(chǎn)系統(tǒng)中運(yùn)行,會(huì)把整個(gè)生產(chǎn)系統(tǒng)的資源全部耗光。應(yīng)用故障診斷和定位的目的不是真正發(fā)現(xiàn)哪一端代碼出現(xiàn)問(wèn)題,而是把問(wèn)題代碼隔離開(kāi),將隔離的代碼放到開(kāi)發(fā)中心進(jìn)行錯(cuò)誤解析診斷,而后打補(bǔ)丁做修正,經(jīng)過(guò)集成測(cè)試后再發(fā)布。”
BMC應(yīng)用管理能力的特色
BMC軟件的業(yè)務(wù)服務(wù)管理 (BSM) 平臺(tái)能為各個(gè)領(lǐng)域的應(yīng)用管理產(chǎn)品提供端到端的解決方案,BSM將整個(gè)IT的管理分成四個(gè)大的領(lǐng)域:一是IT規(guī)劃和治理;二是與流程相關(guān)的需求與支持;三是與自動(dòng)化相關(guān)的部署與配置;四是運(yùn)營(yíng)與監(jiān)控,包括應(yīng)用監(jiān)控、性能監(jiān)控等。BMC以CMDB配置庫(kù)為中心,圍繞四大領(lǐng)域提供了多種相關(guān)產(chǎn)品。
BMC應(yīng)用監(jiān)控解決方案分為五大類:應(yīng)用可用性管理/應(yīng)用性能管理,應(yīng)用系統(tǒng)監(jiān)控,被動(dòng)式用戶體驗(yàn)管理,主動(dòng)式用戶體驗(yàn)管理,應(yīng)用問(wèn)題深層定位及追蹤。被動(dòng)式用戶體驗(yàn)管理可以測(cè)量應(yīng)用相應(yīng)時(shí)間、可用性和精確性;主動(dòng)式用戶體驗(yàn)管理可以實(shí)時(shí)獲取用戶使用及應(yīng)用狀況。主、被動(dòng)式用戶體驗(yàn)管理有何區(qū)別呢?畢巍認(rèn)為,被動(dòng)式用戶體驗(yàn)管理主要是截包,主動(dòng)式體驗(yàn)管理是模擬交易。BMC的被動(dòng)式監(jiān)控的機(jī)制是指在整個(gè)應(yīng)用數(shù)據(jù)流過(guò)程中,選取幾個(gè)關(guān)鍵點(diǎn)進(jìn)行應(yīng)用截包,而后作分析處理,變成儀表盤(pán),從而可以實(shí)時(shí)查看應(yīng)用情況。主動(dòng)式體驗(yàn)監(jiān)控是主動(dòng)模擬用戶業(yè)務(wù)交易的動(dòng)作,從而監(jiān)控應(yīng)用的性能以及相應(yīng)的處理時(shí)間。通過(guò)業(yè)務(wù)監(jiān)控可以更加有效了解業(yè)務(wù)服務(wù)質(zhì)量,結(jié)合系統(tǒng)監(jiān)控提高服務(wù)的穩(wěn)定性。
在數(shù)據(jù)中心里,某一個(gè)交易出現(xiàn)錯(cuò)誤后,可能會(huì)有很多告警,但究竟哪個(gè)告警是最關(guān)鍵的,哪個(gè)是最主要的問(wèn)題所在呢?BMC提供故障輔助判斷功能,幫助用戶做智能的、自動(dòng)的故障判斷,而這離不開(kāi)自動(dòng)規(guī)則學(xué)習(xí)功能,通過(guò)基于學(xué)習(xí)的規(guī)則,將出錯(cuò)的告警按照優(yōu)先級(jí)進(jìn)行排序,再結(jié)合故障診斷和定位工具來(lái)查找錯(cuò)誤的根本原因。畢巍表示,“所謂的規(guī)則自學(xué)習(xí)就是通過(guò)積累了一定時(shí)間的性能數(shù)據(jù),當(dāng)數(shù)據(jù)發(fā)展變化與歷史數(shù)據(jù)發(fā)生不匹配時(shí),就會(huì)發(fā)出預(yù)警,避免問(wèn)題擴(kuò)大。”
傳統(tǒng)的應(yīng)用發(fā)布過(guò)程會(huì)經(jīng)過(guò)研發(fā)、測(cè)試、生產(chǎn),郵件Word的交互,F(xiàn)TP的方式來(lái)傳送代碼,然后逐步推送到生產(chǎn)環(huán)境里,這一過(guò)程存在較大的壓力,根據(jù)Forrester的調(diào)研報(bào)告指出,在整個(gè)應(yīng)用發(fā)布過(guò)程中,引起應(yīng)用宕機(jī)的,40%是因?yàn)槿藶榕渲缅e(cuò)誤,30%是因?yàn)檐浖旧碣|(zhì)量,20%是因?yàn)槿笔аa(bǔ)丁。自動(dòng)化可以大大減少手工重復(fù)工作并且可以提高操作的準(zhǔn)確性,因而逐漸被業(yè)界認(rèn)可。BMC的Bladelogic應(yīng)用發(fā)布自動(dòng)化方案針對(duì)企業(yè)級(jí)應(yīng)用復(fù)雜的發(fā)布過(guò)程,對(duì)發(fā)布的對(duì)象實(shí)現(xiàn)了集中的對(duì)象化管理,同時(shí)可以配套將系統(tǒng)級(jí)的發(fā)布和應(yīng)用打包統(tǒng)一進(jìn)行應(yīng)用發(fā)布工作。
誰(shuí)需要應(yīng)用管理
機(jī)房的問(wèn)題解決了才考慮服務(wù)器的問(wèn)題,機(jī)房如果不穩(wěn)定服務(wù)器是不可能穩(wěn)定的,而那時(shí)服務(wù)器的問(wèn)題大多都是由于溫度、漏水等原因引起的,機(jī)房過(guò)關(guān)后,才會(huì)到服務(wù)器、網(wǎng)絡(luò),再往上才是應(yīng)用的監(jiān)控。
企業(yè)在進(jìn)行應(yīng)用管理前,首先要明確具體的需求,了解甲方的成熟度。第二就要進(jìn)行功能的選擇了,究竟該如何搭配呢?畢巍解釋說(shuō),“如果企業(yè)的應(yīng)用平臺(tái)有套裝軟件,就要有應(yīng)用平臺(tái)監(jiān)控和套裝軟件監(jiān)控。其次,應(yīng)用日志監(jiān)控和應(yīng)用日志數(shù)據(jù)的解讀也是必選的。主動(dòng)式、被動(dòng)式用戶體驗(yàn)監(jiān)控二選一。當(dāng)企業(yè)把基礎(chǔ)架構(gòu)監(jiān)控和應(yīng)用監(jiān)控整合后,就可以進(jìn)行故障診斷,進(jìn)而可以做應(yīng)用擴(kuò)容預(yù)測(cè)。”
應(yīng)用管理現(xiàn)在主要還集中在金融和電信行業(yè),因?yàn)檫@些行業(yè)的客戶相對(duì)成熟,基礎(chǔ)架構(gòu)相對(duì)比較完善,數(shù)據(jù)中心搭建的比較好,基礎(chǔ)架構(gòu)監(jiān)控都實(shí)現(xiàn)后,就要面對(duì)應(yīng)用管理的問(wèn)題,因此,應(yīng)用管理在金融和電信行業(yè)需求比較大。