NEC ExpressCluster化解中國(guó)電信IT之憂(yōu)
越是跟生活息息相關(guān)的業(yè)務(wù),人民對(duì)客戶(hù)體驗(yàn)的要求越高,對(duì)出現(xiàn)故障的容忍度越低。在某種程度上說(shuō),未來(lái)電信運(yùn)營(yíng)商取勝的法則不再是電信資源,而是服務(wù)和客戶(hù)忠誠(chéng)度,隨著企業(yè)規(guī)模的擴(kuò)大,業(yè)務(wù)類(lèi)型日趨復(fù)雜,其運(yùn)營(yíng)過(guò)程對(duì)信息化依賴(lài)程度也日漸加深。電信網(wǎng)絡(luò)不容許存在任何單點(diǎn)故障的隱患。
客戶(hù)忠誠(chéng)度取決于什么?產(chǎn)品和商業(yè)模式雖然是最基礎(chǔ)的需求,但是未來(lái)的服務(wù)和客戶(hù)體驗(yàn),絕對(duì)是超越產(chǎn)品本身的決定性因素。三大通信巨頭的中國(guó)電信,就首當(dāng)其沖的面臨著這一重大問(wèn)題。
隨著企業(yè)規(guī)模的擴(kuò)大,業(yè)務(wù)類(lèi)型日趨復(fù)雜,中國(guó)電信的運(yùn)營(yíng)過(guò)程對(duì)信息化依賴(lài)程度也日漸加深。這個(gè)中國(guó)的大型國(guó)有通信公司,每次IT系統(tǒng)的升級(jí)改造都是天價(jià)的投入,只為了系統(tǒng)再穩(wěn)定一點(diǎn)點(diǎn),業(yè)務(wù)反應(yīng)再迅捷一點(diǎn)點(diǎn)。系統(tǒng)穩(wěn)定和信息安全重如泰山,不論是主機(jī)內(nèi)存、硬盤(pán)、CPU還是系統(tǒng)和應(yīng)用的一絲一毫隱患,都會(huì)對(duì)電信業(yè)造成致命危機(jī)。
電信轉(zhuǎn)型之困 ——如何建立穩(wěn)定連續(xù)的IT架構(gòu)
電信網(wǎng)絡(luò)不容許存在任何單點(diǎn)故障的隱患,而就中國(guó)電信本身的發(fā)展而言,目前阻礙通信網(wǎng)絡(luò)中的網(wǎng)絡(luò)系統(tǒng)的幾大障礙,包括有主機(jī)內(nèi)存的損壞,主機(jī)硬盤(pán)的損壞,主機(jī)CPU的損壞以及主機(jī)系統(tǒng)受病毒影響而導(dǎo)致宕機(jī)。從這四點(diǎn)來(lái)看,中國(guó)電信,為了維持系統(tǒng)穩(wěn)定性,減少業(yè)務(wù)中斷風(fēng)險(xiǎn),打造雙機(jī)互備的共享型集群架構(gòu)的高可用性方案勢(shì)在必行。
從2008年開(kāi)始,中國(guó)電信在不同的部門(mén)中和不同的產(chǎn)品線上前前后后對(duì)這類(lèi)雙機(jī)互備解決方案做了近2年多嚴(yán)格測(cè)試,基于兩年來(lái)的通力配合效果顯著,在2010年下半年,中國(guó)電信與NEC達(dá)成了合作,決定采用ExpressCluster解決方案來(lái)保護(hù)核心網(wǎng)的網(wǎng)管系統(tǒng),這是在系統(tǒng)連續(xù)性上取得的一個(gè)重要突破,有別于傳統(tǒng)的雙機(jī)或多機(jī)熱備方案必須通過(guò)磁盤(pán)整列共享數(shù)據(jù)的傳統(tǒng)模式。IT系統(tǒng)從原先高成本的人工運(yùn)營(yíng)方式向自動(dòng)化、穩(wěn)定性更高的容災(zāi)運(yùn)維模式發(fā)展。
ExpressCluster X的以下特點(diǎn)受到中國(guó)電信的青睞:
1. 支持最多32個(gè)節(jié)點(diǎn)的集群,這樣可以充分利用服務(wù)器資源。
2. 基于Web的遠(yuǎn)程監(jiān)視能力,能夠方便地對(duì)服務(wù)器集群進(jìn)行管理。
3. 能夠在兩臺(tái)服務(wù)器之間做數(shù)據(jù)鏡像,實(shí)時(shí)保護(hù)網(wǎng)管和oracle應(yīng)用,搭建成Active-Standby的熱備結(jié)構(gòu),通過(guò)高可用集群軟件ExpressCluster X實(shí)時(shí)監(jiān)控服務(wù)器運(yùn)行環(huán)境。
4. 一旦發(fā)生故障,數(shù)據(jù)庫(kù)可以在ExpressCluster X的控制下自動(dòng)切換到備機(jī)運(yùn)行,避免故障引起的系統(tǒng)停機(jī)。
5. 在發(fā)生下列故障時(shí)可以自動(dòng)切換服務(wù)器:服務(wù)器關(guān)機(jī)/掉電、OS死機(jī)/掛起、存儲(chǔ)I/O異常、應(yīng)用程序或oracle服務(wù)停止、網(wǎng)卡異?;蚓W(wǎng)絡(luò)中斷 、ExpressCluster X自身進(jìn)程異常、特定故障(用戶(hù)自定義監(jiān)控程序)。

通過(guò)磁盤(pán)鏡像技術(shù),中國(guó)電信核心業(yè)務(wù)系統(tǒng)的高可用性級(jí)別達(dá)到99.99+%;保證雙機(jī)或多機(jī)系統(tǒng)中的所有節(jié)點(diǎn)數(shù)據(jù)完全同步,避免了宕機(jī)之后的巨額損失;這種數(shù)據(jù)共享的模式在減少磁盤(pán)整列采購(gòu)成本的同時(shí),降低了中國(guó)電信整個(gè)系統(tǒng)的用電功耗,節(jié)省了機(jī)房占地面積,大大提高系統(tǒng)集成度,非常符合當(dāng)前運(yùn)營(yíng)商“綠色運(yùn)維”的環(huán)保理念。