網(wǎng)絡(luò)故障診斷:網(wǎng)絡(luò)延時的診斷和分析
故障現(xiàn)象
1、內(nèi)部關(guān)鍵業(yè)務(wù)響應(yīng)很慢,信息處理不流暢;
2、服務(wù)器和交換機(jī)的CPU和內(nèi)存利用率低;
3、無法定位查找到網(wǎng)絡(luò)響應(yīng)慢的原因;
網(wǎng)絡(luò)環(huán)境
1、一臺cisco3560交換機(jī);
2、局域網(wǎng)內(nèi)有8臺服務(wù)器,其中4臺是UNIX系統(tǒng),另外4臺是Windows 2003系統(tǒng);
現(xiàn)場診斷
首先做Ping 測試。UNIX系統(tǒng)主機(jī)互ping的比較穩(wěn)定,Ping值均小于1MS。而UNIX系統(tǒng)主機(jī)去Ping Windows系統(tǒng)主機(jī)的Ping值經(jīng)常會出現(xiàn)9-15MS的延時。Windows系統(tǒng)主機(jī)之間互Ping值很不穩(wěn)定,在1MS到15MS之間跳躍性出現(xiàn)。
現(xiàn)象分析
該網(wǎng)絡(luò)結(jié)構(gòu)簡單清晰,服務(wù)器和交換機(jī)的性能良好。網(wǎng)絡(luò)內(nèi)經(jīng)常出現(xiàn)大于1MS的延時將會影響到整個網(wǎng)絡(luò)正常運行,對關(guān)鍵業(yè)務(wù)的運行造成影響,要解決該問題首先要找出延時發(fā)生的原因。
眾所周知,一次網(wǎng)絡(luò)交易處理過程:由客戶端發(fā)起連接,通過網(wǎng)絡(luò)轉(zhuǎn)發(fā)到服務(wù)端,服務(wù)端處理后再返回客戶端的。因此,在整個交易過程中的時延可以由三個時間來決定,客戶端響應(yīng)時間(t1)網(wǎng)絡(luò)傳輸所用時間(t2)服務(wù)端響應(yīng)時間(t3)。
現(xiàn)場測試發(fā)現(xiàn)UNIX系統(tǒng)主機(jī)之間ping值穩(wěn)定的小于1MS,而Windows系統(tǒng)主機(jī)之間、或與UNIX系統(tǒng)主機(jī)Ping時出現(xiàn)較大延時。這就表明UNIX系統(tǒng)主機(jī)之間通信是良好的,但是與Windows系統(tǒng)主機(jī)通信、或Windows系統(tǒng)主機(jī)之間互相通訊過程中才會有延時的出現(xiàn)。因此,我們推斷是Windows系統(tǒng)主機(jī)響應(yīng)較慢。為了驗證以上推斷,我們用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行診斷。
利用科來網(wǎng)絡(luò)通訊分析系統(tǒng)進(jìn)行網(wǎng)絡(luò)診斷
(利用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行抓包分析)
首先,打開科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009,配置上IP為 190.15.xxx.200,此主機(jī)做為ping發(fā)起者,向一臺IP地址為190.15.xxx.218的Windows系統(tǒng)主機(jī)進(jìn)行Ping測試。將該Windows系統(tǒng)主機(jī)的交換機(jī)端口做一個鏡像,鏡像收發(fā)的流量。然后,用190.15.xxx.200主機(jī)去Ping 190.15.xxx.218,用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行13分鐘的抓包。
抓包過程中我們發(fā)現(xiàn),190.15.xxx.200主機(jī)在Ping 190.15.xxx.218主機(jī)的時候會產(chǎn)生9MS的延時,而且頻率較頻繁。而190.15.xxx.200主機(jī)Ping UNIX系統(tǒng)主機(jī)則都是小于1MS的延時。另外,在鏡像口收到的icmp response 不很穩(wěn)定,而且是1MS與9MS交替出現(xiàn),表明網(wǎng)絡(luò)是不停在抖動。
鏡像的位置是Windows系統(tǒng)主機(jī)的SW端口,因此在echo response出現(xiàn)的延時可以看做是服務(wù)端響應(yīng)延時,而這個響應(yīng)經(jīng)常會出現(xiàn)9MS的時延。由此驗證:該網(wǎng)絡(luò)時延由win主機(jī)的響應(yīng)慢造成。
然后,登錄到190.15.xxx.218主機(jī),發(fā)現(xiàn)該主機(jī)運行了較多的程序,內(nèi)存和CPU利用較高。我們對該主機(jī)進(jìn)行減壓,在關(guān)閉一款殺毒軟件的進(jìn)程后發(fā)現(xiàn)網(wǎng)絡(luò)延時不見了,而完全卸載該殺毒軟件后,網(wǎng)絡(luò)ping值全部穩(wěn)定在小于1MS下。
診斷結(jié)果
通過科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009的抓包診斷,困擾一個月的網(wǎng)絡(luò)延時問題終于有了結(jié)果。原來該局域網(wǎng)此前一直受蠕蟲病毒困擾,為了進(jìn)行網(wǎng)絡(luò)安全防御,給每個Windows系統(tǒng)主機(jī)裝了一款殺毒軟件,并且該殺毒軟件默認(rèn)開啟了入侵檢測功能。該功能會對每個到達(dá)服務(wù)器的數(shù)據(jù)包進(jìn)行檢測后再交給相應(yīng)程序處理,而這個檢查過程是很消耗時間的,所以產(chǎn)生了9MS的延時。
專業(yè)網(wǎng)絡(luò)故障診斷服務(wù)簡介
網(wǎng)絡(luò)故障診斷服務(wù)是由科來軟件專業(yè)網(wǎng)絡(luò)分析技術(shù)人員提供,利用專業(yè)的網(wǎng)絡(luò)分析儀器部署在用戶指定網(wǎng)段,通過網(wǎng)絡(luò)數(shù)據(jù)包級的分析,快速定位分析引起網(wǎng)絡(luò)故障的原因,并提供相關(guān)解決問題建議,從而幫助用戶快速解決問題。
網(wǎng)絡(luò)故障診斷服務(wù)旨在為客戶提供更加人性化的服務(wù),幫助網(wǎng)絡(luò)負(fù)責(zé)人解決切實的網(wǎng)絡(luò)問題,優(yōu)化管理網(wǎng)絡(luò),打造健康安全穩(wěn)定的網(wǎng)絡(luò)服務(wù)。