網絡丟包故障處理方案
一、網絡丟包的定位與處理
出現(xiàn)網絡丟包現(xiàn)象時,第一步需要確定丟包的網絡位置,其次是確定丟包的故障原因,然后依據定位的故障原因再進行解決。定位流程大致如圖8-1。
圖8-1 網絡丟包的定位與處理
本文采用某園區(qū)的丟包故障現(xiàn)象為例,給出部署了交換機的網絡發(fā)生丟包的定位與處理方法。
例如,某園區(qū)部署的網絡如圖8-2上連接用戶A、用戶B和用戶C上連接入交換機Switch_3和Switch_2,用戶D和用戶E上連接入交換機Switch_4,之后共同接入到核心交換機Switch_1,并通過防火墻連接到Internet。
圖8-2 某園區(qū)部署網絡組網圖
用戶A反饋上網很慢,有時甚至打不開網頁,而其他用戶沒有異常反饋。此時在用戶A的PC上直接Ping公網地址有丟包。
二、確認發(fā)生網絡丟包
網絡丟包的故障現(xiàn)象通常表現(xiàn)為:
用戶上網時:
- 網絡速度不穩(wěn)定,打開網頁的速度特別的慢,有時候還會出現(xiàn)網頁部分內容或是整個頁面無法顯示的問題;
- 觀看視頻業(yè)務時有馬賽克或花屏等卡頓現(xiàn)象;
- QQ等即時通訊工具等頻繁掉線或提示登錄超時;
- 下載文件速度慢;
交換機工作時:
- 在交換機上執(zhí)行Ping操作,對網絡進行連通性測試,提示超時;
- 端口無法正常轉發(fā)數據;
- 管理用戶登錄交換機,提示超時;
- 業(yè)務經常中斷;
這些故障現(xiàn)象幾乎都跟網絡丟包有關。如果現(xiàn)網當中出現(xiàn)以上故障現(xiàn)象中的一種或多種,基本可以確認發(fā)生了網絡丟包。
三、排查產生丟包現(xiàn)象的PC
排查產生丟包現(xiàn)象的PC本身問題。
如PC的網卡是否正常、PC連接設備的線纜是否正常都有可能造成設備丟包。解決方法:斷開網絡后給PC查殺病毒、檢查網線重裝操作系統(tǒng)、檢查網卡等。
確認PC正常后,如果故障仍然存在,繼續(xù)執(zhí)行下一步。
四、檢查接口物理狀態(tài)是否為Down
一般來說,接口的物理狀態(tài)Down,或接口雙工模式或速率協(xié)商模式與對端不一致,會造成接口的狀態(tài)異常。在設備上執(zhí)行:
display interface interface-type interface-number命令查看接口運行狀態(tài)是否正常。
這里以檢查Switch_3的GE1/0/2為例。
<HUAWEI> display interface gigabitethernet 1/0/2
GigabitEthernet1/0/2 current state : DOWN //接口當前物理狀態(tài)
Line protocol current state : DOWN
Description:
Switch Port, Link-type : access(negotiated),
PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475
Last physical up time : 2016-08-10 21:09:51 Last physical down time : 2013-08-10 21:10:51
Current system time: 2016-08-10 21:15:06
Port Mode: COMMON FIBER //接口工作模式。COMMON COPPER表示此接口為電接口;COMMON FIBER表示此接口為光接口
Speed : 1000, Loopback: NONE //接口速率、環(huán)回狀態(tài),鏈路兩端需要保持一致
Duplex: FULL, Negotiation: ENABLE //接口雙工模式及自協(xié)商狀態(tài),鏈路兩端需要保持一致
---- More ----
- 輸出信息顯示“current state : UP”,表明接口的運行狀態(tài)正常。請?zhí)^本節(jié),參考下一節(jié)進行定位與處理。
- 輸出信息顯示“current state : Administratively down”,表示接口被人為Shutdown。
請在系統(tǒng)視圖下執(zhí)行interface interface-type interface-number進入故障接口視圖,然后執(zhí)行display this命令查看接口是否執(zhí)行了shutdown操作,如果是請在接口下執(zhí)行undo shutdown命令。
- 輸出信息顯示“current state : DOWN”,則需要查看接口的協(xié)商狀態(tài)、速率、雙工模式以及網線適應方式是否鏈路兩端保持一致。分別在鏈路兩端的設備執(zhí)行display interface命令查看以上信息,如表8-1所示。
表8-1 檢查鏈路兩端的設備接口雙工、速率、協(xié)商模式
輸出信息顯示“current state : ERROR DOWN (down-cause)”,表示接口由于錯誤事件而被Shutdown,需要根據down-cause具體字段信息排查故障。
五、檢查接口入方向是否存在CRC校驗錯誤
檢查報文經過的物理端口是否存在CRC校驗錯誤,且錯誤計數是否在不斷增長。如果輸出信息顯示字段“CRC”有計數,且重復執(zhí)行命令發(fā)現(xiàn)計數在不斷增長,說明端口接收到了CRC錯誤報文,即存在CRC校驗錯誤,說明是由于物理鏈路或者設備問題導致的錯包 。
六、檢查接口出方向是否存在Discard計數
檢查端口是否存在Discard丟包計數。
在任意視圖執(zhí)行命令display interface interface-type interface-number,或在接口視圖執(zhí)行命令display this interface,查看設備連接用戶側端口出方向報文計數,存在Discard丟包計數則說明端口曾經存在擁塞。在業(yè)務受到影響時,觀察該Discard是否增加。如果不增加,則業(yè)務影響與Discard丟包無關。
七、檢查是否存在環(huán)路
這是最容易造成丟包現(xiàn)象的因素,并且具有比較強的隱蔽性,例如在較大型的網絡環(huán)境中,管理員很容易把交換機之間的端口連接錯誤,從而引起網絡環(huán)路,導致丟包。觀察是否出現(xiàn)如下環(huán)路相關的現(xiàn)象。網絡出現(xiàn)環(huán)路后,除了產生丟包現(xiàn)象,一般還有如下現(xiàn)象產生:
- 執(zhí)行display interface brief | include up命令,查看所有Up接口下的流量,存在環(huán)路的接口上InUti和OutUti兩個計數會逐步增加,甚至接近100%,遠遠超過業(yè)務流量。
- 使用display interface命令查看該接口統(tǒng)計信息時,發(fā)現(xiàn)接口收到大量廣播報文。
- 設備上發(fā)生環(huán)路的VLAN的接口指示燈頻繁閃爍。
- 設備CPU占用率超過80%