科來:能源行業(yè)倉庫管理系統(tǒng)故障分析
概述
當用戶發(fā)現企業(yè)內某些應用系統(tǒng)故障時,多數時候***反應就是網絡出現了故障。網絡管理人員通過常規(guī)的手段又不能找到證明網絡正常的證據,也不能定位應用系統(tǒng)故障的原因,這時就需要用到網絡分析類的產品,對鏈路及應用進行長期監(jiān)控,完整還原故障數據,能夠最快的分析出網絡及應用的故障。
科來回溯分析系統(tǒng)能夠透視網絡流量、分析完整應用會話,從而快速判斷應用故障的根本原因。以下就是通過科來回溯分析系統(tǒng)快速定位業(yè)務系統(tǒng)故障的案例。
案例分析
某能源集團倉庫管理系統(tǒng)對整個倉儲環(huán)節(jié)實施全過程控制管理,倉儲在企業(yè)的整個供應鏈中起著至關重要的作用, 但是廠區(qū)的內多個用戶能夠通過客戶端打開倉儲管理系統(tǒng)時能夠正常登陸,但在進行查詢庫存量等操作時經常出現“卡死“狀態(tài)。嚴重的影響了工作效率。
網絡管理人員通過分析用戶的操作方式、查看防火墻策略、查看交換機工作狀態(tài)、更換出現故障的多個用戶線路等多種常規(guī)方法,歷時1個多月的時間,最終還是未能確定問題原因。
我們通過在用戶接入交換機上部署科來網絡回溯分析系統(tǒng),實時抓取用戶訪問倉儲管理系統(tǒng)的流量,分析可能的故障原因。
如上圖,可以說明網絡傳輸效率很好。數據傳輸過程數據傳送也十分迅速,不存在大量丟包的問題。
如上圖,我們定位到發(fā)生問題的TCP會話,發(fā)現在服務器向客戶端發(fā)送完數據之后,客戶端立即向服務器端發(fā)送了RST(重置)數據包,中斷了TCP會話。
至此我們基本可以判斷倉庫管理系統(tǒng)故障主要是由客戶端的異常中斷造成的。
找到問題的根源后,我們找到了經常出現問題的幾臺用戶PC,通過完全刪除客戶端程序后重新下載安裝客戶端的方法,徹底解決了倉庫管理系統(tǒng)的的故障現象。
案例總結
由于業(yè)務系統(tǒng)情況復雜,可能出現問題的節(jié)點較多,使用常規(guī)分析手段不能夠快速的找到問題根源,同時增加了很多排障的時間及人力成本。但通過上述案例可以看出,該應用問題困擾了用戶一個月的時間,但通過部署科來網絡回溯分析系統(tǒng)只用了短短幾分鐘的時間就能夠快速找到問題根源,解決了用戶的燃眉之急。