撥開迷霧 解惑間歇性斷網(wǎng)故障
無論多么大規(guī)模的局域網(wǎng)網(wǎng)絡(luò),遇到這種或那種稀奇古怪的網(wǎng)絡(luò)故障是不可避免的事情,其中最讓單位網(wǎng)管員感覺麻煩的就是Internet網(wǎng)絡(luò)訪問的間歇性中斷了,畢竟隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展以及逐步成熟,很多單位的員工特別是從事網(wǎng)絡(luò)服務(wù)單位的員工幾乎已經(jīng)到了一時一刻也無法離開網(wǎng)絡(luò)的地步了。要是單位局域網(wǎng)與Internet網(wǎng)絡(luò)的連接頻繁發(fā)生中斷的話,那么許多單位的員工基本上就將無法正常開展工作了。最近筆者所在單位的局域網(wǎng)曾經(jīng)遭受過這樣一則離奇的歇性斷網(wǎng)故障,現(xiàn)在筆者就將處理該網(wǎng)絡(luò)故障的詳細過程貢獻出來和大家分享,希望大家能夠從中受到一點啟發(fā)!
故障回放
筆者單位所在的局域網(wǎng)網(wǎng)絡(luò)規(guī)模不是很大,所有工作站數(shù)量加起來總共不超過30臺,這些工作站全部連接到二層交換機上,寬帶路由器通過雙絞線與二層交換機的Uplink端口直接相連,而ADSL撥號上網(wǎng)線路與寬帶路由器的外部WAN端口直接相連,局域網(wǎng)中的所有工作站通過這條ADSL線路來訪問Internet網(wǎng)絡(luò)。
最近筆者單位負責局域網(wǎng)維護與管理的同事突然離開了工作崗位,剛接手這方面工作的新同事或許由于不熟悉環(huán)境或者其他方面的原因,一進入工作崗位就在很短的時間內(nèi)碰到了不少網(wǎng)絡(luò)故障,特別是其中一則網(wǎng)絡(luò)故障讓他頭疼不已。該網(wǎng)絡(luò)故障的具體現(xiàn)象表現(xiàn)為單位局域網(wǎng)上網(wǎng)時差不多每隔三個小時就會發(fā)生一次掉線現(xiàn)象,之后過幾分鐘,局域網(wǎng)又能自動重新訪問Internet網(wǎng)絡(luò)了;盡管中途掉線的時間只有幾分鐘,不過考慮到單位很多處室的工作都是在線完成的,與市政府直接相連的電子政務(wù)系統(tǒng)也對網(wǎng)絡(luò)連接的通暢性要求很高,即使網(wǎng)絡(luò)連接發(fā)生偶爾斷開現(xiàn)象,也會明顯影響電子政務(wù)等工作的正常開展。筆者的這位新同事對局域網(wǎng)中的所有工作站系統(tǒng)進行了詳細檢查,發(fā)現(xiàn)所有工作站系統(tǒng)運行狀態(tài)一切正常,而且都沒有任何網(wǎng)絡(luò)病毒的襲擊,并且局域網(wǎng)中的所有工作站系統(tǒng)都成功啟用了Windows Update服務(wù),這樣保證了所有系統(tǒng)安全補丁程序都能得到及時的安裝;再仔細對所有網(wǎng)絡(luò)連接線纜的端口以及連通性進行測試時,新同事也沒有找到任何物理性的故障。
故障排查
在萬般無奈之下,這位新同事及時向筆者發(fā)出了“求援”,聽了新同事對網(wǎng)絡(luò)故障的詳細敘述后,筆者立即根據(jù)他的描述進行了詳細分析,并及時得出了三點結(jié)論:***點就是局域網(wǎng)網(wǎng)絡(luò)發(fā)生了掉線現(xiàn)象,第二點就是該網(wǎng)絡(luò)掉線現(xiàn)象屬于間歇性行為,第三點就是網(wǎng)絡(luò)掉線故障發(fā)生之后很短的時間內(nèi)能夠自動恢復(fù)正常。
從以往經(jīng)驗來看,筆者認為網(wǎng)絡(luò)要是頻繁發(fā)生掉線的話,那可能有兩個方面的原因,一個方面的原因就是網(wǎng)絡(luò)線路自身連接不穩(wěn)定,另外一個方面的原因就是局域網(wǎng)中可能存在蠕蟲病毒,這個蠕蟲病毒或許就是導(dǎo)致網(wǎng)絡(luò)頻繁發(fā)生掉線故障的原因。由于筆者單位的局域網(wǎng)是通過本地電信部門的ADSL設(shè)備進行共享上網(wǎng)的,于是筆者立即與本地電信部門進行了聯(lián)系,懇請他們能夠?qū)Ρ締挝坏腁DSL撥號上網(wǎng)線路進行檢查,結(jié)果他們回復(fù)說沒有任何問題,本單位的ADSL撥號上網(wǎng)線路一切正常,于是筆者排除了網(wǎng)絡(luò)線路自身連接不穩(wěn)定因素,并且將故障解決的重點放到了網(wǎng)絡(luò)蠕蟲病毒身上;因為當局域網(wǎng)環(huán)境中蠕蟲數(shù)據(jù)包非常多的話,很可能導(dǎo)致寬帶路由器設(shè)備發(fā)生“假死”現(xiàn)象,從而可能會將相關(guān)的網(wǎng)絡(luò)端口關(guān)閉掉,如此一來可能就會導(dǎo)致網(wǎng)絡(luò)掉線故障,而當網(wǎng)絡(luò)蠕蟲病毒不發(fā)作時,那些被關(guān)閉的網(wǎng)絡(luò)接口又會自動打開,這樣一來網(wǎng)絡(luò)掉線現(xiàn)象過一段時間后就能自動恢復(fù)了。
既然筆者已經(jīng)認定間歇性斷網(wǎng)故障是由網(wǎng)絡(luò)蠕蟲病毒引起的,那么筆者就準備開始認真重新排除局域網(wǎng)中是否真的有病毒。大家知道,目前網(wǎng)絡(luò)中流行的許多蠕蟲病毒,特別是ARP類型的網(wǎng)絡(luò)欺騙病毒,它們的傳播速度是非??斓?,并且破壞力非常強,只要局域網(wǎng)中任意一臺工作站被ARP類型的網(wǎng)絡(luò)欺騙病毒感染,那么局域網(wǎng)中所有工作站的網(wǎng)絡(luò)連接操作都會受到明顯的影響。依照這樣的分析,筆者對局域網(wǎng)中所有同事使用的工作站系統(tǒng)又重新檢查了一遍,的確沒有找到任何可疑問題。而且在局域網(wǎng)發(fā)生網(wǎng)絡(luò)掉線現(xiàn)象時,筆者通過“arp -a”字符串命令查詢了本地網(wǎng)絡(luò)的ARP緩存表,結(jié)果發(fā)現(xiàn)緩存表中列寫出來的網(wǎng)關(guān)MAC地址信息與局域網(wǎng)處于正常上網(wǎng)狀態(tài)時的是一致的,這個結(jié)果表明局域網(wǎng)網(wǎng)絡(luò)掉線故障并不是由于ARP病毒欺騙造成的。
故障解決
根據(jù)上面的各種理論分析與實際檢查,筆者基本已經(jīng)推翻了間歇性斷網(wǎng)故障是由網(wǎng)絡(luò)蠕蟲病毒引起的這個結(jié)論了,那么究竟還有哪些因素可能導(dǎo)致單位局域網(wǎng)網(wǎng)絡(luò)每隔一段時間就會自動發(fā)生一次掉線故障呢,而且要不了多長時間后又能自動重新恢復(fù)連接呢?
為了更好、更快地將網(wǎng)絡(luò)故障原因找到,筆者打算采用最簡單、最常用的故障排查方法來解決難題,那就是采用分割法尋找故障原因,換句話說就是將局域網(wǎng)中各個工作區(qū)域分別隔離開來進行檢查。首先筆者先將局域網(wǎng)中所有工作站的電源全部關(guān)閉,讓所有工作站都從局域網(wǎng)中斷開,并且只連接一臺筆記本電腦到局域網(wǎng)中,可是該筆記本電腦在上網(wǎng)的時候仍然出現(xiàn)了相同的網(wǎng)絡(luò)掉線故障。很明顯,間歇性斷網(wǎng)故障不是出現(xiàn)在局域網(wǎng)工作站上,筆者估計問題很可能發(fā)生在局域網(wǎng)的交換機設(shè)備或路由器設(shè)備,或者出現(xiàn)在與這些設(shè)備相連的網(wǎng)絡(luò)連接線路上。
為了檢驗局域網(wǎng)中的交換機設(shè)備是否能夠正常工作,筆者索性將筆記本電腦直接連接到局域網(wǎng)的路由器設(shè)備上,之后在筆記本電腦上重新進行了上網(wǎng)測試,可是最終的測試結(jié)果還是讓筆者非常失望,筆記本電腦仍然過一段時間就發(fā)生了網(wǎng)絡(luò)掉線現(xiàn)象,而且沒有多長時間又能自動恢復(fù)正常;根據(jù)這一測試結(jié)果,筆者認為間歇性斷網(wǎng)故障與交換機設(shè)備沒有任何關(guān)系,而多半與路由器設(shè)備或與路由器相連的物理線路有關(guān)系。
之后筆者又將筆記本電腦與ADSL設(shè)備直接相連,而跳過了局域網(wǎng)中的路由器設(shè)備;緊接著筆者又在筆記本電腦中采用手工方法重新創(chuàng)建了撥號上網(wǎng)連接,再用鼠標雙擊該撥號連接圖標嘗試進行上網(wǎng)訪問,結(jié)果筆者看到網(wǎng)絡(luò)自動掉線現(xiàn)象一直沒有再出現(xiàn),這就意味著網(wǎng)絡(luò)撥號上網(wǎng)線路是正常的,并且這也驗證了ADSL設(shè)備不存在任何故障。在逐步排查、篩選之后,筆者認為間歇性斷網(wǎng)故障肯定是由寬帶路由器自身設(shè)置不當引起的,當然也可能是由寬帶路由器自身質(zhì)量不穩(wěn)定引起的。
正常情況下,寬帶路由器設(shè)備質(zhì)量上面一般不會有什么問題,問題很可能發(fā)生在參數(shù)設(shè)置上。于是筆者打開IE瀏覽器窗口,并在該窗口地址欄中輸入寬帶路由器設(shè)備默認的IP地址,之后又輸入該設(shè)備系統(tǒng)管理員帳號與密碼,登錄進該設(shè)備的后臺管理界面,在該后臺界面中筆者認認真真地檢查了各項設(shè)置參數(shù),結(jié)果看到在“網(wǎng)絡(luò)參數(shù)”處,“WAN口設(shè)置”下面的撥號設(shè)置參數(shù)被修改為了“按需連接,在有訪問時自動連接,自動斷線等待時間5分鐘”了,這一參數(shù)設(shè)置說明當單位局域網(wǎng)中有用戶要訪問Internet網(wǎng)絡(luò)時,寬帶路由器設(shè)備才會自動進行撥號上網(wǎng),而且當局域網(wǎng)網(wǎng)絡(luò)在5分鐘之內(nèi)沒有任何用戶使用時就會自動發(fā)生掉線故障。找到故障原因后,筆者立即將“WAN口設(shè)置”下面的撥號設(shè)置參數(shù)修改為“自動連接,在開機和斷線后自動連接”,并重新啟動了一下寬帶路由器設(shè)備,結(jié)果單位局域網(wǎng)中再也沒有發(fā)生間歇性掉線故障。
故障小結(jié)
總結(jié)上面的故障排除過程,筆者認為許多事情千萬不能想當然,否則很容易多走彎路。這不,在本則故障的排除過程中,筆者認為寬帶路由器設(shè)備的工作參數(shù)一般沒有人會隨便去改動的,于是就沒有想到要對該設(shè)備的參數(shù)進行檢查,可誰曾想到這則網(wǎng)絡(luò)故障竟然是由寬帶路由器設(shè)備上的WAN口撥號連接參數(shù)設(shè)置錯誤引起的,于是筆者懷疑是前任同事離開單位時做的手腳。當單位局域網(wǎng)在五分鐘之內(nèi)沒有任何用戶訪問外部網(wǎng)絡(luò)時,寬帶路由器設(shè)備就會自動將連接外網(wǎng)的線路切斷了,當有人嘗試進行網(wǎng)絡(luò)訪問并發(fā)現(xiàn)無法上網(wǎng)時,寬帶路由器設(shè)備又會根據(jù)“按需連接”方式自動將斷開的網(wǎng)絡(luò)線路恢復(fù)成功,這樣就出現(xiàn)了過幾分鐘后網(wǎng)絡(luò)又能重新正常工作的現(xiàn)象。
【編輯推薦】