實(shí)戰(zhàn)案例:鏈路不穩(wěn)定導(dǎo)致 OSPF 鄰居振蕩,路由反復(fù)收斂該如何解決?
本期分享的案例是弱電安防的相關(guān)問(wèn)題。
背景介紹
某網(wǎng)絡(luò)環(huán)境中,DeviceA與DeviceB兩臺(tái)某W設(shè)備通過(guò)100GE接口直連,建立了OSPF鄰居關(guān)系。近期網(wǎng)絡(luò)中出現(xiàn)OSPF鄰居頻繁振蕩的情況,導(dǎo)致路由反復(fù)收斂,業(yè)務(wù)流量轉(zhuǎn)發(fā)受到嚴(yán)重影響。
組網(wǎng)結(jié)構(gòu)如下:

經(jīng)基礎(chǔ)檢查發(fā)現(xiàn):
- 網(wǎng)絡(luò)中無(wú)相關(guān)告警信息
- 業(yè)務(wù)故障時(shí)段與OSPF鄰居狀態(tài)變化時(shí)間高度吻合
處理思路
針對(duì)OSPF鄰居振蕩問(wèn)題,通常需從鏈路狀態(tài)、協(xié)議配置、設(shè)備硬件三個(gè)維度排查,處理思路如下:
- 檢查設(shè)備日志中OSPF鄰居狀態(tài)變化記錄及原因
- 分析物理鏈路的UP/DOWN情況
- 排查光模塊、光纖等硬件是否存在異常
排查分析
第一步:查看DeviceA的OSPF日志
執(zhí)行display logbuffer命令后,發(fā)現(xiàn)故障時(shí)段存在大量OSPF鄰居DOWN的記錄:

所有記錄顯示鄰居DOWN的原因均為收到1-way hello報(bào)文。
第二步:同步核查DeviceB的日志
在相同時(shí)間點(diǎn),DeviceB同樣有OSPF鄰居DOWN的記錄:

其中明確提到主要原因?yàn)椤癙hysical Interface State Change”(物理接口狀態(tài)變化)。
第三步:驗(yàn)證物理接口狀態(tài)
進(jìn)一步查看DeviceB的物理接口日志,發(fā)現(xiàn)存在頻繁的UP/DOWN記錄:

由此確認(rèn),接口狀態(tài)的不穩(wěn)定導(dǎo)致了OSPF鄰居的反復(fù)振蕩:接口DOWN時(shí)鄰居關(guān)系中斷,接口UP后重新協(xié)商建立,進(jìn)而引發(fā)對(duì)端設(shè)備的鄰居狀態(tài)也隨之變化。
原理及解決方案
故障原因:光纖或光模塊異常導(dǎo)致鏈路頻繁UP/DOWN,使得OSPF鄰居狀態(tài)反復(fù)變化。當(dāng)接口DOWN時(shí),OSPF鄰居關(guān)系中斷;接口恢復(fù)UP后,設(shè)備重新發(fā)送HELLO報(bào)文進(jìn)行協(xié)商,對(duì)端收到報(bào)文后會(huì)重置鄰居狀態(tài),從而形成振蕩。
解決方案:更換異常的光纖或光模塊,恢復(fù)鏈路穩(wěn)定性。





















