修復SDN路由故障?沒那么簡單
兩年前,我曾經(jīng)寫到過:修復軟件定義網(wǎng)絡故障需要使用數(shù)據(jù)包穿梭機才能在快速變化的動態(tài)網(wǎng)絡中理清復雜且快速變化的拓撲。此外,企業(yè)正在加速遷移到混合云網(wǎng)絡,這使得我們更加依賴目前無法輕松控制的服務提供商網(wǎng)絡內(nèi)部路由。
網(wǎng)絡結構會在防火墻兩端自動定期重新配置,那么網(wǎng)絡工程師又該如何修復快速變化、路由波動或***變化等問題呢?SDN路由新工具可以解決這些問題,但是它們與我們以前使用的工具大相徑庭。
遠程分析網(wǎng)絡行為
科學的一個重要原則就是可再現(xiàn)性,其他研究人員按照相同的流程就能夠在類似的條件下獲得相同的結果。如果說網(wǎng)絡中有屬于科學范疇的東西,那它一定是命令行。它的功能限制有嚴格的用法規(guī)定,雖然不同完全不變,但是重復執(zhí)行相同命令會產(chǎn)生相同的操作。此外,它相對較為昂貴,因此在我們嘗試理解為什么在一個特定時間會出現(xiàn)網(wǎng)絡異常時,它能夠保證結果的穩(wěn)定性。在半夜反向工程Mike所作的修改時,搞清楚“為什么Mike要修改防火墻規(guī)則?”這個問題是合理且有意義的。
Mike、Kirstin和我自己的成本在于同為高水平管理員卻要在凌晨3點的維護期間做一些效率低下的事情。通過命令行配置網(wǎng)絡是一件耗時、容易出錯且最容易讓網(wǎng)絡速度產(chǎn)生巨大變化的方法。
其中還有一個副作用是,低基數(shù)(人數(shù)少)可以讓我們在大腦中構思出有用的拓撲模型。我們能記住重要路由中的鏈路和節(jié)點,因為它們是我們自己建的。當服務出現(xiàn)問題時,我們能回憶起最可能導致問題的錯誤特性,還有更重要的是修改過的節(jié)點。我們就會用命令行接口(CLI)連接該主機,修復問題,然后關掉問題單。
修復復雜路由中的故障
SDN是一把雙刃劍:實際上可任意修改。在SDN路由中,在任何1臺路由器上添加***的下一跳路由,跟在100臺路由器上操作是完全相同的,而且管理員在圖形化界面上可以快速地創(chuàng)建多個目標的連接,修改過程中完全沒有任何障礙。
我們不要忘記了,IT喜歡在遇到棘手問題時修改網(wǎng)絡。在出現(xiàn)VMware之前,你還記得自己有多頻繁地重新配置物理服務器嗎?現(xiàn)在,你又多頻繁地修改虛擬機(VM)呢?SDN將同樣的功能帶到了網(wǎng)絡中。
就像是客戶機幾個小時發(fā)生一次變化,然后要在4個小時之后才去修復虛擬機操作系統(tǒng)的問題。只是分析網(wǎng)絡的當前狀態(tài)還不夠——我們的網(wǎng)絡故障修復工具需要支持及時回滾路由變化,同時要能修復可能只存在幾分鐘的路由問題。這種問題早就存在于運營商網(wǎng)絡中;只是現(xiàn)在我們也開始遇到同類的問題了。
可視化SDN路由工具
新型網(wǎng)絡工具注重發(fā)現(xiàn)和監(jiān)控網(wǎng)絡路徑。路徑并不像傳統(tǒng)意義的路由,因為它們有4個維度。一條路徑有一對流量終端,以及所有可能用于傳輸數(shù)據(jù)包的路由,但是它只能按照特定時間進行捕捉和監(jiān)控。由于路徑具有相當?shù)膹碗s性,特別是在互聯(lián)網(wǎng)路由中,這些網(wǎng)絡故障修復工具并不是那種我們能輕松駕馭的匯總和點擊查看明細的典型儀表板工具。
這些新型SDN路由工具是交互式的,帶有瀏覽和與上下文相關的瀏覽前端和中心。通過前后滾動連接可視化控件,我們就能對比不同時間捕捉的快照,從而發(fā)現(xiàn)網(wǎng)絡配置變化之后出現(xiàn)的復雜SDN路由性能問題。它們能夠在大量鏈路中分辨出導致某一條配置錯誤鏈路出現(xiàn)的丟包原因。它們能夠區(qū)分正常路徑總延遲與路徑中間節(jié)點正常行為之間的差別。這一點很重要,因為它能夠發(fā)現(xiàn)復雜網(wǎng)絡中的問題,這些網(wǎng)絡的長傳輸時間延遲可能會擴大總延遲時間。
兩年前,我還不知道供應商是如何監(jiān)控SDN的真實性能和拓撲,因為它總在通過編程來修改自身配置,甚至可能一天修改幾百次。而且,我擔心我們可能無法越過SDN控制器的vRoutes和vLinks而全面了解應用程序狀態(tài)。但是,最終我們看到一些新工具從實驗室誕生,可能這也是一種革命性的進步(至少在網(wǎng)絡領域是的)。
或許我們已經(jīng)遇到了一種實際的運營臨界點,這時如果不使用監(jiān)控工具去可視化展示SDN所制造的復雜狀態(tài),我們就不可能實現(xiàn)更多的自動化。今年可能會成為對路由人員而言意義重大的一年——無論是軟件驅動或是通過CLI手動配置的環(huán)境,無論是在數(shù)據(jù)中心或是云環(huán)境,都是這樣。






















