通過AIOps進行網(wǎng)絡管理的常用方式
企業(yè)的NetOps團隊面臨著篩選大量傳入數(shù)據(jù)以識別出現(xiàn)在網(wǎng)絡上的技術(shù)、性能和安全問題的挑戰(zhàn)。這在傳統(tǒng)上是一個手動的、耗時的過程?,F(xiàn)如今,NetOps團隊正在優(yōu)先考慮有助于識別問題和快速修復問題的解決方案--AIOps就是解決方案之一。
AIOps使用人工智能來發(fā)現(xiàn)和理解模式,并在大型、復雜的數(shù)據(jù)集中識別異常情況。根據(jù)Gartner的說法,"AIOps結(jié)合了大數(shù)據(jù)和機器學習,使IT運營過程自動化,包括事件關聯(lián)、異常檢測和因果關系確定。"
雖然AIOps可以做很多事情,但最近的研究表明,企業(yè)正在優(yōu)先考慮有助于快速識別潛在網(wǎng)絡問題(如異常檢測/智能警報和升級)的用例,并盡快修復它們(如安全事件和IT服務問題的自動修復)。
為了進一步探討這個話題,讓我們深入研究EMA最近的一些研究,評估AIOps的使用和看法,并看看AIOps驅(qū)動的方法如何能使NetOps團隊受益。
研究:確定應用場景的優(yōu)先級
當談到AIOps時,EMA的研究表明,企業(yè)明顯優(yōu)先考慮直接關注保持網(wǎng)絡安全和高效運行的場景。例如,56%的企業(yè)正在優(yōu)先考慮或?qū)嵤┊惓z測,這涉及暴露異?;顒踊蛘?shù)之外的操作,使其成為AIOps的首選。
此外,人工智能(AI)可以被訓練來快速區(qū)分真正威脅到網(wǎng)絡運營的異?,F(xiàn)象,幫助團隊將精力集中在最需要的地方。
舉例來說,當帶寬消耗出現(xiàn)異常峰值時,企業(yè)需要定義策略,從通常的月度趨勢中檢測異常情況,可以跟蹤這些異常情況,并將其縮小到企業(yè)空間已知或未知的某些網(wǎng)絡服務或應用程序。這種情況通常發(fā)生在計劃外的服務器或數(shù)據(jù)備份,或某些應用程序(如大型文件傳輸或流)的BW使用期間。
當涉及到安全事件時,目標是盡快消除威脅。根據(jù)EMA的數(shù)據(jù),在對安全事件的初始響應中所涉及的大部分內(nèi)容可以很容易地實現(xiàn)自動化,只要規(guī)則正確,這種自動化的安全事件補救是企業(yè)的第二大優(yōu)先用途(55%)。
自動化的初始安全響應不僅可以加速解決問題,還可以讓團隊更緊密地關注那些需要直接人工干預的領域。圍繞自動化安全事件和補救的一個常見場景是,當一個未知的應用程序或主機/IP被標記并使用了網(wǎng)絡資源、服務或企業(yè)帶寬。企業(yè)外的主機可以被標記和列入后備名單,并在此過程中使用訪問列表進行隔離。
處理大量的警報
如前所述,NetOps和SecOps團隊每天都面對大量的警報,可能隱藏著嚴重的操作或安全問題。由于人工智能擅長模式識別,智能警報/升級(53%)是企業(yè)的第三大優(yōu)先使用的場景。
根據(jù)網(wǎng)絡安全漏洞的類型和級別,可以設置服務策略來提醒或升級這些問題。團隊還可以配置基本警報和黑名單,以便將來對簡單的網(wǎng)絡異常情況進行分析,這可以阻止通過服務策略定義的未識別的流量模式。
與安全事件的補救類似,在IT服務中自動緩解問題的過程會加快MTTR,確保運營效率。這使得自動化IT服務問題修復(52%)成為企業(yè)第四大優(yōu)先考慮的AIOps使用場景。
為了解決這個問題,團隊可以通過適當?shù)木瘓髾C制,根據(jù)服務級或應用級事件定制強大的事件管理策略(這正成為企業(yè)的重要優(yōu)先事項)。同時,需要對不同事件的記錄、跟蹤和管理政策進行適當?shù)囊?guī)劃,以便進行正確的補救。
與上述發(fā)現(xiàn)一致,大多數(shù)企業(yè)傾向于圍繞網(wǎng)絡安全基礎設施,如防火墻或入侵檢測和保護解決方案,開始AIOps的部署和整合,以更好地檢測異常情況,升級警報和補救安全問題。也就是說,包括數(shù)據(jù)中心交換、云網(wǎng)絡和應用交付網(wǎng)絡解決方案在內(nèi)的應用基礎設施是一個強有力的二級優(yōu)先事項。AIOps解決方案部署的最后一個重點領域是Wi-Fi和WAN基礎設施。
AIOps是關于數(shù)據(jù)的
鑒于這些AIOPs的優(yōu)先級,以及與任何AI/ML相關的事實,AIOps都是關于數(shù)據(jù)的,企業(yè)發(fā)現(xiàn)數(shù)據(jù)管理(48%)是網(wǎng)絡團隊需要的首要技能,這并不奇怪。事實上,早期的研究發(fā)現(xiàn),數(shù)據(jù)質(zhì)量差是成功應用AIOps進行網(wǎng)絡和安全管理的主要技術(shù)挑戰(zhàn)。除了數(shù)據(jù)背景之外,企業(yè)將一般的人工智能和基礎設施知識(42%)作為第二優(yōu)先技能。
這表明,一些企業(yè)可能正在開發(fā)內(nèi)部AIOps能力,或希望修改商業(yè)解決方案。同樣,算法開發(fā)和API技能(39%)在優(yōu)先級列表中都很高,再次表明企業(yè)正在構(gòu)建或微調(diào)底層算法,并努力將軟件和工具更廣泛地整合到AIOps領域。
總體觀點是,希望在AIOps方面取得成功的企業(yè)正在尋求用特定的數(shù)據(jù)、AI、算法和整合技能來補充他們的網(wǎng)絡或安全團隊。
企業(yè)希望有效地回答復雜的問題,以加快解決。AIOps允許企業(yè)采用AI/ML來補充IT團隊的能力,以快速識別和緩解對整體網(wǎng)絡性能或安全的威脅,包括異常檢測、自動安全和事件修復等問題。
隨著新工具的出現(xiàn),NetOps團隊需要學習新的技能,如數(shù)據(jù)管理、AI知識和算法開發(fā)。最終,這可以幫助這些團隊和公司簡化工作流程,更好地解釋數(shù)據(jù),并有效和安全地管理網(wǎng)絡。

























