當多米諾骨牌倒下時:只有DataOps和AI以及機器學習才能讓微服務和分布式系統(tǒng)立于不敗之地
譯文???
【51CTO.com快譯】可以想象這樣一個場景:當IT運維人員準備享受咖啡的時候,突如其來的急促報警會攪亂他們的好心情。即便經過不懈努力解決了大量的警報信息,如此大的工作量也會使運維人員深陷疲憊。我們不禁要問:系統(tǒng)為什么不能通過智能的方式預測問題并在報警發(fā)出之前就修復它們呢?想象一下, 當IT運維人員使用復雜的 IT系統(tǒng)和混合云上的應用程序來處理告警信息時會發(fā)生什么?無疑!他們會身陷 “報警泥潭”,無法自拔。
為了達到如下幾個目的,為微服務量身打造的新興架構就誕生了:
- 支持業(yè)務能力
- 自動將應用程序部署為服務
- 端點智能
- 語言和數(shù)據(jù)的去中心化控制
任何應用中的微服務都有緊密關聯(lián)的跡象,這種關聯(lián)會導致多米諾骨牌效應。應用中任何一點延遲或更改都會以意想不到的速度影響到其他服務。每個數(shù)字原生企業(yè)都依賴于兩個要素:數(shù)據(jù)和分布式系統(tǒng)。兩個要素可以保證企業(yè)應用中服務的完整交付。數(shù)字原生組織越成熟,就會使用更多的分布式系統(tǒng),也會擁有更多的數(shù)據(jù)。
成熟的云原生企業(yè)會遇到另一個問題,那就是數(shù)據(jù)碎片化。這需要構建一個整體的應用方案來解決。Gartner 估計,IT 基礎設施產生的數(shù)據(jù)量會以每年兩到三倍的速度增長。
在這樣的背景下,為什么人類要為應用程序故障負責?這使我們回過頭來質疑一些基本的配置和報警解決方式。
在現(xiàn)代微服務世界中哪些需要改變?
1. 準備你的日志
打破集中和孤立的架構,請將日志匯集到一個系統(tǒng)中。無論是存放還是展示,盡量讓它們保存到同一個數(shù)據(jù)源中??紤]到微服務會生成大量數(shù)據(jù),單一視圖的方式可以讓日志輕松地被搜索到。這是升級現(xiàn)代微服務監(jiān)控方法的基本操作。
2. 管理分布式網(wǎng)絡
分布式網(wǎng)絡及其通信不容忽視。它是任何組織的重要組成部分。使用可以長期保存歷史數(shù)據(jù)的集群解決方案,并不會通過過度的下采樣(downsampling 對樣本再次采樣,舍棄多余的樣本)而犧牲數(shù)據(jù)粒度。開源和 SaaS 云服務使這種解決方案變得更加復雜。但是它們可以確保當你工作的監(jiān)控系統(tǒng)與第三方平臺集成后能提供完整的可觀察性,即便這個三方平臺擁有大型和動態(tài)的生態(tài)系統(tǒng)也是如此。
3. 管理動態(tài)日志/跟蹤數(shù)據(jù)
隨著基于微服務的應用程序演進與變化,它們生成數(shù)據(jù)的變化也悄然發(fā)生。考慮到在這種情況下監(jiān)控系統(tǒng)也需要檢測異常,所以不能僅僅依賴于手動創(chuàng)建的報警規(guī)則。最重要的是,關鍵報警不會因為日志數(shù)據(jù)的創(chuàng)建或更新而被忽略。
智能與機器人數(shù)據(jù)自動化 (RDA)
機器人數(shù)據(jù)自動化 (RDA Robotic Data Automation)旨在自動處理數(shù)據(jù),并使監(jiān)控系統(tǒng)和流程更加智能從而管理報警。機器學習算法可以使用歷史數(shù)據(jù)和現(xiàn)有學習模型隨時隨地創(chuàng)建新報警規(guī)則。它處理底層機器數(shù)據(jù)和報警,進而提供優(yōu)化報警處理過程的建議。RDA 讓報警處理過程變得智能化,以減少人為干預。
邁向新的微服務世界
摒棄舊監(jiān)控方法的四大原因如下:
1. 更多的應用程序正被部署到云中。
2. 迭代會顯得更加頻繁,對于程序的微小修改都需要將整體應用重新編譯和發(fā)布。
3. 每次變更都會影響到其他模塊,正所謂牽一發(fā)而動全身。
4. 如果沿用舊有監(jiān)控的擴展方式則會影響到整個應用程序,實際上只需要擴展部分資源就可以滿足監(jiān)控擴展需求。
同時,新的微服務架構模式需要關注服務發(fā)現(xiàn)、配置管理、負載均衡、消息傳遞等。您需要具備數(shù)據(jù)獲取和與第三方系統(tǒng)集成的能力。通過RDA 的AIOps(人工智能運維)方式幫助實現(xiàn)混合 IT系統(tǒng)的性能與可用性監(jiān)控。
譯者介紹
崔皓:51CTO社區(qū)編輯,資深架構師,擁有18年的軟件開發(fā)和架構經驗,10年分布式架構經驗。曾任惠普技術專家。樂于分享,撰寫了很多熱門技術文章,閱讀量超過60萬。??《分布式架構原理與實踐》??作者。
原文標題:When Dominoes Fall: Microservices and Distributed Systems Need Intelligent DataOps and AI/ML To Stand Up Tall,作者:Srinivas Miriyala
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】


























