微服務(wù)高可用難實現(xiàn)?是時候?qū)W學(xué)微服務(wù)治理了
原創(chuàng)【51CTO.com原創(chuàng)稿件】一直以來,微服務(wù)都因其易擴(kuò)展、易部署、易演進(jìn)、開放性強(qiáng)等優(yōu)勢被業(yè)界廣泛使用,但微服務(wù)化的架構(gòu)給系統(tǒng)帶來優(yōu)勢的同時,也帶來了一些服務(wù)治理上的困難。
尤其在近幾年,隨著系統(tǒng)規(guī)模的不斷擴(kuò)大和云原生技術(shù)的廣泛應(yīng)用,服務(wù)化的要求使系統(tǒng)的復(fù)雜性進(jìn)一步提升,很多原有的服務(wù)治理技術(shù)和思路變得不再有效,這對大規(guī)模服務(wù)的治理提出了更大的挑戰(zhàn)。那么在這種情況下,我們是否可以從技術(shù)創(chuàng)新的角度出發(fā),嘗試?yán)靡恍┬录夹g(shù)去解決服務(wù)治理中的諸多痛點,實現(xiàn)服務(wù)的精細(xì)化治理。
為幫助開發(fā)人員及企業(yè)認(rèn)識并解決在大規(guī)模服務(wù)治理中可能出現(xiàn)的系統(tǒng)韌性、可觀測性、失敗容忍性、服務(wù)注冊發(fā)現(xiàn)及系統(tǒng)資源成本控制、性能優(yōu)化等方面問題。我們在本屆WOT全球技術(shù)創(chuàng)新大會“大規(guī)模服務(wù)治理”專題中,邀請到了來自百度、字節(jié)跳動、快手等一線大廠的資深技術(shù)專家,結(jié)合自身實踐經(jīng)驗,為大家分享大規(guī)模服務(wù)治理過程中所遇到的挑戰(zhàn)和解決之道,希望能夠給大家?guī)硪恍┬碌膯l(fā),幫助大家找到建立完善微服務(wù)治理體系的方法。
演講內(nèi)容一
演講主題:混沌工程在百度搜索的探索、應(yīng)用和思考
演講嘉賓:徐志明 百度搜索穩(wěn)定性團(tuán)隊高級研發(fā)工程師
內(nèi)容簡介:
混沌工程提倡在生產(chǎn)系統(tǒng)上進(jìn)行實驗,以建立抵御故障的能力和信心。近年來,混沌工程取得了快速的發(fā)展,但在工程的具體實施方面,業(yè)界尚無標(biāo)準(zhǔn)方案,各公司在混沌工程的落地上有著自己不同的方法。百度搜索,作為國內(nèi)領(lǐng)先的高可用系統(tǒng),在混沌工程方向上也較早的進(jìn)行了探索和實踐。在此過程中,我們遇到并克服了諸多挑戰(zhàn),積累了一些經(jīng)驗和思考,也掌握了一些創(chuàng)新技術(shù),本次分享將為大家進(jìn)行上述內(nèi)容的逐一介紹。
演講提綱:
一、混沌工程簡介:混沌工程的提出背景、發(fā)展歷程及原則
二、百度搜索引入混沌工程的背景:
-
百度搜索系統(tǒng)介紹
-
引入混沌工程的必要性
三、百度搜索落地混沌工程的思路:
-
故障場景的分級分類
-
服務(wù)的韌性打分
-
搜索的弱依賴標(biāo)準(zhǔn)
-
故障容錯能力刻畫和例行巡檢
四、落地方案和效果:
-
技術(shù)層面:平臺能力持續(xù)建設(shè)、搜索系統(tǒng)適配升級、復(fù)雜故障場景能力建設(shè)
-
文化層面:通過能力驗收、活動保障、項目支持、gameday等方式推廣混沌工程文化
-
混沌工程對百度搜索系統(tǒng)帶來的效益
五、演講總結(jié)與未來展望
演講內(nèi)容二
演講主題:微服務(wù)節(jié)點分片訪問技術(shù)
演講嘉賓:馬子昂 字節(jié)跳動資深架構(gòu)師
內(nèi)容簡介:
微服務(wù)的無狀態(tài)和可任意伸縮的特點為微服務(wù)體系帶來了很大的靈活性。在微服務(wù)的服務(wù)發(fā)現(xiàn)過程中,請求方會默認(rèn)獲得全量的節(jié)點,復(fù)雜均衡策略同樣會使用全量節(jié)點,這使得在節(jié)點數(shù)量過多時,會產(chǎn)生一系列問題。但有時,在保證穩(wěn)定性的前提下,服務(wù)其實并不需要訪問所有的節(jié)點。因此,我們在此基礎(chǔ)上,提出了分片優(yōu)化、就近優(yōu)先訪問等技術(shù),并在生產(chǎn)上成功落地并獲得了收益。本次分享我將為大家?guī)磉@些技術(shù)的實踐經(jīng)驗。
演講提綱:一、全實例負(fù)載均衡問題:
-
負(fù)載均衡器的消耗
-
訂閱的信息傳輸壓力
-
長連失效
二、分片探索踩下的坑三、按需訪問的實踐四、實際穩(wěn)定性與收益五、未來展望
演講內(nèi)容三
演講主題:快手萬億級監(jiān)控體系建設(shè)與場景化落地
演講嘉賓:陳帥 快手業(yè)務(wù)監(jiān)控負(fù)責(zé)人
內(nèi)容簡介:
快手監(jiān)控體系已由每天千億記錄成長到萬億級別。在此過程中,我們遇到了諸多挑戰(zhàn),迫使我們在體系布局、用戶體驗、性能優(yōu)化、成本控制、價值輸出等方面不斷做出改變。本次分享將向大家介紹快手監(jiān)控體系建設(shè)與落地過程中面臨的技術(shù)挑戰(zhàn)和相應(yīng)的解決方案。
演講提綱:
一、監(jiān)控體系布局—介紹快手基礎(chǔ)監(jiān)控、服務(wù)監(jiān)控、業(yè)務(wù)監(jiān)控、日志監(jiān)控、Trace從采集到存儲、繪圖、報警的架構(gòu)模型:
-
傳輸與存儲采用 kafka+clickhouse 方案
-
繪圖采用 Grafana 引擎
-
報警采用基于 Grafana 報警引擎開發(fā)的異構(gòu)數(shù)據(jù)源通用引擎+報警網(wǎng)關(guān)
二、挑戰(zhàn)逐步突顯—介紹基礎(chǔ)監(jiān)控、業(yè)務(wù)監(jiān)控在流量快速增長過程中面臨的集群壓力、性能壓力、場景多樣、存儲成本等問題,以及我們的實踐方案:
-
通過租戶拆分、冷熱分離、數(shù)據(jù)降維、查詢采集、后端緩存回事、前端懶加載等方案提升查詢性能
-
通過數(shù)據(jù)降維和 Clickhouse 表結(jié)構(gòu)優(yōu)化降低存儲成本
-
采用 clickhouse 解決基礎(chǔ)指標(biāo)體系指標(biāo)聚合和多維查詢
三、生產(chǎn)變更故障止損 - 監(jiān)控阻斷:
-
監(jiān)控阻斷的背景和目標(biāo):生產(chǎn)環(huán)境xx%的故障因變更觸發(fā)引起,目標(biāo)是以變更為切入點,攔截生產(chǎn)故障,及時止損
-
架構(gòu)設(shè)計:將診斷方、變更方分層,形成一個可擴(kuò)展的標(biāo)準(zhǔn)框架,允許多方接入,提升覆蓋率
-
業(yè)務(wù)收益:攔截住多少問題上線單,評估可能攔截的故障隱患
四、全景視角定位問題 - 監(jiān)控巡檢:
-
用戶痛點:定位問題過程中最核心的痛點是不知道問題在哪兒
-
監(jiān)控巡檢的背景和目標(biāo):幫忙用戶自上而下、由大到小定位問題
☆ WOT全球技術(shù)創(chuàng)新大會2022 ☆
2022/4/9-4/10
???
WOT全球技術(shù)創(chuàng)新大會2022是51CTO中國技術(shù)社區(qū)為廣大技術(shù)從業(yè)者精心打造的WOT2.0升級版。大會專題覆蓋包括人工智能、數(shù)據(jù)安全、音視頻、大數(shù)據(jù)、架構(gòu)、開源、云原生、前端、研發(fā)管理、算法、金融科技、微服務(wù)等眾多方向。
本屆WOT大會預(yù)計1500人參會,100余家企業(yè)合作,60位專家分享。大會不僅邀請到騰訊、阿里、百度、58、大搜車等一線互聯(lián)網(wǎng)大廠的技術(shù)專家,為大家進(jìn)行獨家技術(shù)干貨的分享。還特別邀請到數(shù)位國內(nèi)頂尖技術(shù)科學(xué)家,為大家詳細(xì)解讀國內(nèi)重點技術(shù)創(chuàng)新戰(zhàn)略及相關(guān)政策。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】