騰訊云副總裁黃俊洪:馭“云原生”之力,驅動產(chǎn)業(yè)互聯(lián)網(wǎng)持續(xù)發(fā)展
原創(chuàng)51CTO讀者成長計劃社群招募,咨詢小助手(微信號:TTalkxiaozhuli)
在云計算發(fā)展的十余年間,企業(yè)對云計算的訴求發(fā)生了巨大變化。曾經(jīng),企業(yè)上云更多集中在一些可見的云資源層面,然而隨著上云的不斷深入,很多企業(yè)發(fā)現(xiàn)業(yè)務數(shù)字化僅靠資源層很難實現(xiàn),尤其是在以大數(shù)據(jù)甚至大規(guī)模技術為主導的智能化領域。
如今,無論是傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng)企業(yè),都已從過去的“搬遷上云”轉變到了“深度用云”的全新階段。企業(yè)已不再滿足于簡單地將物理機轉移至虛擬機,而是更希望借助云原生的能力實現(xiàn)降本增效,云原生已成為了企業(yè)用云標準的新范式。
近日,在 51CTO 與騰訊云 TVP 聯(lián)合主辦的 LeaTech 全球 CTO 領導力峰會中,51CTO 對騰訊云副總裁黃俊洪進行了專訪。面對一系列有關云計算行業(yè)發(fā)展及云原生實踐的焦點問題,黃俊洪毫無保留地向 51CTO 分享了諸多自己深刻而獨到的見解。
1、企業(yè)云原生化改造之道
訪談伊始,黃俊洪便向51CTO介紹了騰訊發(fā)布的云原生改造白皮書,并對騰訊在企業(yè)云原生改造方面所積累的寶貴經(jīng)驗進行了分享。據(jù)黃俊洪介紹:騰訊內部將企業(yè)云原生改造劃分為4個主要階段,分別為:開發(fā)云原生、計算云原生、架構云原生以及數(shù)據(jù)云原生。
開發(fā)云原生階段主要解決“企業(yè)研發(fā)運維流程效率”問題。企業(yè)組織架構、研發(fā)運維流程是否符合 DevOps 理念,是否能夠支持對應用進行快速迭代、測試、發(fā)布、試錯和優(yōu)化;是否能建設和使用軟件流程中的工具平臺,提升團隊協(xié)作效率,同時根據(jù)流程規(guī)范搭建自動化平臺,減少人為因素導致的低效或失誤是衡量該階段完成效果的兩個關鍵因素。
計算云原生階段則重點關注“容器化”、“Serverless 化”兩大關鍵詞。改造目標是降低 IaaS 層的異構和差異、資源的部署和調度的關注。
架構云原生階段需要深入復雜的軟件架構層面,雖然難度較大,但收益非??捎^。在改造過程中,一些成熟的框架服務的使用,能讓改造事半功倍。例如微服務平臺、服務網(wǎng)格等,它們集成了很多運維能力,包括日志、監(jiān)控、服務注冊和發(fā)現(xiàn)、故障容災等。除了提高研發(fā)效率外,也能提升改造后系統(tǒng)的整體運維能力。
而在數(shù)據(jù)云原生階段,企業(yè)的云原生改造已經(jīng)進入到深水區(qū),目標是將 Kubernetes、Serverless 的技術和理念應用到“數(shù)據(jù)服務”中,讓“數(shù)據(jù)服務”也具備極致的彈性伸縮能力,在資源成本上能夠做到最優(yōu)。
黃俊洪表示:任何企業(yè)的轉型或改造都不是一蹴而就的,伴隨著企業(yè)數(shù)字化與智能化的不斷深入,未來企業(yè)對上云的核心訴求也將發(fā)生變化——不再只滿足于簡單地使用云上的 IaaS 能力,實體經(jīng)濟的轉型將更需要貼近業(yè)務的 PaaS 和 SaaS 能力。
例如在政務領域,結合更多 AI、大數(shù)據(jù)等能力才能為企業(yè)創(chuàng)造更大價值;而金融領域則需要構建自身的 PaaS 平臺,來快速響應客戶的業(yè)務需求和提升平臺的開發(fā)效率;工業(yè)領域 PaaS 則能為企業(yè)提供云服務所必需的各種中間件、分層的動態(tài)擴展機制、開發(fā)和運維等支撐能力,幫助企業(yè)快速構建面向工業(yè)領域的云服務。
而在騰訊方面,為了能更好地實現(xiàn)自主可控以及對用戶的持續(xù)賦能,在過去幾年中,騰訊 ToB 業(yè)務主動調整了收入結構。在加大音視頻、大數(shù)據(jù)、數(shù)據(jù)庫等 PaaS 領域投入的同時,將“健康可持續(xù)”作為業(yè)務的增長目標,并采取了包括提高自研產(chǎn)品競爭力、鼓勵產(chǎn)品被集成、豐富伙伴生態(tài)在內的一系列舉措。希望能夠以“長期主義”心態(tài)來推動整個產(chǎn)業(yè)互聯(lián)網(wǎng)的長期可持續(xù)發(fā)展。
2、云原生時代的研發(fā)效能提升
在談及有關企業(yè)研發(fā)效能提升的問題時,黃俊洪提到:云原生能夠為研發(fā)效能提升帶來新的變化。作為綜合性的解決方案,云原生領域中包含許多不同的技術和工具,其目的就是為了提高應用程序的可移植性、彈性和可靠性。而基于云原生的效能提升推進則可以分為規(guī)劃、架構、開發(fā)、集成部署和運維多個階段進行。
在規(guī)劃階段,可以通過分析現(xiàn)有的技術性指標來確定需要改進的方向,重點是建立與業(yè)務目標一致的清晰且定義明確的計劃,可以通過項目協(xié)同、OKR 工具等進行實施。
應用程序架構設計階段,需要優(yōu)先考慮應用程序的可伸縮性和容錯性,以實現(xiàn)應用程序的快速迭代和部署。此時,重點關注應用程序的整體架構設計,包括微服務的設計、容器化設計和服務網(wǎng)格的構建等。
應用程序開發(fā)階段,則要著重優(yōu)化開發(fā)過程和開發(fā)環(huán)境。側重點是使用云原生技術構建高質量的微服務和容器化應用,例如可以使用 CI 工具自動化構建流程,通過縮短構建時間和提高構建質量來提高開發(fā)效率。同時也需要關注開發(fā)過程的自動化和測試的質量控制。
集成和部署階段,需要將應用程序和基礎設施進行集成,自動化部署和管理應用程序的生命周期。在這個階段主要關注基礎設施自動化和容器編排,前者可使用自動化工具來管理和維護基礎設施;后者使用容器編排工具(如 Kubernetes)來管理和協(xié)調應用程序的部署、擴展、故障恢復等任務。通過全生命周期管理,將云原生應用序快速、可靠地發(fā)布到開發(fā)測試與生產(chǎn)環(huán)境中。
在運維階段,要重點關注應用程序的穩(wěn)定性、可靠性和可維護性。重點是建設與使用云原生的可觀測性,包括日志分析、監(jiān)控和鏈路追蹤等。可以使用監(jiān)控工具對應用程序進行實時監(jiān)控,包括應用程序性能、資源使用情況;使用日志分析工具對應用程序的日志進行分析,及時發(fā)現(xiàn)并解決問題。
黃俊洪強調稱:雖然上述不同階段通過云原生技術可以協(xié)助實現(xiàn)研發(fā)效能的量化與推進,但在具體推進階段企業(yè)還是需要根據(jù)不同團隊的實際情況進行調整,并不斷總結經(jīng)驗,不斷優(yōu)化和升級云原生基礎設施和應用程序,這樣才能從最適合企業(yè)、團隊的路徑完成研發(fā)效能提升的目標。
對于研發(fā)效能工具和研發(fā)管理模式的變化趨勢,黃俊洪則表示,隨著未來企業(yè)軟件以及研發(fā)團隊規(guī)模的不斷增加,研發(fā)效能工具和管理模式的持續(xù)演進將成為必然。
自動化工具的廣泛應用將是未來最明顯的一大趨勢,隨著自動化工具的不斷發(fā)展,研發(fā)過程中許多重復性工作和手動操作將會自動化。例如自動化測試、自動化構建和自動化部署、DevSecOps 能力以及可復用的模版等將會變得越來越普及。
另一方面是平臺工程的普及與實踐,也就是云原生背景下應具備面向服務的 DevOps 服務,除了需要通過平臺級能力為開發(fā)團隊提供自動化的工程平臺,還需要 IaC、聲明式、GitOps 等技術手段幫助開發(fā)團隊屏蔽復雜的底層基礎設施,從而降低研發(fā)團隊對云原生底層技術的學習門檻。
而數(shù)據(jù)驅動的研發(fā)效能管理也將是未來企業(yè)將更加關注的管理模式,通過價值流工具捕獲關鍵節(jié)點指標,通過數(shù)據(jù)來衡量研發(fā)效能,從而提高生產(chǎn)力。這將需要企業(yè)在數(shù)據(jù)收集、分析和利用方面進行投資。
最后一點,則是開源工具的逐步普及。今天我們可以看到,開源工具在研發(fā)領域中的應用已經(jīng)越來越廣泛了,未來企業(yè)中的研發(fā)團隊也會更多地采用開源工具來提高效率和降低成本。
3、FinOps的現(xiàn)在與未來
在訪談末尾,黃俊洪分享了自己對于如今云原生領域大火的 FinOps 理念的一些認知與理解。黃俊洪認為:FinOps 的本質是財務管理、企業(yè)經(jīng)營和成本優(yōu)化的組合。之所以 FinOps 會受到如此關注,主要是由于云原生技術棧確實提供了一系列提高資源利用率的基礎能力,如對資源更細粒度的管控和分配、自動伸縮能力等。
對企業(yè)而言,理論上將業(yè)務遷移到云原生平臺以后,利用率應該大大提升才對。但企業(yè)對云原生的技術認知往往還停留在以前的階段,在虛擬機上怎么用資源,到了云原生平臺照舊,并沒有意識到可以在保證業(yè)務穩(wěn)定的前提下,采用成本更優(yōu)化的手段。
尤其在疫情這幾年,各企業(yè)對于成本優(yōu)化的訴求更加強烈,但根據(jù)騰訊云的觀察,不少國內企業(yè)還處在業(yè)務遷上云原生的時期,當企業(yè)面對業(yè)務壓力時,成本管控的優(yōu)先級自然會先“放一放”;只有當業(yè)務趨于穩(wěn)定,應用的容器化、架構的現(xiàn)代化接近完成時,企業(yè)才會將關注點轉到成本優(yōu)化上,但這并不是一個理想的狀態(tài)。
根據(jù) FinOps 的理念,實際上,云成本優(yōu)化應該從上云的第一天就開始規(guī)劃,并且不斷優(yōu)化。如果企業(yè)能夠很好地借助云廠商提供的智能推薦、智能調度等能力,節(jié)省 20% 云成本對每一家企業(yè)用戶而言都會是一個很容易達成的目標。
對于 FinOps 技術未來的發(fā)展方向,黃俊洪則做出了如下幾點預測。
成本清晰化:越來越多云平臺已經(jīng)在提供基礎賬單的基礎上增加了多維賬單查詢、標簽管理、成本分配等能力;第三方 FinOps 工具也在努力將費用與不同部門、不同業(yè)務的真實用量關聯(lián),讓不同業(yè)務的云成本開銷清晰化。
流程標準化:FinOps 的實踐是一個不斷完善標準化流程的過程, FinOps 的全生命周期包括預算、資源申領、配額下發(fā)、成本優(yōu)化、核算等全流程,中間配合貨幣化結算、成熟度模型等標準化手段推動,未來的 FinOps 實踐會越來越標準。
成本管控智能化:成本浪費的核心原因是云用戶對業(yè)務資源需求不能精確把握,對資源使用方法不科學導致的后果。用戶學習不同云的多種計費模型,學習不同特征業(yè)務的資源需求的成本非常高,靠人力的精準優(yōu)化難度大。智能化的云平臺和優(yōu)化工具基于資源畫像和成本模型,基于不同預測算法可以給出合理優(yōu)化建議,降低成本優(yōu)化的落地門檻。
歸根結底,伴隨著各領域企業(yè)的持續(xù)發(fā)展,騰訊云也在根據(jù)企業(yè)的需求變化不斷優(yōu)化自身的云計算基礎設施與云原生技術能力。從始至終,騰訊云在技術層面的深耕都未曾停歇,這也是如今騰訊云能夠在云上提供如此豐富產(chǎn)品能力的核心原因。對企業(yè)而言,無論是此前提到的 FinOps 技術,還是如今非?;鸨?LLM 大模型,利用云上的算力集群都能夠更加充分地發(fā)揮它們的技術價值。更好地幫助企業(yè)實現(xiàn)它們的訴求,無論在過去、現(xiàn)在還是將來,都會是騰訊云最核心的目標與責任。