算力互聯(lián)互通火了,它到底意味著什么?
最近這段時(shí)間,算力互聯(lián)網(wǎng)的概念突然火了。
先是5月17日,在“2025年世界電信和信息社會(huì)日紀(jì)念活動(dòng)”上,中國信通院會(huì)同中國電信、中國移動(dòng)、中國聯(lián)通三大運(yùn)營商聯(lián)合啟動(dòng)“算力互聯(lián)網(wǎng)試驗(yàn)網(wǎng)”的建設(shè),并且發(fā)布了《算力互聯(lián)網(wǎng)體系架構(gòu)1.0》,引發(fā)了全網(wǎng)關(guān)注。
不久后,5月30日,工信部印發(fā)了《算力互聯(lián)互通行動(dòng)計(jì)劃》(以下簡稱《行動(dòng)計(jì)劃》)。其中,也明確提到了算力互聯(lián)網(wǎng),指出要“以算力互聯(lián)互通為主線,推動(dòng)構(gòu)建算力互聯(lián)網(wǎng),逐步培育形成全國統(tǒng)一算力服務(wù)大市場”。
圖片
一時(shí)間,算力互聯(lián)網(wǎng)這個(gè)概念刷屏各大媒體的頭條。人人紛紛議論:到底什么是算力互聯(lián)網(wǎng)?它和我們一直在用的傳統(tǒng)互聯(lián)網(wǎng)有什么不同?又將如何影響我們的生活?
今天這篇文章,小棗君就給大家做個(gè)深入解讀。
算力互聯(lián)網(wǎng)的誕生背景
關(guān)于算力互聯(lián)網(wǎng)的定義,小棗君覺得中國信通院副院長王志勤的解釋最容易理解——
“算力互聯(lián)網(wǎng)并不是一張新的網(wǎng)絡(luò),而是在現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)上,將分散在各地的算力資源連接在網(wǎng)上,通過標(biāo)準(zhǔn)化的算力標(biāo)識和協(xié)議接口,跨域資源互聯(lián)網(wǎng)絡(luò),實(shí)現(xiàn)全網(wǎng)異構(gòu)算力的智能感知、實(shí)時(shí)發(fā)現(xiàn)、隨需獲取?!?/p>
換言之,算力互聯(lián)網(wǎng),就是一張服務(wù)于算力流動(dòng)的網(wǎng)絡(luò)。它的作用,是進(jìn)一步實(shí)現(xiàn)算力的互聯(lián)互通,盤活現(xiàn)有的算力資源,提升算力的使用效率,降低使用成本,為用戶帶來更好的使用體驗(yàn)。
眾所周知,在目前我們所生活的數(shù)字時(shí)代,算力已然成為了一種關(guān)鍵的戰(zhàn)略資源。無論是我們的日常生活,還是企業(yè)的運(yùn)營、政府的治理,都依賴于算力的支撐。
近年來,隨著人工智能技術(shù)的全面爆發(fā),算力的需求呈現(xiàn)出指數(shù)級的增長態(tài)勢。
國內(nèi)各地建設(shè)了大量算力基礎(chǔ)設(shè)施。然而,算力資源的分布并不均衡(部分地區(qū)算力過剩,部分地區(qū)算力短缺),導(dǎo)致了算力資源的浪費(fèi),算力使用效率無法獲得提升。
提出算力互聯(lián)網(wǎng),就是為了解決這些問題。
前些年我們國家提出的東數(shù)西算戰(zhàn)略,還有運(yùn)營商提出的算力網(wǎng)絡(luò),也是致力于實(shí)現(xiàn)算力互聯(lián)互通。
算力互聯(lián)網(wǎng),比東數(shù)西算和算力網(wǎng)絡(luò)的目標(biāo)更大,是要實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)全域維度的互聯(lián)互通,把全網(wǎng)分散的算力基礎(chǔ)設(shè)施(算力孤島)連接起來,形成一個(gè)“經(jīng)脈暢通”的整體。
將來,個(gè)人和政企用戶使用算力,就會(huì)像使用水和電一樣,隨時(shí)隨地,即開即用,用多少買多少。
算力互聯(lián)網(wǎng)的建設(shè)挑戰(zhàn)
算力互聯(lián)網(wǎng)是在現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)上的進(jìn)一步升級。但是,因?yàn)樗懔I(yè)務(wù)形態(tài)和傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)形態(tài)有很大區(qū)別,所以,這個(gè)升級也面臨著重大挑戰(zhàn)。
我們不妨把實(shí)現(xiàn)算力互聯(lián)互通看作是一個(gè)“修路”項(xiàng)目。
首先,需要把路修通、修寬。
分布在各地的算力資源,要先實(shí)現(xiàn)物理上的連通。現(xiàn)在的AI智算任務(wù)涉及到海量的數(shù)據(jù),對數(shù)據(jù)傳輸帶寬有極高的要求,所以,路也必須足夠“寬敞”。
其次,是交通規(guī)則的統(tǒng)一。
制定統(tǒng)一的標(biāo)準(zhǔn)和規(guī)則,建立統(tǒng)一的算力標(biāo)識體系,是將不同主體、不同類型、不同地域的公共算力資源連接起來的前提。這是一個(gè)巨大的工作量。
第三,是確保安全。
安全是算力互聯(lián)互通的前提。如此龐大的網(wǎng)絡(luò),需要增強(qiáng)數(shù)據(jù)安全防護(hù)能力,解決算力資源的安全性和可靠性問題,確保用戶在使用算力時(shí)數(shù)據(jù)的安全和隱私保護(hù)。
算力互聯(lián)網(wǎng),僅實(shí)現(xiàn)算力的互聯(lián)互通是不夠的。它還涉及到一個(gè)關(guān)鍵環(huán)節(jié)——算力交易。
是的,算力既是資源,也是商品。流動(dòng)為交易創(chuàng)造了條件。但是,算力交易并不像我們平時(shí)買件衣服或買個(gè)手機(jī)那么簡單。算力具有無形性、異質(zhì)性、動(dòng)態(tài)性等特點(diǎn),這就給算力交易帶來了很大的難度。
如何尋找買方(賣方),如何定價(jià),如何結(jié)算,如何確保算力交易的公平性、透明性和高效性,都是算力互聯(lián)網(wǎng)建設(shè)所需要面對的問題。
建立全國統(tǒng)一的算力交易平臺(tái),制定完善的算力交易機(jī)制(包括算力定價(jià)、算力計(jì)量、算力交付等環(huán)節(jié)),從技術(shù)和制度上共同努力,才能實(shí)現(xiàn)算力的市場化運(yùn)作。
算力互聯(lián)網(wǎng)的建設(shè)方向
目前看來,算力互聯(lián)網(wǎng)采取了“先互聯(lián)、再成網(wǎng)、同步建市場”的總體思路,以“技術(shù)試驗(yàn)+生態(tài)共建”為核心,穩(wěn)步開展相關(guān)研究。
《行動(dòng)計(jì)劃》明確給出了算力互聯(lián)互通的建設(shè)目標(biāo):
到2026年,建立較為完備的算力互聯(lián)互通標(biāo)準(zhǔn)、標(biāo)識和規(guī)則體系。到2028年,基本實(shí)現(xiàn)全國公共算力標(biāo)準(zhǔn)化互聯(lián),逐步形成具備智能感知、實(shí)時(shí)發(fā)現(xiàn)、隨需獲取的算力互聯(lián)網(wǎng)。
《行動(dòng)計(jì)劃》也詳細(xì)提出了六方面共16項(xiàng)重點(diǎn)任務(wù)。如下圖所示:
圖片
這些重點(diǎn)任務(wù),覆蓋了推動(dòng)算力互聯(lián)互通的方方面面,包括底層技術(shù)、標(biāo)準(zhǔn)規(guī)范、互聯(lián)規(guī)則、連接場景,以及平臺(tái)、應(yīng)用和安全等。
限于篇幅,小棗君就不逐一介紹了。我們看其中幾個(gè)關(guān)鍵點(diǎn)。
首先,在《行動(dòng)計(jì)劃》中,有一句話特別值得關(guān)注——“推動(dòng)數(shù)據(jù)通信產(chǎn)業(yè)高質(zhì)量發(fā)展,支撐數(shù)據(jù)高效入算、算力無損互聯(lián)”。
這在國內(nèi)官方產(chǎn)業(yè)政策中是首次提出,充分表明數(shù)據(jù)通信產(chǎn)業(yè)將在這次算力互聯(lián)網(wǎng)建設(shè)中擔(dān)當(dāng)重要角色,并迎來前所未有的發(fā)展機(jī)遇和挑戰(zhàn)。
過去數(shù)十年,數(shù)據(jù)通信產(chǎn)業(yè)支撐了互聯(lián)網(wǎng)的蓬勃發(fā)展,也為整個(gè)社會(huì)的信息化數(shù)字化打下了堅(jiān)實(shí)的基礎(chǔ)。
如今,互聯(lián)網(wǎng)進(jìn)入新的發(fā)展階段,數(shù)據(jù)通信也需要引入技術(shù)創(chuàng)新和架構(gòu)革命,進(jìn)一步提升連接能力,為網(wǎng)絡(luò)的迭代升級保駕護(hù)航。
《行動(dòng)計(jì)劃》提到了算力互聯(lián)網(wǎng)的幾個(gè)關(guān)鍵應(yīng)用場景——入算場景、算間場景、算內(nèi)場景。我們不妨基于這些場景,看看數(shù)據(jù)通信是如何進(jìn)行應(yīng)對的。
● 算內(nèi)場景
算內(nèi),是數(shù)據(jù)中心(智算集群)內(nèi)部算力節(jié)點(diǎn)的高速互聯(lián)。
最近這幾年,很多企業(yè)都在搞AIGC大模型訓(xùn)練。這項(xiàng)工作對數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)提出了極大的挑戰(zhàn)。越來越龐大的集群規(guī)模,以及爆發(fā)式增長的流量,推動(dòng)數(shù)據(jù)中心內(nèi)部互聯(lián)帶寬高速增長,400GE都已經(jīng)成為入門標(biāo)配,800GE/1.6TE也開始走向現(xiàn)實(shí)。
除了網(wǎng)絡(luò)規(guī)模和吞吐能力之外,數(shù)據(jù)通信網(wǎng)絡(luò)在負(fù)載均衡、智能容錯(cuò)以及單點(diǎn)故障可自愈等方面也進(jìn)行了針對性提升。例如,通過網(wǎng)絡(luò)級負(fù)載均衡(NSLB)算法,可以對路徑規(guī)劃進(jìn)行優(yōu)化,消除網(wǎng)絡(luò)性能瓶頸,增加網(wǎng)絡(luò)吞吐能力。
經(jīng)過升級演進(jìn)的數(shù)據(jù)通信網(wǎng)絡(luò),滿足了算內(nèi)場景的高效互聯(lián)需求。AIGC大模型的訓(xùn)練效率得到了保障,訓(xùn)練成本也隨之下降。
● 算間場景
算間,是多個(gè)智算集群之間的網(wǎng)絡(luò)連接。
隨著大模型參數(shù)的不斷增加,訓(xùn)練集群也逐漸邁入萬卡、十萬卡時(shí)代。僅靠一個(gè)數(shù)據(jù)中心無法滿足這樣的規(guī)模,需要多個(gè)異地?cái)?shù)據(jù)中心進(jìn)行算間互聯(lián),以實(shí)現(xiàn)一個(gè)超大集群。
算間場景不僅需要“長距離+大帶寬”的傳輸能力,同時(shí)還需要實(shí)現(xiàn)零丟包。
傳統(tǒng)數(shù)據(jù)通信網(wǎng)絡(luò)是無法做到零丟包的。一旦丟包,網(wǎng)絡(luò)性能就會(huì)陡降,從而導(dǎo)致算力資源的浪費(fèi)。
而新型的數(shù)據(jù)通信,通過協(xié)議和算法上的改進(jìn),可以實(shí)時(shí)感知網(wǎng)絡(luò)擁塞情況,實(shí)現(xiàn)精準(zhǔn)的流控制,真正做到零丟包。哪怕數(shù)據(jù)中心之間相隔數(shù)千公里,都可以實(shí)現(xiàn)全局協(xié)同調(diào)度和無損互聯(lián)。
這同樣保障了訓(xùn)練任務(wù)的高效進(jìn)行,有利于縮短大模型訓(xùn)練周期,減少訓(xùn)練投入。
● 入算場景
入算,是端側(cè)(政企等用戶側(cè))與智算中心之間的數(shù)據(jù)連接場景。
端側(cè)每天產(chǎn)生大量的數(shù)據(jù),需要上傳到云端進(jìn)行處理。這種場景會(huì)產(chǎn)生大量的大象流(一種體量巨大的網(wǎng)絡(luò)數(shù)據(jù)流),占用非常大的網(wǎng)絡(luò)帶寬。
傳統(tǒng)的負(fù)載均衡技術(shù)無法應(yīng)對這種類型的流量,容易出現(xiàn)擁塞、丟包等,拉低網(wǎng)絡(luò)效率。
新型的數(shù)據(jù)通信網(wǎng)絡(luò),可以提供10Mbps~100Gbps彈性帶寬能力,通過引入大象流精準(zhǔn)識別和流級調(diào)度技術(shù),可以實(shí)現(xiàn)入算網(wǎng)絡(luò)的負(fù)載均衡和千萬級的流調(diào)度能力。
海量樣本高效入算,成為了現(xiàn)實(shí)。用戶再也不用寄送硬盤來傳送數(shù)據(jù)了。
圖片
總而言之,我們可以看到,數(shù)據(jù)通信網(wǎng)絡(luò)一直在持續(xù)演進(jìn)和創(chuàng)新,以此滿足時(shí)代發(fā)展的需求。AI浪潮的突然到來,加速推動(dòng)了數(shù)據(jù)通信網(wǎng)絡(luò)的演進(jìn)。算力互聯(lián)網(wǎng)的算內(nèi)、算間和入算場景,給了數(shù)據(jù)通信網(wǎng)絡(luò)更大的舞臺(tái),讓它有機(jī)會(huì)展現(xiàn)更多的價(jià)值和能力。
在這個(gè)舞臺(tái)上,數(shù)據(jù)通信網(wǎng)絡(luò)不僅需要滿足高速、大帶寬、低延遲等基本要求,還需要具備智能化、靈活調(diào)度、安全可靠等特性,以應(yīng)對日益復(fù)雜多變的場景需求。
算力最終是要為應(yīng)用場景服務(wù)的。數(shù)據(jù)通信網(wǎng)絡(luò)構(gòu)建了算力互聯(lián)網(wǎng),打通了算力和應(yīng)用之間的阻隔,實(shí)現(xiàn)了算力向各個(gè)垂直行業(yè)領(lǐng)域的賦能。這不僅推動(dòng)了全行業(yè)的數(shù)智化轉(zhuǎn)型,也加速了整個(gè)數(shù)字經(jīng)濟(jì)的重塑。
最后的話
目前,我國算力互聯(lián)網(wǎng)建設(shè)已取得初步成果。
在資源互聯(lián)調(diào)度層面,已完成131家企業(yè)499個(gè)算力資源池的資源標(biāo)識,匯聚了111.3 EFlops智能計(jì)算資源。這些資源,正在為千行百業(yè)的數(shù)智化轉(zhuǎn)型發(fā)揮重要作用。
算力互聯(lián)網(wǎng)的建設(shè)是一個(gè)復(fù)雜而龐大的系統(tǒng)工程,面臨的困難和挑戰(zhàn)仍然很多。