AIGC算力全景與趨勢(shì)報(bào)告發(fā)布!一文解讀AIGC算力構(gòu)成、產(chǎn)業(yè)鏈條,還有五新趨勢(shì)判斷
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
AI算力從沒(méi)有任何一個(gè)時(shí)刻,比現(xiàn)在更受矚目。
大模型趨勢(shì)發(fā)生以來(lái),大模型的數(shù)量、規(guī)模,在短短幾月內(nèi)突增。
百億千億級(jí)別大模型飆升至數(shù)十個(gè),萬(wàn)億參數(shù)大模型已正式誕生。
在這樣的量級(jí)變化下,算力需求呈現(xiàn)出劇烈變化。
模型層公司幾乎在不計(jì)一切代價(jià)搶購(gòu)算力服務(wù),英偉達(dá)市值一度突破萬(wàn)億美元,云計(jì)算市場(chǎng)被加速重塑……
毫無(wú)疑問(wèn),算力之于AIGC產(chǎn)業(yè)發(fā)展,是如同水電、石油一樣的基礎(chǔ)能源。
在AIGC時(shí)代序幕拉起后,該如何理解算力產(chǎn)業(yè),就顯得尤為重要。
企業(yè)需要怎樣的算力?算力產(chǎn)業(yè)會(huì)因AIGC興起發(fā)生哪些變革?當(dāng)下算力市場(chǎng)構(gòu)成究竟如何?
《AIGC算力全景與趨勢(shì)報(bào)告》為此而來(lái),幫助大家理解這些問(wèn)題。
在報(bào)告中,量子位智庫(kù)系統(tǒng)性解析了AIGC算力構(gòu)成、產(chǎn)業(yè)鏈條,還進(jìn)一步指出了AIGC算力的五新趨勢(shì)及三大階段發(fā)展預(yù)測(cè)。

核心觀點(diǎn)包括:
- AIGC驅(qū)動(dòng)下,芯片競(jìng)逐高性能大算力,引入新計(jì)算架構(gòu);
 - AI服務(wù)器異軍突起,紅利曲線(xiàn)先訓(xùn)練后推理;
 - MaaS重塑云服務(wù)范式,AIGC商業(yè)模式閉環(huán);
 - AI模型一體機(jī)呼之欲出,傳統(tǒng)產(chǎn)業(yè)“開(kāi)箱即用”;
 - 智算中心護(hù)航AIGC運(yùn)營(yíng),算力租賃模式成新解;
…… 
具體細(xì)節(jié),我們逐一來(lái)看。
國(guó)產(chǎn)服務(wù)器廠商業(yè)務(wù)增量超30%
分析當(dāng)下產(chǎn)業(yè)現(xiàn)狀來(lái)看,產(chǎn)業(yè)主體主要包括:
- 芯片
 - AI服務(wù)器(集群)
 - 云計(jì)算
 
芯片層:AIGC兩大路線(xiàn)提供算力
在計(jì)算類(lèi)芯片中,目前業(yè)內(nèi)有兩種主流路線(xiàn)來(lái)滿(mǎn)足AIGC產(chǎn)業(yè)的算力需求。
一種是以英偉達(dá)為代表的GPU路線(xiàn),稱(chēng)為通用芯片。
另一種是以華為、寒武紀(jì)為代表的ASIC路線(xiàn),稱(chēng)為專(zhuān)用芯片路線(xiàn)。
目前,這兩種路線(xiàn)上匯集了不同類(lèi)型的玩家,它們承擔(dān)的計(jì)算任務(wù)也有區(qū)別。
通用芯片路線(xiàn)下,能夠完成多樣化計(jì)算任務(wù),并且適合大規(guī)模并行計(jì)算。
即通用芯片(GPU)更適合AIGC目前所需算力。
專(zhuān)用路線(xiàn)的優(yōu)勢(shì)體現(xiàn)在特定場(chǎng)景中的更優(yōu)能效比。由于專(zhuān)用芯片設(shè)計(jì)被用來(lái)執(zhí)行專(zhuān)門(mén)或定制化任務(wù),其在特定場(chǎng)景中能夠達(dá)到相較于通用芯片更優(yōu)的能效比和計(jì)算效率。
正因?yàn)閷?zhuān)用芯片在特定場(chǎng)景中能夠釋放出更大的計(jì)算效率,其也成為互聯(lián)網(wǎng)等云廠商自研芯片時(shí)選擇的技術(shù)路線(xiàn)。
通常,互聯(lián)網(wǎng)云廠商的自研芯片主要服務(wù)于自家產(chǎn)品,強(qiáng)調(diào)在自身生態(tài)中將芯片性能最大化釋放。
圖片
服務(wù)器層:業(yè)務(wù)增量明顯,以互聯(lián)網(wǎng)客戶(hù)為主
AIGC對(duì)于高性能計(jì)算的需求,使得AI服務(wù)器成為服務(wù)器領(lǐng)域業(yè)務(wù)增長(zhǎng)最快的細(xì)分種類(lèi)。
大模型訓(xùn)練,例如GPT-3,需要大量的計(jì)算資源和內(nèi)存,通常涉及使用數(shù)千甚至數(shù)萬(wàn)塊GPU來(lái)加快訓(xùn)練速度。
由于這些計(jì)算對(duì)芯片性能要求非常高,需要使用專(zhuān)門(mén)的硬件和軟件來(lái)支持大規(guī)模并行計(jì)算和高速數(shù)據(jù)傳輸。
AI服務(wù)器是專(zhuān)門(mén)為處理人工智能工作負(fù)載而設(shè)計(jì)的服務(wù)器,使用專(zhuān)門(mén)硬件加速器(如GPU、TPU等),以及高速網(wǎng)絡(luò)連接和存儲(chǔ),以提供高性能計(jì)算能力。
相比之下,CPU(通用服務(wù)器)通常不能滿(mǎn)足AIGC對(duì)極大算力的需求,其計(jì)算能力、內(nèi)存和存儲(chǔ)容量通常較低。另外,CPU通常不具備專(zhuān)門(mén)的硬件加速器,無(wú)法提供高速計(jì)算。
因此,大型模型訓(xùn)練需要依靠AI服務(wù)器集群來(lái)提供算力服務(wù)。
根據(jù)量子位智庫(kù)的調(diào)研顯示,今年AIGC爆發(fā)后,國(guó)產(chǎn)服務(wù)器廠商普遍業(yè)務(wù)增量在30%以上。
近日,TrendForce也將2022-2026年AI服務(wù)器出貨量年復(fù)合增長(zhǎng)率上調(diào)至22%。在AI服務(wù)器業(yè)務(wù)量激增的背后,最大的買(mǎi)家依然是互聯(lián)網(wǎng)公司。
2022年,AI服務(wù)器采購(gòu)占比中,字節(jié)跳動(dòng)、騰訊、阿里巴巴、百度等大廠成為主要采購(gòu)方。今年,大模型研發(fā)的火熱更是帶動(dòng)下游互聯(lián)網(wǎng)大廠購(gòu)買(mǎi)需求,使其依舊是AI服務(wù)器最大的買(mǎi)方。
云計(jì)算:MaaS重塑服務(wù)模式,新老玩家重構(gòu)競(jìng)爭(zhēng)力
MaaS模式最早由阿里提出,隨后互聯(lián)網(wǎng)大廠、人工智能企業(yè)(如商湯)均已引入MaaS模式。
此外,互聯(lián)網(wǎng)大廠、華為等企業(yè)已經(jīng)將自研芯片用于MaaS底座構(gòu)建中。
2023年,國(guó)內(nèi)頭部云廠商相繼推出自己的MaaS平臺(tái),基于大模型基座,為計(jì)算資源有限、缺乏專(zhuān)業(yè)經(jīng)驗(yàn)的企業(yè)提供一站式MaaS服務(wù)。
對(duì)于云廠商來(lái)講,MaaS服務(wù)的主要目的在于幫助客戶(hù)快速構(gòu)建行業(yè)專(zhuān)屬大模型?;诖耍茝S商之間的競(jìng)爭(zhēng)維度轉(zhuǎn)變?yōu)樗懔A(chǔ)設(shè)施、通用大模型能力、AI平臺(tái)/工具能力。
圖片
智算中心現(xiàn)狀:基建級(jí)AI算力供應(yīng),打造地區(qū)經(jīng)濟(jì)增長(zhǎng)新引擎
從計(jì)算設(shè)備分布來(lái)看,在服務(wù)器和AI服務(wù)器市場(chǎng)中,北京、廣東、浙江、上海、江蘇位居前五,(服務(wù)器和AI服務(wù)器)市場(chǎng)份額總計(jì)分別達(dá)到75%和90%(2021年數(shù)據(jù))。
從供給角度看,目前智算中心多分布在東部和中部省份,而AIGC業(yè)務(wù)需要處理海量數(shù)據(jù)導(dǎo)致東部算力資源成本過(guò)高。
將大模型訓(xùn)練等對(duì)計(jì)算要求高的任務(wù)移至西部地區(qū),形成“東數(shù)西訓(xùn)”,能夠有效降低成本,實(shí)現(xiàn)算網(wǎng)資源綜合成本最優(yōu)。
具體來(lái)講,針對(duì)算力需求供需不平衡等問(wèn)題,需要通過(guò)算力調(diào)度將東部的算力和數(shù)據(jù)處理任務(wù)轉(zhuǎn)移至成本較低的西部地區(qū)。其中,優(yōu)化東西部之間互聯(lián)網(wǎng)絡(luò)和樞紐節(jié)點(diǎn)間直連網(wǎng)絡(luò)是提升算力調(diào)度水平的關(guān)鍵。
從需求角度看,AIGC算力需求主要來(lái)自于研發(fā)AIGC大模型的廠商,主要分布在京津冀地區(qū)、長(zhǎng)三角及大灣區(qū)。
芯片服務(wù)器變革初現(xiàn)
大模型趨勢(shì)給算力提出新要求,催生底層硬件新轉(zhuǎn)變。我們從芯片和服務(wù)器兩個(gè)層面看起:
芯片層面
目前在高性能芯片中,英偉達(dá)A100占據(jù)絕對(duì)優(yōu)勢(shì),而A100在中國(guó)只有存量沒(méi)有增量,市場(chǎng)將給予國(guó)產(chǎn)GPU廠商更多機(jī)會(huì)。
此外,在芯片代工層面,目前7nm及以上制程沒(méi)有對(duì)應(yīng)的國(guó)產(chǎn)代工廠可以承接,GPU廠商多數(shù)選擇成熟制程+先進(jìn)封裝的方案來(lái)實(shí)現(xiàn)較高的性能指標(biāo)。
在服務(wù)器集群層面,通過(guò)多卡多機(jī)并行計(jì)算、高性能網(wǎng)絡(luò)實(shí)現(xiàn)高性能計(jì)算。
由于英偉達(dá)構(gòu)建的硬件產(chǎn)品+CUDA生態(tài)在10年內(nèi)很難突破,未來(lái)在高性能GPU受限的情況下,分析師預(yù)計(jì)硬件層將會(huì)有兩種主要解決方案,一種是發(fā)展GPU+片間互聯(lián)技術(shù),實(shí)現(xiàn)大規(guī)模并行計(jì)算。
另一種是跳出馮·諾依曼架構(gòu),發(fā)展存算一體架構(gòu),將計(jì)算單元與存儲(chǔ)單元融合,實(shí)現(xiàn)數(shù)量級(jí)的計(jì)算能效提升。
軟件層面,稀疏計(jì)算和構(gòu)建高性能網(wǎng)絡(luò)是目前兩種解決方案。
稀疏化計(jì)算的創(chuàng)新體現(xiàn)在算法層面,通過(guò)刪除無(wú)效或冗余的數(shù)據(jù)(此類(lèi)數(shù)據(jù)通常數(shù)量龐大),大幅減少數(shù)據(jù)的計(jì)算量,從而加快計(jì)算速度。
構(gòu)建高性能網(wǎng)絡(luò)的目的在于減少大模型訓(xùn)練時(shí)長(zhǎng)。通過(guò)構(gòu)建高性能網(wǎng)絡(luò),為每個(gè)計(jì)算節(jié)點(diǎn)超高通信帶寬,帶來(lái)數(shù)倍通行性能的提升,從而縮短大模型訓(xùn)練時(shí)長(zhǎng)。
服務(wù)器層面
AI大模型對(duì)算力需求呈指數(shù)級(jí)增長(zhǎng),使得具有更高配置的AI服務(wù)器成為AIGC算力的主要載體。
相比于傳統(tǒng)服務(wù)器,AI服務(wù)器的計(jì)算、存儲(chǔ)以及網(wǎng)絡(luò)傳輸能力能達(dá)到更高的水平。
例如,NVIDIA DGX A100服務(wù)器 8 個(gè) GPU+2 個(gè) CPU 的配置遠(yuǎn)高于傳統(tǒng)服務(wù)器 1~2 個(gè) CPU 的配置。
在我國(guó),智算中心是為人工智能(大模型)提供算力資源的公共基礎(chǔ)設(shè)施平臺(tái),其算力機(jī)組以AI訓(xùn)練服務(wù)器和AI推理服務(wù)器為主。
隨著大模型趨勢(shì)演進(jìn),未來(lái)AI服務(wù)器的主要需求將從訓(xùn)練側(cè)向推理側(cè)傾斜。根據(jù)IDC的預(yù)測(cè),到2026年,AIGC的算力62.2%將作用于模型推理。
行業(yè)變革催生新商業(yè)機(jī)遇
更進(jìn)一步,AI大模型趨勢(shì)給算力行業(yè)帶來(lái)全新機(jī)遇,新范式、新產(chǎn)品、新基建正在涌現(xiàn)。
新游戲規(guī)則:MaaS重塑云服務(wù)范式,AIGC商業(yè)模式閉環(huán)
MaaS(模型即服務(wù))在算力、算法和應(yīng)用層中嵌入大模型,以智能底座集成應(yīng)用并統(tǒng)一對(duì)外輸出。
MaaS的本質(zhì)是將行業(yè)內(nèi)通用的基礎(chǔ)技術(shù)提煉整合成服務(wù),滿(mǎn)足各類(lèi)應(yīng)用場(chǎng)景需求。
在商業(yè)化過(guò)程中,大模型能力以及配套的中間件工具,會(huì)成為企業(yè)對(duì)于云計(jì)算廠商的新考量維度。
云計(jì)算服務(wù)能力的判別式從算力水平轉(zhuǎn)向「云智一體」能力,在算力基礎(chǔ)設(shè)施之外,核心競(jìng)爭(zhēng)力轉(zhuǎn)變?yōu)榘阉懔Α⒛P秃蛨?chǎng)景應(yīng)用打造成標(biāo)準(zhǔn)化產(chǎn)品的能力。
圖片
新物種:AI模型一體機(jī)呼之欲出,傳統(tǒng)產(chǎn)業(yè)「開(kāi)箱即用」
AI模型一體機(jī)將軟硬件深度融合,根據(jù)企業(yè)不同需求,將對(duì)應(yīng)的產(chǎn)品或解決方案提前部署在AI服務(wù)器上,打包形成一整套解決方案。
AI模型一體機(jī)的成本優(yōu)勢(shì)主要體現(xiàn)在以下三點(diǎn):
- 1)整體采購(gòu)價(jià)格低于軟件+硬件分開(kāi)采購(gòu)的價(jià)格;
 - 2)企業(yè)單獨(dú)采購(gòu)服務(wù)器再交由AI企業(yè)部署軟件耗費(fèi)時(shí)間周期長(zhǎng),AI模型一體機(jī)能夠開(kāi)箱即用,降低交付成本;
 - 3)所需服務(wù)器數(shù)量大幅降低,為客戶(hù)節(jié)省空間成本。
 
新基建:智算中心護(hù)航AIGC運(yùn)營(yíng),算力租賃模式成新解
算力租賃模式可以有效降低大模型研發(fā)門(mén)檻,對(duì)于研發(fā)垂類(lèi)行業(yè)的小模型企業(yè)來(lái)說(shuō),沒(méi)有購(gòu)買(mǎi)足夠AI服務(wù)器的實(shí)力,公共算力基礎(chǔ)平臺(tái)將幫助中小型企業(yè)搭建其自身所需模型。
企業(yè)無(wú)需購(gòu)買(mǎi)服務(wù)器,通過(guò)瀏覽器便可訪(fǎng)問(wèn)算力中心,使用算力服務(wù)。
對(duì)于中小企業(yè)來(lái)講,無(wú)需依賴(lài)云廠商所構(gòu)建的大模型底座進(jìn)行二次開(kāi)發(fā),而是通過(guò)租用公有算力平臺(tái)的算力資源,研發(fā)垂類(lèi)行業(yè)小模型。
圖片
行業(yè)發(fā)展預(yù)測(cè)
綜上,量子位智庫(kù)對(duì)AIGC未來(lái)發(fā)展進(jìn)行預(yù)測(cè),可分為三個(gè)階段:
- AIGC基建期
 - AIGC開(kāi)發(fā)期
 - AIGC商業(yè)期
 
AIGC基建期
目前AIGC模型層的企業(yè)多數(shù)處在預(yù)訓(xùn)練階段,對(duì)于芯片的需求來(lái)源主要為GPU。
在初期階段,高性能GPU廠商將成為最大收益方。
然而目前國(guó)產(chǎn)GPU廠商距離英偉達(dá)有較大差距,率先受益方為存量市場(chǎng)中的優(yōu)勢(shì)方。
因此,國(guó)產(chǎn)AI服務(wù)器廠商是此階段的強(qiáng)勢(shì)供給方。目前,國(guó)內(nèi)在AI服務(wù)器領(lǐng)域已經(jīng)出現(xiàn)供不應(yīng)求的局面。

AIGC開(kāi)發(fā)期
中期階段(5年內(nèi)),在算力層是一個(gè)由訓(xùn)練向推理傾斜的過(guò)程。
在此階段,推理芯片將成為主要需求方。相比于GPU的高算力高功耗以及對(duì)應(yīng)的算力浪費(fèi),推理芯片更注重芯片的算效比,對(duì)于功耗和成本有更優(yōu)的把控。此外,這個(gè)階段也會(huì)是創(chuàng)新型芯片的機(jī)會(huì)。
分析師預(yù)計(jì)存算一體芯片、類(lèi)腦芯片、硅光芯片將有更多市場(chǎng)機(jī)會(huì)。
在推理階段,相較于訓(xùn)練階段的云計(jì)算,邊緣計(jì)算將有更多機(jī)會(huì)。
首先,推理階段對(duì)應(yīng)的應(yīng)用趨于多樣化,多樣化的需求使云計(jì)算會(huì)產(chǎn)生更多的算力浪費(fèi)且計(jì)算效率不高。
其次,邊緣計(jì)算能夠?yàn)榇竽P屯评硖峁┳銐蛩懔Α?/p>
在此階段,AI服務(wù)器廠商的紅利期逐漸見(jiàn)頂,需求將轉(zhuǎn)向成本更低的通用服務(wù)器;芯片也從GPU轉(zhuǎn)向NPU/ASIC/FPGA/CPU等多種形式并存。國(guó)產(chǎn)創(chuàng)新型芯片路線(xiàn)中,看好存算一體架構(gòu)的發(fā)展。

AIGC商業(yè)期
芯片的底層創(chuàng)新優(yōu)勢(shì)開(kāi)始顯現(xiàn),存算一體、光子芯片、類(lèi)腦芯片等具備真正革新技術(shù)的芯片廠商在市場(chǎng)中的作用增強(qiáng)。
AIGC算力所需的芯片種類(lèi)更加多元。
這個(gè)階段的企業(yè)對(duì)算力的考量更加綜合,不僅考慮算力大小,功耗和成本可能超過(guò)算力大小成為各模型層公司關(guān)心的指標(biāo)。
圖片
報(bào)告獲取
復(fù)制下方鏈接至瀏覽器打開(kāi):
https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f















 
 
 







 
 
 
 