AI成為「耗電大戶(hù)」,除了新能源,還需要芯片創(chuàng)新
人工智能(AI)的爆炸式增長(zhǎng)促使科技巨頭(包括 Google、Meta、亞馬遜和微軟等)開(kāi)始構(gòu)建超大規(guī)模數(shù)據(jù)中心,這些數(shù)據(jù)中心需要的電力非常多 —— 是以千兆瓦計(jì)算而不是兆瓦。有分析師表示,這些巨型數(shù)據(jù)中心使用現(xiàn)有的半導(dǎo)體技術(shù)來(lái)挑戰(zhàn)美國(guó)老化的電網(wǎng)基礎(chǔ)設(shè)施,以滿(mǎn)足其能源消耗需求。
例如,高盛估計(jì)僅對(duì) ChatGPT 的一次查詢(xún)所消耗的數(shù)據(jù)中心電能就比語(yǔ)音識(shí)別等傳統(tǒng)人工智能功能多 10 倍,因此我們需要更強(qiáng)大的數(shù)據(jù)中心來(lái)支持這種需求。
如今,生成式 AI(GenAI)處于爆發(fā)階段,其參數(shù)量基本以?xún)|計(jì)算。但是,在運(yùn)行時(shí),例如基于 Transformer 的這類(lèi)模型無(wú)法像單詞識(shí)別那樣被壓縮成小巧、快速的推理引擎。原因是它們不會(huì)返回簡(jiǎn)單的單詞來(lái)響應(yīng)用戶(hù)輸入,而是將用戶(hù)查詢(xún)與其龐大的神經(jīng)網(wǎng)絡(luò)中的數(shù)萬(wàn)億個(gè)示例進(jìn)行比較。這些響應(yīng)需要從完整的段落到整篇白皮書(shū)、甚至是關(guān)于查詢(xún)主題的整本書(shū)來(lái)查找。
市場(chǎng)調(diào)研公司 Tirias Research 創(chuàng)始人兼首席分析師 Jim McGregor 表示,「十年之后, 我們將需要更多的算力。一旦我們進(jìn)入生成式 AI 大規(guī)模應(yīng)用的階段,視覺(jué)內(nèi)容創(chuàng)作的需求將非常龐大 —— 我們需要指數(shù)級(jí)提升數(shù)據(jù)中心的性能和功耗?!?nbsp;
為了支持當(dāng)前聊天級(jí)別的生成式 AI,Tirias 最新報(bào)告預(yù)測(cè),美國(guó)數(shù)據(jù)中心的能源消耗將從現(xiàn)在的 1.4 太瓦時(shí)(TWh)增加到 2028 年的 67 太瓦時(shí)。高盛估計(jì),如果將傳統(tǒng) AI 加入生成式 AI 的能耗計(jì)算,預(yù)計(jì)在同一時(shí)間段內(nèi)數(shù)據(jù)中心能耗的增長(zhǎng)會(huì)翻倍,結(jié)果是 AI 消耗大約占據(jù)數(shù)據(jù)中心總能耗的 19%,約占全美電網(wǎng)總發(fā)電量的 4%。
高盛評(píng)估報(bào)告顯示,滿(mǎn)足電網(wǎng)能源消耗強(qiáng)勁增長(zhǎng)的方法是將電網(wǎng)的發(fā)電方式從燃煤發(fā)電轉(zhuǎn)變?yōu)?60% 天然氣 和 40% 可再生能源 (主要是太陽(yáng)能和風(fēng)能)發(fā)電。
報(bào)告地址:https://www.goldmansachs.com/pdfs/insights/pages/generational-growth-ai-data-centers-and-the-coming-us-power-surge/report.pdf
為了防止電網(wǎng)過(guò)載,市面上已經(jīng)出現(xiàn)了使用核電發(fā)電機(jī)為超大規(guī)模數(shù)據(jù)中心提供專(zhuān)用電力的趨勢(shì),這些發(fā)電機(jī)被稱(chēng)為小型模塊化反應(yīng)堆(SMR)。
實(shí)際上,亞馬遜已經(jīng)從電力生產(chǎn)商 Talen Energy 購(gòu)買(mǎi)了一個(gè)接近 1 吉瓦容量的核電數(shù)據(jù)中心園區(qū)。
與此同時(shí),微軟正試圖通過(guò)投資無(wú)核廢料聚變反應(yīng)堆(與 Helion 合作)來(lái)超越 SMR 等裂變反應(yīng)堆。
McGregor 表示:盡管當(dāng)今的超大規(guī)模數(shù)據(jù)中心仍在使用現(xiàn)有的半導(dǎo)體技術(shù)和架構(gòu),但創(chuàng)新將長(zhǎng)期受到能耗無(wú)限增長(zhǎng)的限制。現(xiàn)階段節(jié)能減排方面的創(chuàng)新令人驚嘆,這種創(chuàng)新可與半導(dǎo)體行業(yè)的起步相媲美,而且在許多方面甚至增長(zhǎng)速度更快。如果技術(shù)停滯不前,那么到本世紀(jì)末,我們將耗盡可用能源。
根據(jù) Tirias 對(duì) GenAI 的預(yù)測(cè),數(shù)據(jù)中心使用低功耗混合 CPU/GPU 的 AI 加速器的數(shù)量將從目前的 362000 臺(tái)增長(zhǎng)到 2028 年的 1760 萬(wàn)臺(tái)。
用創(chuàng)新來(lái)解決危機(jī)
生成式 AI 對(duì)能源的需求越來(lái)越大,各類(lèi)廠(chǎng)家開(kāi)始研制更低功耗的芯片。
英偉達(dá)研發(fā)了 CPU/GPU 混合芯片;AMD 贏(yíng)得了 2022 年 Green500 超級(jí)計(jì)算機(jī)排名的冠軍。
Cerebras 公司在自家芯片的頂部安裝了一個(gè)水冷金屬冷板,可以實(shí)現(xiàn)更有效地散熱。
其他芯片制造商也在用節(jié)能的混合多芯片堆棧加速下一代數(shù)據(jù)中心處理器。此外,英特爾、三星和臺(tái)積電 (TSMC) 正在研發(fā)用于下一代處理器的 3D 堆疊晶體管,這種晶體管在大幅提高性能的同時(shí)還節(jié)省了功耗。
半導(dǎo)體架構(gòu)師也開(kāi)始將整個(gè)數(shù)據(jù)中心重新視為一個(gè)單一系統(tǒng)(如混合片上系統(tǒng)),投資可持續(xù)、更節(jié)能的架構(gòu),例如將整個(gè)數(shù)據(jù)中心的機(jī)架改用水冷(而不是風(fēng)冷)。
McGregor 表示,未來(lái)的數(shù)據(jù)中心還將利用多種能源之間的快速切換策略,包括太陽(yáng)能、風(fēng)能、天然氣、地?zé)?、電網(wǎng)和核反應(yīng)堆。
「人工智能的普及造成了一場(chǎng)能源危機(jī),但并不是無(wú)法解決的危機(jī)。在我看來(lái),所有這些危機(jī)論調(diào)中,最有趣的一點(diǎn)是,每當(dāng)一項(xiàng)新技術(shù)開(kāi)始普及時(shí),危機(jī)論調(diào)就會(huì)一再出現(xiàn) —— 危機(jī)預(yù)測(cè)者只是從現(xiàn)有技術(shù)進(jìn)行推斷,而沒(méi)有考慮到創(chuàng)新解決方案,例如,在 20 世紀(jì) 90 年代,互聯(lián)網(wǎng)開(kāi)始快速發(fā)展,我們?cè)A(yù)測(cè)全球一半的電力將被互聯(lián)網(wǎng)消耗。發(fā)生了什么?創(chuàng)新能夠跟上需求。當(dāng)比特幣起飛時(shí),同樣大規(guī)模的危機(jī)論調(diào)再次出現(xiàn),但它也失敗了,現(xiàn)在我們聽(tīng)到的是關(guān)于人工智能發(fā)展的同樣危機(jī)論調(diào)?!拱雽?dǎo)體市場(chǎng)研究公司 Objective Analysis 的經(jīng)理 Jim Handy 表示道。