偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Google公開與Gemini大模型聊一次耗能 ≈ 電視播放9秒 或 微波爐運(yùn)行1秒 | 且看他怎么算的

發(fā)布于 2025-8-26 06:40
瀏覽
0收藏

大模型在服務(wù)時的能源消耗一直備受關(guān)注,但具體的能耗數(shù)據(jù),尤其是來自頭部公司的數(shù)據(jù),長期處于未知狀態(tài)。這兩天,Google發(fā)布了一篇研究論文,首次系統(tǒng)性地披露了其Gemini大模型在真實(shí)生產(chǎn)環(huán)境中,與用戶聊一次(也就是響應(yīng)一次用戶提示,即常說的Prompt)的能源消耗——約0.24瓦時 (Wh) 。

為了讓這個數(shù)字更具實(shí)感,論文將其與日?;顒舆M(jìn)行了對比:這大致相當(dāng)于一臺現(xiàn)代電視機(jī)播放9秒,或是一臺家用微波爐運(yùn)行1秒所消耗的電能,或是人類大腦思考43秒(人類大腦的平均功率約為20瓦)。此外,完成這次響應(yīng)還需間接消耗約0.26毫升的水,形象地說,大約是5滴水。

這個數(shù)值顯著低于許多早期的第三方估算,引發(fā)了業(yè)界的廣泛討論。那么,Google是如何精確計算出這個數(shù)字的?

解構(gòu)0.24瓦時:全面衡量AI服務(wù)的真實(shí)能耗

要準(zhǔn)確評估大模型的能耗,僅僅關(guān)注AI加速芯片(如GPU或TPU)是遠(yuǎn)遠(yuǎn)不夠的。Google此次采用了一種“綜合測量方法” (Comprehensive Approach),旨在覆蓋大模型服務(wù)全鏈條中的所有關(guān)鍵能耗環(huán)節(jié),從而提供一個更完整、更真實(shí)的能耗視圖。值得注意的是,該數(shù)值代表的是響應(yīng)一個“典型”提示的能耗。為避免被少數(shù)極度復(fù)雜的提示拉高數(shù)據(jù),Google計算的是所有提示能耗排序后的“中位數(shù)”,而非簡單的算術(shù)平均值。這使得0.24瓦時這個數(shù)字更具代表性。

一次Gemini響應(yīng)的0.24瓦時能耗,主要由以下四個部分構(gòu)成:

  1. 活躍AI加速器 (占58%, 約0.14 Wh) :這是能耗的核心部分,即專門用于模型推理計算的硬件(如Google的TPU)在工作時消耗的能量。這是驅(qū)動AI“思考”的直接能源開銷。
  2. 活躍CPU與內(nèi)存 (占24%, 約0.06 Wh) :AI加速器需要主機(jī)CPU和DRAM內(nèi)存的協(xié)同工作,以完成任務(wù)調(diào)度、數(shù)據(jù)傳輸?shù)裙δ?。這部分是保障AI系統(tǒng)穩(wěn)定運(yùn)行不可或缺的支撐能耗。
  3. 閑置機(jī)器資源 (占10%, 約0.02 Wh) :為了保證全球用戶能夠隨時獲得快速、可靠的服務(wù),必須預(yù)留一部分服務(wù)器處于待命狀態(tài)。這些“閑置”資源雖然未在執(zhí)行計算,但其基礎(chǔ)待機(jī)功耗是維持服務(wù)高可用性的必要成本。
  4. 數(shù)據(jù)中心基礎(chǔ)設(shè)施開銷 (占8%, 約0.02 Wh) :這部分能耗來自于維持?jǐn)?shù)據(jù)中心運(yùn)行的龐大基礎(chǔ)設(shè)施,主要是指用于服務(wù)器散熱的冷卻系統(tǒng),以及電力在傳輸和轉(zhuǎn)換過程中的損耗。這也是AI服務(wù)會消耗水資源的主要原因。

通過將這四個部分系統(tǒng)性地納入考量,Google得以描繪出AI服務(wù)在真實(shí)世界中的完整能源足跡。

驚人的效率提升與未來展望

該研究報告最具啟發(fā)性的發(fā)現(xiàn),并非僅僅是當(dāng)前的能耗數(shù)字,而是AI能效優(yōu)化的驚人速度。

報告數(shù)據(jù)顯示,通過在模型架構(gòu)、算法、軟硬件協(xié)同設(shè)計以及數(shù)據(jù)中心運(yùn)營效率等方面的持續(xù)優(yōu)化,從2024年5月到2025年5月的短短一年間,Gemini單次響應(yīng)的平均能耗降低了33倍,相應(yīng)的碳足跡減少了44倍。

這一成果源于系統(tǒng)性的工程努力,包括但不限于:構(gòu)建更高效的Transformer模型架構(gòu)、應(yīng)用先進(jìn)的量化算法、設(shè)計專為AI負(fù)載優(yōu)化的TPU芯片,以及部署行業(yè)領(lǐng)先的超高效率數(shù)據(jù)中心。

這清晰地表明,當(dāng)前公布的0.24瓦時能耗,僅僅是技術(shù)發(fā)展途中的一個動態(tài)快照。AI的能源效率正沿著一條非常陡峭的曲線持續(xù)改進(jìn)。隨著未來更先進(jìn)的模型、功耗更低的硬件和更綠色的能源策略被不斷應(yīng)用,AI服務(wù)的單次能耗仍有巨大的優(yōu)化空間。

附錄

論文URL:??https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf??

本文轉(zhuǎn)載自???后向傳播???,作者: 張發(fā)恩

標(biāo)簽
已于2025-8-26 06:48:27修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦