拿下所有榜單第一!「月更狂魔」谷歌,如何憑借算力帝國(guó)強(qiáng)勢(shì)炸場(chǎng)? 原創(chuàng)
北京時(shí)間凌晨,谷歌發(fā)布最新版Gemini 2.5 Pro。這款被譽(yù)為 “最智能” 的模型,首次在3月份宣布,隨后在5月份進(jìn)行了升級(jí)。
?
?
此次更新,距離谷歌上次更新僅僅過(guò)去一個(gè)月。而「月更」的Gemini 2.5 Pro(06-05),不僅全方位打敗舊版模型,更在各大AI榜單中再次拿下第一。
?
在權(quán)威評(píng)測(cè)平臺(tái)LMArena的最新榜單上,相較于舊版本,LMArena測(cè)試分?jǐn)?shù)提高了24分,WebDevArena 則提升了35分,當(dāng)前在排行榜上名列前茅。
?
?
谷歌的基準(zhǔn)測(cè)試顯示,該模型在編碼能力上超過(guò)了o3、o3-mini、o4-mini,Anthropi的Claude4Opus,以及xAI的Grok3Beta 和DeepSeek R1等競(jìng)爭(zhēng)對(duì)手。
?
同時(shí),在編碼能力方面,它也是碾壓級(jí)別的存在,在高難度的測(cè)試GPQA 和 “人類(lèi)的最后考試”(HLE)測(cè)試中,Gemini2.5Pro顯示出其強(qiáng)大的智能化能力。
?
?
此外,谷歌回應(yīng)了用戶(hù)關(guān)于之前版本性能波動(dòng)的反饋,表示已經(jīng)對(duì)模型在風(fēng)格和結(jié)構(gòu)方面進(jìn)行了優(yōu)化,使其更加具備創(chuàng)造性和清晰的回答格式,從而提升了用戶(hù)的交互體驗(yàn)。
?
「月更」背后的算力引擎
?
谷歌的“月更”迭代速度在傳統(tǒng)AI研發(fā)中難以想象,其背后是谷歌全球分布的超級(jí)計(jì)算集群在提供支撐。
?
今年 4 月,谷歌發(fā)布第七代 TPU Ironwood——這顆專(zhuān)為深度思考模型打造的芯片,單卡算力達(dá)4614 Teraflops,媲美英偉達(dá)旗艦B200,而其自研的Jupiter光交換網(wǎng)絡(luò),可將9216塊芯片拼接為 42.5 ExaFLOPS(百億億次)的超級(jí)智算集群。
?
?
而其他競(jìng)爭(zhēng)對(duì)手,以xAI為例,其為了訓(xùn)練Grok 3也配備了20萬(wàn)個(gè)NVIDIA H100 GPU 組成的Colossus超級(jí)計(jì)算機(jī),累計(jì)訓(xùn)練時(shí)長(zhǎng)達(dá)2億GPU小時(shí)。
?
另一方面,算力投入正成為科技巨頭的關(guān)鍵一戰(zhàn)。
?
微軟、谷歌等AI巨頭全年資本支出大幅增長(zhǎng),并投入巨額資金用于服務(wù)器和數(shù)據(jù)中心的建設(shè)。
?
Meta更將年度資本開(kāi)支計(jì)劃上調(diào),全力押注AI產(chǎn)品開(kāi)發(fā)及數(shù)據(jù)中心建設(shè)。
?
算力:AI競(jìng)賽的核心戰(zhàn)場(chǎng)
?
谷歌的閃電迭代揭示了一個(gè)殘酷現(xiàn)實(shí):在當(dāng)今AI競(jìng)賽中,算力基礎(chǔ)設(shè)施已成為決定勝負(fù)的核心要素之一。
?
加強(qiáng)算力基礎(chǔ)設(shè)施建設(shè),正成為國(guó)內(nèi)外科技發(fā)展共識(shí)。
?
政策層面,中國(guó)正加速算力基礎(chǔ)設(shè)施建設(shè)。根據(jù)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,到2025年,中國(guó)智能算力在總算力中的占比將由現(xiàn)在的20%左右提升至35%。目前全國(guó)已有超過(guò)30個(gè)城市在建或籌建智算中心。
?
整個(gè)社會(huì)都在向數(shù)字化轉(zhuǎn)型,這輪AI發(fā)展的浪潮毋庸置疑會(huì)帶來(lái)一次新的工業(yè)革命和智能革命,整個(gè)算力產(chǎn)業(yè)都將成為人類(lèi)社會(huì)基礎(chǔ)設(shè)施級(jí)的存在。
