馬斯克新模型性價比拉滿:1折價格實現(xiàn)Gemini 2.5性能,支持2M上下文
馬斯克xAI又出手了!
這次閃亮登場的是Grok 4 Fast——
不僅實現(xiàn)1折價格追平Gemini 2.5,還支持2M上下文窗口。

除此之外,這個全新的多模態(tài)推理模型還可與X實現(xiàn)無縫銜接。
例如,給它輸入以下提示詞:
幫我找一篇今年的X帖子,其中mkbhd分別拿著書本式折疊手機和翻蓋式折疊手機。
Grok 4 Fast不僅詳細描述了帖子內(nèi)容,提供了準確鏈接,甚至還貼心地附上了相關(guān)的YouTube視頻網(wǎng)址。

下面具體來看。
以最低的成本實現(xiàn)最高的性能
可以說,Grok 4 Fast這一波在性價比這件事上樹立了新標桿。
在推理基準測試中,它不僅全面超越Grok 3 Mini,還大幅降低了Token成本。
與Grok 4相比,Grok 4 Fast在保持與前者性能差不多的同時,平均使用的思考Token數(shù)量減少了40%。

根據(jù)Artificial Analysis的獨立評測驗證,在“人工分析智能指數(shù)”榜單中,Grok 4 Fast與其它公開可用模型相比,呈現(xiàn)出業(yè)界領(lǐng)先的“價格-智能”比。

除此之外,Grok 4 Fast還在LMArena上進行了對戰(zhàn)測試。
在搜索競技場中, grok-4-fast-search以1163分的成績奪強勢登頂,較第二名o3-search領(lǐng)先17分,展現(xiàn)出顯著優(yōu)勢。

在文本競技場中,grok-4-fast-search排名第8 ,性能與grok-4-0709相當,在同體量模型中表現(xiàn)尤為出色,其余所有同類大小的模型排名均在第18位及以下。

如何實現(xiàn)的?
Grok 4 Fast采用端到端的工具使用強化學(xué)習(xí)(RL)進行訓(xùn)練,尤其擅長判斷何時調(diào)用工具,例如代碼執(zhí)行或網(wǎng)頁瀏覽。
除此之外,Grok 4 Fast還展現(xiàn)了前沿的智能搜索能力,能夠無縫瀏覽網(wǎng)頁和X,通過實時數(shù)據(jù)增強查詢效果。
它可在鏈接間快速跳轉(zhuǎn),處理多種媒體內(nèi)容(包括X上的圖像和視頻),并以光速整合分析結(jié)果。

過去,不同的推理模式需要依賴多個獨立模型。
但Grok 4 Fast推出了統(tǒng)一架構(gòu),通過系統(tǒng)提示詞調(diào)控,讓同一組模型參數(shù)既能處理長鏈思維推理任務(wù),也能完成快速響應(yīng)類非推理任務(wù)。
這種一體化設(shè)計顯著降低了端到端延遲與Token成本,使Grok 4 Fast成為實時應(yīng)用的理想選擇。
目前,Grok 4 Fast已面向所有用戶開放,Auto模式下的復(fù)雜查詢將自動調(diào)用Grok 4 Fast。
除此之外,Grok 4 Fast還將推出兩個新模型:
- grok-4-fast-reasoning
- grok-4-fast-non-reasoning
現(xiàn)已通過xAI API正式開放使用,具體定價如下:

One More Thing
Grok 4 Fast背后,馬斯克還剛剛從谷歌挖來了一位關(guān)鍵人才——
幫谷歌Gemini拿到了IMO、ICPC金牌的Dustin Tran。

他本科畢業(yè)于美國加州大學(xué)伯克利分校,博士畢業(yè)于哥倫比亞大學(xué),曾在OpenAI當過研究實習(xí)生,后在2017年加入谷歌。
作為已在谷歌DeepMind工作8年的高級研究科學(xué)家,Dustin Tran深度參與了Gemini系列模型的研發(fā)工作,還助力實現(xiàn)了谷歌模型在LMSYS排行榜上的首次登頂。
此外,他還是2.5代模型的評估專家,推動相關(guān)模型在WebDev Arena和HLE評測中榮獲第一。
在學(xué)術(shù)領(lǐng)域,Dustin Tran的論文主要集中在人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域,至今共被引用超過兩萬次,其中h-index有47,i10-index達60。





































