偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

馬斯克新模型性價比拉滿:1折價格實現(xiàn)Gemini 2.5性能,支持2M上下文

人工智能 新聞
這次閃亮登場的是Grok 4 Fast—— 不僅實現(xiàn)1折價格追平Gemini 2.5,還支持2M上下文窗口。

馬斯克xAI又出手了!

這次閃亮登場的是Grok 4 Fast——

不僅實現(xiàn)1折價格追平Gemini 2.5,還支持2M上下文窗口。

除此之外,這個全新的多模態(tài)推理模型還可與X實現(xiàn)無縫銜接。

例如,給它輸入以下提示詞:

幫我找一篇今年的X帖子,其中mkbhd分別拿著書本式折疊手機和翻蓋式折疊手機。

Grok 4 Fast不僅詳細描述了帖子內(nèi)容,提供了準確鏈接,甚至還貼心地附上了相關(guān)的YouTube視頻網(wǎng)址。

下面具體來看。

以最低的成本實現(xiàn)最高的性能

可以說,Grok 4 Fast這一波在性價比這件事上樹立了新標桿。

在推理基準測試中,它不僅全面超越Grok 3 Mini,還大幅降低了Token成本。

與Grok 4相比,Grok 4 Fast在保持與前者性能差不多的同時,平均使用的思考Token數(shù)量減少了40%。

根據(jù)Artificial Analysis的獨立評測驗證,在“人工分析智能指數(shù)”榜單中,Grok 4 Fast與其它公開可用模型相比,呈現(xiàn)出業(yè)界領(lǐng)先的“價格-智能”比。

除此之外,Grok 4 Fast還在LMArena上進行了對戰(zhàn)測試。

在搜索競技場中, grok-4-fast-search以1163分的成績奪強勢登頂,較第二名o3-search領(lǐng)先17分,展現(xiàn)出顯著優(yōu)勢。

在文本競技場中,grok-4-fast-search排名第8 ,性能與grok-4-0709相當,在同體量模型中表現(xiàn)尤為出色,其余所有同類大小的模型排名均在第18位及以下。

如何實現(xiàn)的?

Grok 4 Fast采用端到端的工具使用強化學(xué)習(xí)(RL)進行訓(xùn)練,尤其擅長判斷何時調(diào)用工具,例如代碼執(zhí)行或網(wǎng)頁瀏覽。

除此之外,Grok 4 Fast還展現(xiàn)了前沿的智能搜索能力,能夠無縫瀏覽網(wǎng)頁和X,通過實時數(shù)據(jù)增強查詢效果。

它可在鏈接間快速跳轉(zhuǎn),處理多種媒體內(nèi)容(包括X上的圖像和視頻),并以光速整合分析結(jié)果。

過去,不同的推理模式需要依賴多個獨立模型。

但Grok 4 Fast推出了統(tǒng)一架構(gòu),通過系統(tǒng)提示詞調(diào)控,讓同一組模型參數(shù)既能處理長鏈思維推理任務(wù),也能完成快速響應(yīng)類非推理任務(wù)。

這種一體化設(shè)計顯著降低了端到端延遲與Token成本,使Grok 4 Fast成為實時應(yīng)用的理想選擇。

目前,Grok 4 Fast已面向所有用戶開放,Auto模式下的復(fù)雜查詢將自動調(diào)用Grok 4 Fast。

除此之外,Grok 4 Fast還將推出兩個新模型:

  • grok-4-fast-reasoning
  • grok-4-fast-non-reasoning

現(xiàn)已通過xAI API正式開放使用,具體定價如下:

One More Thing

Grok 4 Fast背后,馬斯克還剛剛從谷歌挖來了一位關(guān)鍵人才——

幫谷歌Gemini拿到了IMO、ICPC金牌的Dustin Tran。


他本科畢業(yè)于美國加州大學(xué)伯克利分校,博士畢業(yè)于哥倫比亞大學(xué),曾在OpenAI當過研究實習(xí)生,后在2017年加入谷歌。

作為已在谷歌DeepMind工作8年的高級研究科學(xué)家,Dustin Tran深度參與了Gemini系列模型的研發(fā)工作,還助力實現(xiàn)了谷歌模型在LMSYS排行榜上的首次登頂。

此外,他還是2.5代模型的評估專家,推動相關(guān)模型在WebDev Arena和HLE評測中榮獲第一。

在學(xué)術(shù)領(lǐng)域,Dustin Tran的論文主要集中在人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域,至今共被引用超過兩萬次,其中h-index有47,i10-index達60。


責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-03-29 14:04:00

模型訓(xùn)練

2025-09-22 11:36:10

2025-09-26 08:03:41

2024-03-29 12:48:00

數(shù)據(jù)訓(xùn)練

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2025-08-29 09:04:54

2025-08-25 09:10:00

2022-04-18 14:47:49

推特馬斯克收購

2025-09-16 09:02:00

AI馬斯克模型

2025-02-06 09:52:12

2025-02-10 08:15:00

2022-05-23 15:57:18

加密貨幣黑客網(wǎng)絡(luò)攻擊

2025-03-18 08:14:05

2022-09-15 08:01:14

繼承基礎(chǔ)設(shè)施基礎(chǔ)服務(wù)

2025-01-22 13:30:00

2023-11-06 09:25:00

馬斯克模型

2023-11-05 09:57:01

2017-05-11 14:00:02

Flask請求上下文應(yīng)用上下文

2025-10-23 16:38:30

2023-07-24 12:27:08

論文斯坦福
點贊
收藏

51CTO技術(shù)棧公眾號