偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

馬斯克Grok 4 Fast首發(fā)霸榜!2.5倍速秒殺GPT-5,成本暴降98%直追Gemini

人工智能 新聞
xAI重磅推出Grok 4 Fast,創(chuàng)新融合推理與非推理雙模式,支持200萬(wàn)token上下文。在NYT Connections基準(zhǔn)和AA智能指數(shù)中表現(xiàn)卓越,超越多家頂級(jí)模型,標(biāo)志著AI智能獲取門(mén)檻的進(jìn)一步降低。

Grok 4 Fast官宣上線,馬斯克再次兌現(xiàn)了承諾!

它首次將推理/非推理「雙模式」合一,支持200萬(wàn)上下文,直接刷爆性價(jià)比SOTA。

推理測(cè)試中,Grok 4 Fast直接碾壓前代Grok 3 Mini,尤其是數(shù)學(xué)、編碼性能大增。

基準(zhǔn)測(cè)試顯示,Grok 4 Fast Reasoning登頂了擴(kuò)展版NYT Connections Benchmark(紐約時(shí)報(bào)連線謎題基準(zhǔn)測(cè)試,共759道題)。

Grok 4則排名第2,xAI在這個(gè)項(xiàng)目上展現(xiàn)了絕對(duì)的統(tǒng)治力。

對(duì)此,馬斯克自豪地表示,這就是進(jìn)展!

Grok 4 Fast Reasoning不僅擊敗了自家大哥Grok 4,也將GPT-5、o3-pro、Gemini 2.5 Pro、DeepSeek和Qwen 3等一眾模型斬于馬下。

Grok 4發(fā)布之后,基本上x(chóng)AI一月一迭代,速度堪稱驚人。

25/1成本,堪比Gemini 2.5 Pro

技術(shù)博客中,介紹了Grok 4 Fast所具備的四大核心優(yōu)勢(shì):

  • 行業(yè)SOTA級(jí)性價(jià)比
  • 最強(qiáng)網(wǎng)頁(yè)與X平臺(tái)搜索能力
  • 支持200萬(wàn)token的超長(zhǎng)上下文
  • 創(chuàng)新統(tǒng)一架構(gòu):?jiǎn)文P腿诤贤评砼c非推理雙模式

基于大規(guī)模RL技術(shù),xAI團(tuán)隊(duì)將Grok 4 Fast智能密度推向了極致。

實(shí)測(cè)表明,新模型性能直逼Grok 4,但平均節(jié)省了40%推理token的消耗,成本直降98%。

Grok 4 Fast不僅在NYT Connections Benchmark上表現(xiàn)出色,在著名的Artificial Analysis Intelligence Index(AA智能指數(shù))上同樣表現(xiàn)不俗。

它以大約25分之一的成本就實(shí)現(xiàn)了Gemini 2.5 Pro級(jí)別的智能!

Grok 4 Fast是一個(gè)將reasoning和non-reasoning融合統(tǒng)一的模型。

在推理模式下,Grok 4 Fast Reasoning在AA智能指數(shù)上取得了60分的亮眼成績(jī),與Gemini 2.5 Pro和Claude 4.1 Opus相當(dāng)。

低于此前發(fā)布的Grok 4和GPT-5(high)。

在編碼評(píng)測(cè)中,Grok 4 Fast表現(xiàn)尤為出色,在他們的LiveCodeBench榜單上登頂?shù)谝?,甚至超越其體量更大的自家大哥Grok 4。

成本方面Grok 4 Fast也挺有優(yōu)勢(shì):輸入0.2美元每百萬(wàn)Tokens,輸出0.5美元每百萬(wàn)Tokens。而且輸出效率很高。

Artificial Analysis在對(duì)Grok 4 Fast的預(yù)發(fā)布API進(jìn)行基準(zhǔn)測(cè)試時(shí),發(fā)現(xiàn)它的速度驚人非常迅速,達(dá)到了每秒344個(gè)輸出Token——約為 OpenAI GPT-5 API的2.5倍。端到端時(shí)延僅3.8秒,是目前最快的前沿模型。

Grok 4 Fast的發(fā)布延續(xù)了這個(gè)趨勢(shì):獲取AI智能的成本正在快速下降

在過(guò)去一年半里,獲取GPT-4級(jí)別智能的成本已下降約500倍;而且隨著智能前沿不斷被推進(jìn),獲取成本仍在持續(xù)走低。

原生工具調(diào)用

通過(guò)端到端工具使用RL訓(xùn)練,Grok 4 Fast特別擅長(zhǎng)智能判斷,何時(shí)調(diào)用代碼執(zhí)行、網(wǎng)頁(yè)瀏覽等工具。

舉個(gè)栗子,在搜索時(shí),它可以像人類一樣流暢地瀏覽網(wǎng)頁(yè)和X平臺(tái),并用實(shí)時(shí)數(shù)據(jù)增強(qiáng)查詢結(jié)果——

自動(dòng)跳轉(zhuǎn)鏈接、解析X上圖文視頻內(nèi)容,并以閃電速度整合信息得出結(jié)論。

可以看出,Grok 4 Fast基準(zhǔn)測(cè)試中,工具調(diào)用、深度研究等能力上完勝Grok 4。

現(xiàn)在,通過(guò)API即可調(diào)用推理/非推理Grok 4 Fast,每100萬(wàn)token價(jià)格再創(chuàng)新低。

什么是NYT Connections Benchmark?

NYT Connections Benchmark(紐約時(shí)報(bào)連線謎題基準(zhǔn)測(cè)試)的核心源于《紐約時(shí)報(bào)》推出的益智游戲「Connections」,后被轉(zhuǎn)化為評(píng)估大語(yǔ)言模型「語(yǔ)義關(guān)聯(lián)與分類推理能力」的重要基準(zhǔn)。

地址:https://github.com/lechmazur/nyt-connections/

其核心邏輯與原始游戲一致:給定16個(gè)看似無(wú)關(guān)聯(lián)的詞語(yǔ),AI需從語(yǔ)義、邏輯或常識(shí)維度,將它們精準(zhǔn)劃分成4組(每組4個(gè)詞),且每組需符合一個(gè)明確的「潛在關(guān)聯(lián)主題」(例如不同類型的水果、計(jì)算機(jī)硬件部件、經(jīng)典文學(xué)角色等)。

而此次Grok 4 Fast參加的「擴(kuò)展版」在基礎(chǔ)規(guī)則上進(jìn)一步提升難度——每個(gè)謎題額外增加多達(dá)4個(gè)「技巧詞」(即易混淆、可能同時(shí)貼合多個(gè)主題的干擾詞),更考驗(yàn)AI排除干擾、精準(zhǔn)捕捉深層語(yǔ)義關(guān)聯(lián)的能力。

舉兩個(gè)栗子。大家感受一下難度。

在擴(kuò)展版上模型的排名如下圖,xAI一家占據(jù)前兩名。

為排除LLM的訓(xùn)練數(shù)據(jù)中包含答案的可能性,基準(zhǔn)方還僅對(duì)最新增加的100道謎題進(jìn)行了測(cè)試。

結(jié)果依然是xAI家的Grok 4、Grok 4 Fast Reasoning排名前兩位,只不過(guò)這次大哥終于排第一了。

看來(lái)Grok 4 Fast Reasoning在智能上確實(shí)有兩下子,結(jié)合其速度快、價(jià)格低的優(yōu)勢(shì),很有可能成為開(kāi)發(fā)者的新寵。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2025-09-23 09:18:40

2025-09-19 09:10:00

2025-04-18 10:36:42

2024-09-02 08:30:00

大模型AI

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2025-07-10 16:58:04

2025-03-21 09:50:56

2022-08-24 14:41:58

馬斯克薪資

2025-08-25 08:54:00

2025-08-11 14:12:35

GPT-4oAIGrok 4

2025-03-05 08:50:00

模型AI數(shù)據(jù)

2024-03-29 12:48:00

數(shù)據(jù)訓(xùn)練

2023-12-13 08:46:33

人工智能ChatGPT機(jī)器人

2025-06-30 01:00:00

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2025-08-07 09:20:00

2025-08-19 08:08:05

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2025-09-22 11:36:10

2025-02-18 14:59:16

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)