偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

馬斯克開始瘋狂劇透Grok 5了

人工智能 新聞
剛剛ARC-AGI榜單官宣出現(xiàn)新SOTA,用的還是Grok 4+程序合成技術(shù)微調(diào)。

馬斯克的Grok 5偷偷藏不住了。

剛剛ARC-AGI榜單官宣出現(xiàn)新SOTA,用的還是Grok 4+程序合成技術(shù)微調(diào)。

好小汁,啥時(shí)候開始Grok都彎道超車了?OpenAI、Anthropic、谷歌一眾明星模型都被壓一頭。

圖片

一石激起千層浪,網(wǎng)友紛紛發(fā)問,那等Grok5出來,豈不是……

圖片

馬斯克也隨即出來回應(yīng):

我現(xiàn)在認(rèn)為Grok 5能達(dá)到AGI。

圖片

順便附贈(zèng)了一堆有關(guān)Grok 5的爆料。

馬斯克瘋狂劇透Grok 5

這事還得從Grok 4超越預(yù)期的表現(xiàn)說起,發(fā)布才兩個(gè)月就登上多個(gè)榜單第一的寶座,而就在剛剛,ARC Prize發(fā)布了兩個(gè)最新的ARC-AGI榜單SOTA方案:

  • 都是開源的。
  • 都使用的是Grok 4作為基礎(chǔ)模型。
  • 都實(shí)現(xiàn)了帶測(cè)試自適應(yīng)的程序合成外循環(huán)。

圖片

先簡(jiǎn)單介紹一下ARC-AGI排行榜,其旨在評(píng)估AI解決復(fù)雜難題的能力,類似于人類的智力測(cè)試,從而反映LLM的推理能力。

測(cè)試任務(wù)包含v1和v2版本,v2需要LLM完成更多的多步驟推理,一般來說,即使是最優(yōu)秀的LLM也只能在v2中獲得16%的準(zhǔn)確率。

圖片

GPT-5在二者上的得分依次是65.7%和9.9%,Claude Opus 4的得分是35.7%和8.6%,而Grok 4則是66.7%和16%。

Jeremy Berman的新方案則是在Grok 4基礎(chǔ)上,用英語替代了傳統(tǒng)的Python,最終得分來到79.6%和29.44%。

Eric Pang則在Jeremy的工作上,設(shè)計(jì)了一個(gè)受DreamCoder啟發(fā)、LLM輔助的程序合成系統(tǒng),能夠通過從不斷擴(kuò)展的程序庫中學(xué)習(xí)來解決越來越難的任務(wù)。

圖片

雖然得分沒有進(jìn)一步升高(77.1%和26%),但是成功讓每個(gè)任務(wù)的平均費(fèi)用得以下降(v1:8.42美元→2.56美元;v2:30.4美元→3.97美元)。

當(dāng)問及兩位作者選擇Grok 4的理由,他們均表示,這是他們測(cè)試下來效果最好的模型。

當(dāng)中所體現(xiàn)出的AGI潛力,也讓馬斯克感到自豪,隨即透露了一系列有關(guān)Grok 5的消息。

老馬表示,這才只是Grok 4,而Grok 5將很有可能達(dá)成AGI

圖片

而這個(gè)可能性也許能達(dá)到10%或者更高,要知道他此前并不認(rèn)為Grok版本會(huì)出現(xiàn)AGI。

圖片

與此同時(shí),他表示Grok 5將會(huì)在幾周之內(nèi)開始訓(xùn)練

圖片

加上此前他曾表示Grok 5將在今年年底前推出,或許我們將在不久后見證新的“LLM怪物”誕生。

所以為什么老馬能對(duì)Grok 5抱以如此強(qiáng)烈的信心呢?

訓(xùn)練數(shù)據(jù)及硬件資源的投入

歸根結(jié)底,是馬斯克在Grok訓(xùn)練中投入之深。

據(jù)悉,Grok 5將擁有較之前代更多的訓(xùn)練數(shù)據(jù)

Grok 4的訓(xùn)練量是Grok 2的100倍、Grok 3的10倍,而Grok 5則只會(huì)更多。

圖片

馬斯克擁有一整套的最新真實(shí)數(shù)據(jù)收集體系,其中xAI可以為其提供最新的直接數(shù)據(jù),特斯拉可以定期利用FSD和攝像頭捕獲圖像從而生成數(shù)據(jù),而擎天柱機(jī)器人也能從現(xiàn)實(shí)世界中生成大量數(shù)據(jù)。

可以說,馬斯克在當(dāng)下數(shù)據(jù)為王的時(shí)代,最不缺的就是數(shù)據(jù)。

此外,xAI在硬件資源上也投入頗多,目標(biāo)在5年內(nèi)完成相當(dāng)于5000萬臺(tái)H100 GPU同等算力的部署。

其專門為Grok系列打造的超級(jí)計(jì)算集群Colossus,已經(jīng)部署了約23萬張GPU。其中包括3萬張NVIDIA GB200(基于Nvidia的Blackwell架構(gòu)),將會(huì)持續(xù)為Grok提供強(qiáng)大的算力支持。

圖片

不過Grok 5究竟能否真正實(shí)現(xiàn)AGI,網(wǎng)友們對(duì)此也提出了質(zhì)疑:畢竟要成為AGI靠的可不僅僅是數(shù)據(jù)和馬斯克的聲明,一切還得看成品。

圖片

所以究竟誰才是能吃到第一只AGI螃蟹的AI公司,且讓我們拭目以待。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-12-13 08:46:33

人工智能ChatGPT機(jī)器人

2023-12-12 17:53:27

馬斯克AIChatGPT

2025-09-19 12:31:45

2022-12-30 13:51:08

2023-04-20 17:51:41

馬斯克微軟

2024-03-18 15:00:48

Grok現(xiàn)已開源Grok-1混合專家模型

2024-03-18 14:17:06

大模型開源人工智能

2025-02-19 15:01:09

2025-02-21 10:51:47

2025-10-21 09:00:00

2025-08-25 08:54:00

2025-07-16 09:33:04

2025-02-28 09:07:00

2025-03-21 09:50:56

2022-01-23 10:53:47

星鏈互聯(lián)網(wǎng)衛(wèi)星

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2025-07-25 09:25:05

2025-09-23 09:18:40

2024-08-06 16:03:18

馬斯克OpenAI人工智能

2023-10-25 11:05:54

深度偽造AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)