Grok 4 發(fā)布,地表最強 AI,所有學(xué)術(shù)領(lǐng)域達到博士水平
7月9日晚間,Elon Musk正式發(fā)布他迄今為止最強的人工智能模型:Grok 4。
這款模型由他領(lǐng)導(dǎo)的xAI團隊打造,被Musk本人形容為“大爆炸級別的智能進化”。
在推特上,官方賬號稱:Grok 4是“地表最強”(世界上最強大)的AI模型。顯然,這不是簡單升級,而是一次全方位能力的躍遷。
圖片
據(jù)悉,Grok 4具備自然語音對話功能,能像人類一樣順暢表達,打破以往AI對話割裂感。
它不僅能處理文本,還可支持圖像輸入,未來甚至可能加入視頻識別功能,大步邁入真正的多模態(tài)AI時代。
開發(fā)者還將獲得“Grok 4 Code”專屬版本,用于寫代碼、調(diào)試和解釋邏輯,直逼GitHub Copilot與GPT-4的水平。
據(jù)說,Grok 4不只是聰明,它甚至“會唱歌”,聲音自然,還能理解互聯(lián)網(wǎng)語言、俚語和段子,成為最懂網(wǎng)絡(luò)文化的AI之一。
圖片
目前,對于Gork-4,在官網(wǎng)付費用戶已經(jīng)可以使用。
Grok 4的發(fā)布并非“情緒宣傳”,而是有硬核數(shù)據(jù)為背書。根據(jù)Artificial Analysis的完整基準測試,Grok 4以AI指數(shù)73分,首次登頂全球第一。
圖片
這一分數(shù)直接擊敗了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。
更關(guān)鍵的是,Grok 4在數(shù)學(xué)、編碼和綜合推理測試中全面碾壓,成為“人類最后的考試”上表現(xiàn)最強的AI。
在LiveCodeBench和SciCode測試中,Grok 4取得編碼準確率88%,創(chuàng)造歷史最高紀錄。
Image
圖片來源:https://x.com/apples_jimmy/status/1943167164359545137/photo/1
在GPQA Diamond測試中也拿下88%的高分,超過此前由Gemini 2.5 Pro保持的84%記錄。
“人類最后的考試”中,Grok 4 heavy版獲得50.7%的突破性成績,是目前唯一觸及這一高度的模型。
在AIME 2024和MMLU-Pro這兩項權(quán)威測試中,分別斬獲94%和87%的驚人得分。
圖片
據(jù)推特網(wǎng)友,對于這個模型的能力,Elon Musk說:“Grok 4可能在所有領(lǐng)域達到博士水平的模型?!?/span>
圖片
也有技術(shù)觀察者提醒:“那場考試的名字叫‘人類最后的考試’,但很可能不是AI的極限,而是人類理解力的終點?!?/span>
此外,雖然它的輸出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依舊優(yōu)于Claude 4 Opus(66 tokens/s),性能穩(wěn)居一線。
同時,Grok 4支持長達256k token的上下文處理,允許進行復(fù)雜文檔分析與記憶性任務(wù)處理。
它還能調(diào)用函數(shù)、生成結(jié)構(gòu)化結(jié)果,整體架構(gòu)更適合應(yīng)用于科研、商業(yè)、教育等高負載任務(wù)場景。
定價方面仍與Grok 3持平:每百萬輸入token收取3美元,輸出為15美元,緩存輸入更低至0.75美元。