馬斯克放話:Grok-4 于 7· 4 后上線,專治“寫碼難”!
6月27日,馬斯克發(fā)推宣布了 Grok-4 的最新動態(tài):這一 xAI 最新一代大模型,將在 7 月 4 日之后發(fā)布。據馬斯克推特,這次是重點是面向開發(fā)者的“專業(yè)編碼模型”升級。
圖片
Grok 是馬斯克在 OpenAI 之外另起爐灶的嘗試。2023 年 7 月,他創(chuàng)立 xAI,并迅速以驚人的速度發(fā)布 Grok 系列模型,與 ChatGPT 和 Claude 正面對抗。如今一年過去,Grok 正站在關鍵轉折點:從通用模型轉向專業(yè)工具,尤其是代碼生成這個最被市場看重的垂類。
在所有人工智能應用場景中,代碼是唯一一個既能“自我提升”又直接產生商業(yè)價值的場域。Grok 想切入它,意味著馬斯克不只想做 ChatGPT 的替代品,而想在 AI 編程上直接對標 GitHub Copilot、CodeWhisperer 和 OpenAI 的 Codex。
Grok 4 會是第一次真正意義上的“專業(yè)化嘗試”。
一個模型的拐點
Grok 從第一代開始就強調“實時性”和“個性化”,它連接 X 平臺(原 Twitter)數據源,在回答時可以抓取最新推文,因此在輿論跟蹤和事件摘要方面擁有獨特優(yōu)勢。但這些優(yōu)勢很快遇到天花板:“個性化聊天機器人”吸引不了專業(yè)用戶,尤其是開發(fā)者。
2025年2月份,Grok 3 發(fā)布時已經引入了代碼生成能力,但在多個評測中表現平平。原因有兩個:第一,數據質量不夠系統(tǒng)化;第二,訓練側重的是“對話風格”而非“語法正確性”和“推理深度”。
Grok 4 被明確標注為一次“重大更新”,并特別提到“a specialized coding model”,意味著此次升級將重點優(yōu)化代碼能力,有可能引入類似 ReAct(推理-行動)或 Toolformer(工具調用)機制。
更重要的是,這可能是 Grok 模型第一次在工程能力上逼近 OpenAI 的 GPT-4 Turbo 和 Anthropic 的 Claude 3 Opus。
馬斯克的“工程試驗場”
馬斯克多次公開表示:他希望把 Grok 融入自己管理的公司系統(tǒng),例如特斯拉、X、xAI 甚至 SpaceX。坊間傳聞稱,自 2025 年初起,Grok 已在特斯拉內部小范圍試點,用于文檔檢索、流程生成和測試代碼草稿,不過這一說法尚未獲得官方證實。
xAI 目前并未對外公布 Grok 代碼模型的訓練細節(jié),但從過往更新節(jié)奏來看,它采用的是“堆料式演進”:快速迭代、頻繁上線、持續(xù)加數據。與 OpenAI 的保守路線相比,這更像是 SpaceX 造火箭的節(jié)奏——試錯、爆炸、再修復。
截至 2025 年上半年,AI 編碼市場已經出現多個成熟選手:GitHub Copilot 的月活躍付費開發(fā)者已超過 180 萬;OpenAI 在 ChatGPT Enterprise 和 Team 版本中啟動了 VS Code 官方擴展的早期接入計劃,并逐步開放 Team API;Anthropic 在 Claude 3 中也大幅強化了代碼理解與調試能力。
相比之下,Grok 尚未推出官方 IDE 插件,盡管社區(qū)已經出現了第三方 VS Code 擴展;xAI 提供開放 API,但尚未發(fā)布專門的企業(yè)訂閱套餐。它更多仍停留在 X 平臺作為“增強版助手”的角色。這種定位使得它更像是一個“AI 知識流入口”,而不是工程工具。
Grok 4 的發(fā)布,也許是一次轉變的開始——如果它的專業(yè)代碼能力能真正落地,尤其是在 Python、TypeScript 或 Rust 這些開發(fā)者常用語言上的表現超過預期,它或許能從“聊天模型”跳出,成為“開發(fā)伙伴”。
不過市場對“馬斯克能否贏下開發(fā)者”仍有疑慮。開發(fā)者是一個慢熱、謹慎的群體。他們在乎的是 IDE 的響應速度、API 的調用成本、模型 hallucination (幻覺)率是否穩(wěn)定降低,而不是模型背后是誰。