Claude Opus 4.1火速發(fā)布!坐穩(wěn)編程之王,官方:馬上還有大更新
還是Claude痛快,Claude Opus 4.1前腳曝光,今天這就正式發(fā)了。
編程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。
此外在Agent任務(wù)和推理方面進(jìn)一步升級(jí)。
但加量不加價(jià),定價(jià)和Claude Opus 4一樣。

官方說(shuō)計(jì)劃在未來(lái)幾周對(duì)模型進(jìn)行更大規(guī)模升級(jí)與改進(jìn),看來(lái)真就只是一次小更新,替代Opus 4。

實(shí)測(cè)用它做一個(gè)俄羅斯方塊小游戲,提示詞是“build the tetris game”,表現(xiàn)很穩(wěn)。

有人覺(jué)得,Anthropic可能本來(lái)不想發(fā)模型,但是奈何GPT-5/Gemini-3的消息太多,為了保持市場(chǎng)競(jìng)爭(zhēng)力所以先更新一波。

值得一提的是,Claude Opus 4.1這篇發(fā)布blog雖然簡(jiǎn)短,但是里面的心機(jī)可不老少——秀性能提升、秀客戶關(guān)系、還變相證明自家模型真實(shí)好用。
現(xiàn)在的硅谷AI圈,真有意思哇。
明曬模型性能,暗秀客戶關(guān)系
Anthropic首先曬了大家最關(guān)心的模型編程能力。
在SWE-bench上,Opus 4.1超越Opus 4、Gemini 2.5 Pro、o3,將性能提升至74.5%,拿下新SOTA。
同時(shí)還提升了深度研究和數(shù)據(jù)分析的技能,特別是在細(xì)節(jié)追蹤和Agent檢索方面。

其次,他們還找來(lái)客戶做背書(shū),邀請(qǐng)他們分享了內(nèi)測(cè)中覺(jué)得Opus 4.1印象深刻的能力。既能體現(xiàn)自家模型在真實(shí)場(chǎng)景中好用,也暗暗秀了一把自己的客戶訂單。
根據(jù)GitHub給出的三方結(jié)果,Opus 4.1各個(gè)方面都較Opus 4有所改進(jìn),特別是在跨文件重構(gòu)代碼上,提升明顯。
Rakuten Group(日本樂(lè)天株式會(huì)社)表示,Opus 4.1很擅長(zhǎng)在大型代碼庫(kù)中精準(zhǔn)定位、修復(fù)bug,且不需要進(jìn)行不必要的調(diào)整、也不會(huì)產(chǎn)生新的bug,他們團(tuán)隊(duì)很喜歡在日常任務(wù)中使用這一功能。
Windsurf則表示,在初級(jí)開(kāi)發(fā)基準(zhǔn)測(cè)試中,Opus4到Opus 4.1的提升,和此前Sonnet 3.7到Sonnet 4的提升一樣大。
這里插一句,因?yàn)閬啔v山大·王帶團(tuán)跳槽Meta,Windsurf剩余團(tuán)隊(duì)去向不明期間,Anthropic還斷供了Windsurf一段時(shí)間,這應(yīng)該是因?yàn)楫?dāng)時(shí)OpenAI要收購(gòu)Windsurf。
如今隨著Windsurf被Cognition收購(gòu),這種封鎖已經(jīng)解除,借著此次模型升級(jí),Anthropic也算是亮明“大家還是好伙伴”的態(tài)度。
至于為啥找這么多客戶來(lái)背書(shū)……前段時(shí)間GPT-5被泄露可不只有ChatGPT這邊,還包括Cursor等合作平臺(tái),是故意的還是不小心不知道,但是OpenAI和誰(shuí)合作大家都清楚了。Anthropic也想曬客戶關(guān)系,也很正常。
最后,這篇Blog很簡(jiǎn)短,官方也明說(shuō)就是小升級(jí)。
這種文風(fēng)更受開(kāi)發(fā)者們喜愛(ài),畢竟隔壁的大忽悠實(shí)在是emmm……太能拉高大家預(yù)期了。

不管是有意還是無(wú)意,Anthropic都和最近一直炒GPT-5熱度的OpenAI形成鮮明對(duì)比,誰(shuí)現(xiàn)在更加技術(shù)本色,大家想必也心中有選擇。
以及Opus 4.1的System Card也一同發(fā)布,其中表明Opus 4.1是對(duì)Opus 4的進(jìn)一步調(diào)整,模型的核心尺寸或訓(xùn)練方法都沒(méi)有變化。
同時(shí)Anthropic也公布了Opus 4.1的更多相關(guān)指標(biāo)。
比如Opus 4.1的無(wú)害回復(fù)回應(yīng)率更高,如果開(kāi)啟推理,指標(biāo)已經(jīng)能達(dá)到99.06%。

更多內(nèi)容大家可在System Card中進(jìn)一步查看。
最后,Claude Opus 4.1已面向所有付費(fèi)用戶開(kāi)放,包括Claude Code;也可以通過(guò)API、Amazon Bedrock和Vertex AI上使用,定價(jià)和Claude Opus 4一樣。
Blog:https://www.anthropic.com/news/claude-opus-4-1
System Card:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf


































