剛剛,Claude Sonnet 4.5重磅發(fā)布,編程新王降臨!
北京時(shí)間今天凌晨,Anthropic正式發(fā)布了Claude Sonnet 4.5。
圖片
這一版本被Claude定義為全球最強(qiáng)的代碼模型,同時(shí)在智能體構(gòu)建、計(jì)算機(jī)使用、推理和數(shù)學(xué)能力上展現(xiàn)出顯著突破。
圖片
代碼無處不在,它驅(qū)動(dòng)著應(yīng)用程序、表格和各種工具。
現(xiàn)代工作的核心在于運(yùn)用這些工具并解決復(fù)雜問題,而Sonnet 4.5讓這一切更加高效和可靠。
全新功能與產(chǎn)品升級
伴隨Sonnet 4.5,Anthropic對Claude全線產(chǎn)品進(jìn)行了大規(guī)模更新:
- Claude Code新增了備受期待的「檢查點(diǎn)」(Checkpoints)功能,可隨時(shí)保存進(jìn)度并一鍵回滾到早先狀態(tài);同時(shí)更新了終端界面,并推出了原生VS Code插件。
- Claude API增加了上下文編輯功能和記憶工具,讓智能體能運(yùn)行更久,處理更復(fù)雜的任務(wù)。
- Claude apps現(xiàn)已支持在對話中直接執(zhí)行代碼、生成文件(包括表格、幻燈片和文檔)。
- Claude for Chrome擴(kuò)展對此前等待名單中的Max用戶開放。
開發(fā)者社區(qū)也迎來了新的核心資源:Claude Agent SDK。
這套工具包開放了驅(qū)動(dòng)Claude Code的底層基礎(chǔ)設(shè)施,為所有人打造智能體提供了基礎(chǔ)能力。
前沿性能與基準(zhǔn)成績
Sonnet 4.5在多項(xiàng)權(quán)威測試中表現(xiàn)出色:
- SWE-bench Verified:在真實(shí)軟件編碼能力測試中達(dá)到最新的最優(yōu)水平,可在復(fù)雜的多步驟任務(wù)中保持超過30小時(shí)的專注執(zhí)行。
圖片
- OSWorld:在模擬真實(shí)計(jì)算機(jī)任務(wù)的基準(zhǔn)中,以61.4%的成績位居首位,而四個(gè)月前Sonnet 4還保持在42.2%。
視頻演示了Claude for Chrome的模擬操作計(jì)算機(jī)任務(wù)能力
- 推理與數(shù)學(xué):在一系列公共評測中大幅領(lǐng)先,特別是在金融、法律、醫(yī)學(xué)和STEM等專業(yè)領(lǐng)域的知識與推理上,遠(yuǎn)超此前的Opus 4.1。
圖片
圖片
圖片
圖片
這些進(jìn)展不僅體現(xiàn)在數(shù)據(jù)中,也得到了提前體驗(yàn)的專業(yè)用戶們的高度評價(jià):
Claude Code能自主編程30小時(shí)以上,幫助工程師在極短時(shí)間內(nèi)完成原本要花費(fèi)數(shù)月的架構(gòu)工作?!猄ean Ward, iGent AI CEO
replit內(nèi)部代碼編輯測試中,錯(cuò)誤率從Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
圖片
圖片
圖片
更強(qiáng)的對齊,更安全
Sonnet 4.5是迄今為止對齊性最好的Claude模型。
通過改進(jìn)的能力和廣泛的安全訓(xùn)練,模型在減少迎合、欺騙、權(quán)力追求和虛妄鼓勵(lì)等行為方面取得了明顯成效。
在智能體和計(jì)算機(jī)使用場景中,團(tuán)隊(duì)也特別加強(qiáng)了對提示注入攻擊的防御。
這些改進(jìn)已在系統(tǒng)卡(System Card)中以詳細(xì)評估形式公開,其中首次引入了可解釋性技術(shù)來驗(yàn)證安全性。
圖片
Sonnet 4.5按照AI Safety Level 3(ASL-3)框架發(fā)布,包含一系列防護(hù)措施,例如針對化學(xué)、生物、放射和核相關(guān)內(nèi)容的分類器過濾機(jī)制。
雖然這些過濾器可能偶爾誤判正常內(nèi)容,但與Sonnet 4相比,誤報(bào)率已降低十倍,并將在未來繼續(xù)優(yōu)化。
Claude Agent SDK
在過去半年中,Claude團(tuán)隊(duì)不斷迭代Claude Code,探索了智能體設(shè)計(jì)中的核心挑戰(zhàn),包括長時(shí)任務(wù)的內(nèi)存管理、權(quán)限體系的平衡,以及子代理的協(xié)同方式。
如今,這些能力通過Claude Agent SDK向開發(fā)者全面開放。
Claude Agent SDK演示視頻
SDK不僅適用于編碼,還能支持更廣泛的應(yīng)用場景。
它為構(gòu)建復(fù)雜任務(wù)的自主智能體提供了與Anthropic內(nèi)部工具相同的基礎(chǔ)設(shè)施。
研究預(yù)覽:「Imagine with Claude」
作為額外的實(shí)驗(yàn),Anthropic發(fā)布了一個(gè)臨時(shí)研究預(yù)覽——「Imagine with Claude」。
Imagine With Claude實(shí)時(shí)生成軟件演示視頻
在這一體驗(yàn)中,Claude會實(shí)時(shí)生成軟件,沒有預(yù)設(shè)功能或預(yù)寫代碼,用戶可以直接看到Claude在交互過程中即時(shí)創(chuàng)造與適配的過程。
該功能向Max訂閱用戶開放5天,可在claude.ai/imagine上體驗(yàn)。
API新特性
Sonnet 4.5在API層面也帶來了重要更新:
- 記憶工具(Beta):支持在上下文窗口外存儲和調(diào)用信息,幫助跨會話維持知識和狀態(tài)。
- 上下文編輯:通過自動(dòng)清理舊的工具調(diào)用和結(jié)果來避免上下文溢出。
- 新的停止原因提示:增加了
model_context_window_exceeded,更清晰地標(biāo)識因上下文限制而中止生成。 - 工具參數(shù)改進(jìn):修復(fù)了字符串參數(shù)尾部換行被截?cái)嗟膯栴},保證格式精確傳遞。
- Token計(jì)數(shù)優(yōu)化:系統(tǒng)會自動(dòng)添加優(yōu)化Token,但用戶不會為這些系統(tǒng)注入的部分付費(fèi)。
定價(jià)與使用渠道
價(jià)格保持與Sonnet 4一致:
- 輸入:3美元/百萬Tokens
- 輸出:15美元/百萬Tokens
圖片
Sonnet 4.5可通過以下渠道使用:
- Claude API:
claude-sonnet-4-5-20250929 - Amazon Bedrock:
anthropic.claude-sonnet-4-5-20250929-v1:0 - Google Cloud Vertex AI:
claude-sonnet-4-5@20250929 - 同時(shí)也在Claude.ai與Claude Code平臺上線。
圖片
升級指南
當(dāng)前使用Sonnet 4的開發(fā)者,只需將模型名稱更新為claude-sonnet-4-5-20250929即可完成遷移。
所有現(xiàn)有API調(diào)用依然有效。建議同時(shí)啟用新特性,例如記憶工具和上下文清理,以充分發(fā)揮模型性能。
需要注意的是,Sonnet 4.5不再允許同時(shí)指定temperature和top_p參數(shù),用戶應(yīng)選擇其一。

新一輪的AI編程大戰(zhàn)即將來臨
Claude Sonnet 4.5在編碼、智能體能力、計(jì)算機(jī)使用和安全性方面實(shí)現(xiàn)了全面躍升。
它既是開發(fā)者工具箱中的新利器,也是一個(gè)能在金融、醫(yī)學(xué)、科研等領(lǐng)域提供專業(yè)支持的強(qiáng)大平臺。
Anthropic通過這一版本,繼續(xù)推動(dòng)AI在前沿能力和安全性上的平衡發(fā)展。
編程新王降臨,新一輪圍繞編程展開的百模大戰(zhàn)即將展開,而Claude Sonnet 4.5即將成為大家爭相對標(biāo)的新對象。
參考資料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf






























