媲美Claude 4,支持100萬(wàn)上下文!阿里開(kāi)源超強(qiáng)代碼AI Agent模型
阿里巴巴開(kāi)源了超強(qiáng)AI Agent模型Qwen3-Coder-480B-A35B-Instruct。
根據(jù)阿里公布的測(cè)試數(shù)據(jù)顯示,Qwen3-Coder在OpenAI發(fā)布的Agent測(cè)試基準(zhǔn)SWE-bench Verified中,500輪交互的測(cè)試分?jǐn)?shù)達(dá)到了69.6%,常規(guī)分?jǐn)?shù)為67%,可媲美最強(qiáng)閉源代碼模型之一Claude Sonnet 4的70.4%和68%。
同時(shí)Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。

開(kāi)源地址:https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct
https://github.com/QwenLM/Qwen3-Coder
Qwen3-Coder采用了混合專(zhuān)家架構(gòu),一共有4800億參數(shù),其中350億處于活躍狀態(tài)。原生支持256K上下文窗口,但可通過(guò)YaRN技術(shù)擴(kuò)展至100萬(wàn)。這對(duì)于代碼領(lǐng)域來(lái)說(shuō)幫助非常大,例如,一些比較小的開(kāi)發(fā)項(xiàng)目可以一次性全部解讀。
Qwen3-Coder在預(yù)訓(xùn)練階段使用了7.5T的高質(zhì)量數(shù)據(jù)進(jìn)行了訓(xùn)練,其中70%為代碼數(shù)據(jù),同時(shí)保留了通用和數(shù)學(xué)推理能力。還利用 Qwen2.5-Coder 來(lái)清理和重寫(xiě)嘈雜的數(shù)據(jù),顯著提高了整體數(shù)據(jù)質(zhì)量。
在后訓(xùn)練階段,Qwen3-Coder 進(jìn)行了代碼強(qiáng)化學(xué)習(xí)的擴(kuò)展訓(xùn)練。與社區(qū)中常見(jiàn)的專(zhuān)注于競(jìng)賽級(jí)代碼生成不同,Qwen3-Coder 認(rèn)為所有代碼任務(wù)都適合執(zhí)行驅(qū)動(dòng)的大規(guī)模強(qiáng)化學(xué)習(xí)。
通過(guò)自動(dòng)擴(kuò)展多樣化編碼任務(wù)的測(cè)試用例,創(chuàng)建了高質(zhì)量的訓(xùn)練實(shí)例,成功釋放了強(qiáng)化學(xué)習(xí)的全部潛力,不僅顯著提高了代碼執(zhí)行的成功率,還為其他任務(wù)帶來(lái)了增益。

此外,Qwen3-Coder 引入了長(zhǎng)視界強(qiáng)化學(xué)習(xí)(Agent RL),以鼓勵(lì)模型通過(guò)多輪交互使用工具來(lái)解決現(xiàn)實(shí)世界中的任務(wù)。Agent RL 的關(guān)鍵挑戰(zhàn)在于環(huán)境擴(kuò)展,為此,Qwen3-Coder 構(gòu)建了一個(gè)可擴(kuò)展的系統(tǒng),能夠并行運(yùn)行 20000 個(gè)獨(dú)立環(huán)境,利用阿里云的基礎(chǔ)設(shè)施提供必要的反饋,支持大規(guī)模強(qiáng)化學(xué)習(xí)和大規(guī)模評(píng)估。
為了方便使用Qwen3-Coder,還開(kāi)源了一個(gè)命令行工具Qwen-Code,它是從 Gemini Code分叉而來(lái)的,經(jīng)過(guò)定制提示和功能調(diào)用協(xié)議的調(diào)整,以充分發(fā)揮Qwen3-Coder在智能體編碼任務(wù)中的能力。
Qwen Code支持OpenAI SDK,并且可以通過(guò)環(huán)境變量或 .env文件配置API密鑰和基礎(chǔ)URL。
Qwen3-Coder在編程方面的能力非常出色,例如,開(kāi)發(fā)一個(gè)基于物理定律的煙囪拆除控制爆炸模擬器。

開(kāi)發(fā)一個(gè)類(lèi)似谷歌地圖的3D模擬器。

用一句名言測(cè)試你的打字速度的應(yīng)用。

開(kāi)發(fā)一個(gè)旋轉(zhuǎn)超立方體中的彈跳球。

使用p5.js創(chuàng)建一個(gè)令人驚嘆的多色和交互式動(dòng)畫(huà)。

值得一提的是,Qwen3-Coder還可以與Claude Code一起使用,用戶(hù)只需要阿里云模型工作室平臺(tái)上申請(qǐng)API密鑰,并安裝Claude Code 就能編碼。還提供了claude-code-config npm 包,用于自定義Claude Code的后端模型。
申請(qǐng)地址:https://modelstudio.console.alibabacloud.com/



































