偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

媲美Claude 4,支持100萬(wàn)上下文!阿里開(kāi)源超強(qiáng)代碼AI Agent模型

人工智能 新聞
根據(jù)阿里公布的測(cè)試數(shù)據(jù)顯示,Qwen3-Coder在OpenAI發(fā)布的Agent測(cè)試基準(zhǔn)SWE-bench Verified中,500輪交互的測(cè)試分?jǐn)?shù)達(dá)到了69.6%,常規(guī)分?jǐn)?shù)為67%,可媲美最強(qiáng)閉源代碼模型之一Claude Sonnet 4的70.4%和68%。

阿里巴巴開(kāi)源了超強(qiáng)AI Agent模型Qwen3-Coder-480B-A35B-Instruct。

根據(jù)阿里公布的測(cè)試數(shù)據(jù)顯示,Qwen3-Coder在OpenAI發(fā)布的Agent測(cè)試基準(zhǔn)SWE-bench Verified中,500輪交互的測(cè)試分?jǐn)?shù)達(dá)到了69.6%,常規(guī)分?jǐn)?shù)為67%,可媲美最強(qiáng)閉源代碼模型之一Claude Sonnet 4的70.4%和68%。

同時(shí)Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。

圖片

開(kāi)源地址:https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://github.com/QwenLM/Qwen3-Coder

Qwen3-Coder采用了混合專(zhuān)家架構(gòu),一共有4800億參數(shù),其中350億處于活躍狀態(tài)。原生支持256K上下文窗口,但可通過(guò)YaRN技術(shù)擴(kuò)展至100萬(wàn)。這對(duì)于代碼領(lǐng)域來(lái)說(shuō)幫助非常大,例如,一些比較小的開(kāi)發(fā)項(xiàng)目可以一次性全部解讀。

Qwen3-Coder在預(yù)訓(xùn)練階段使用了7.5T的高質(zhì)量數(shù)據(jù)進(jìn)行了訓(xùn)練,其中70%為代碼數(shù)據(jù),同時(shí)保留了通用和數(shù)學(xué)推理能力。還利用 Qwen2.5-Coder 來(lái)清理和重寫(xiě)嘈雜的數(shù)據(jù),顯著提高了整體數(shù)據(jù)質(zhì)量。

在后訓(xùn)練階段,Qwen3-Coder 進(jìn)行了代碼強(qiáng)化學(xué)習(xí)的擴(kuò)展訓(xùn)練。與社區(qū)中常見(jiàn)的專(zhuān)注于競(jìng)賽級(jí)代碼生成不同,Qwen3-Coder 認(rèn)為所有代碼任務(wù)都適合執(zhí)行驅(qū)動(dòng)的大規(guī)模強(qiáng)化學(xué)習(xí)。

通過(guò)自動(dòng)擴(kuò)展多樣化編碼任務(wù)的測(cè)試用例,創(chuàng)建了高質(zhì)量的訓(xùn)練實(shí)例,成功釋放了強(qiáng)化學(xué)習(xí)的全部潛力,不僅顯著提高了代碼執(zhí)行的成功率,還為其他任務(wù)帶來(lái)了增益。

圖片

此外,Qwen3-Coder 引入了長(zhǎng)視界強(qiáng)化學(xué)習(xí)(Agent RL),以鼓勵(lì)模型通過(guò)多輪交互使用工具來(lái)解決現(xiàn)實(shí)世界中的任務(wù)。Agent RL 的關(guān)鍵挑戰(zhàn)在于環(huán)境擴(kuò)展,為此,Qwen3-Coder 構(gòu)建了一個(gè)可擴(kuò)展的系統(tǒng),能夠并行運(yùn)行 20000 個(gè)獨(dú)立環(huán)境,利用阿里云的基礎(chǔ)設(shè)施提供必要的反饋,支持大規(guī)模強(qiáng)化學(xué)習(xí)和大規(guī)模評(píng)估。

為了方便使用Qwen3-Coder,還開(kāi)源了一個(gè)命令行工具Qwen-Code,它是從 Gemini Code分叉而來(lái)的,經(jīng)過(guò)定制提示和功能調(diào)用協(xié)議的調(diào)整,以充分發(fā)揮Qwen3-Coder在智能體編碼任務(wù)中的能力。

Qwen Code支持OpenAI SDK,并且可以通過(guò)環(huán)境變量或 .env文件配置API密鑰和基礎(chǔ)URL。

Qwen3-Coder在編程方面的能力非常出色,例如,開(kāi)發(fā)一個(gè)基于物理定律的煙囪拆除控制爆炸模擬器。

開(kāi)發(fā)一個(gè)類(lèi)似谷歌地圖的3D模擬器。

用一句名言測(cè)試你的打字速度的應(yīng)用。

開(kāi)發(fā)一個(gè)旋轉(zhuǎn)超立方體中的彈跳球。

使用p5.js創(chuàng)建一個(gè)令人驚嘆的多色和交互式動(dòng)畫(huà)。

值得一提的是,Qwen3-Coder還可以與Claude Code一起使用,用戶(hù)只需要阿里云模型工作室平臺(tái)上申請(qǐng)API密鑰,并安裝Claude Code 就能編碼。還提供了claude-code-config npm 包,用于自定義Claude Code的后端模型。

申請(qǐng)地址:https://modelstudio.console.alibabacloud.com/

責(zé)任編輯:張燕妮 來(lái)源: AIGC開(kāi)放社區(qū)
相關(guān)推薦

2025-07-31 09:06:00

2025-05-15 09:16:00

2025-08-29 14:17:01

ClaudeOpenAIGemini

2025-07-08 08:34:04

2025-07-23 08:33:00

2025-03-18 10:34:33

2025-10-20 09:06:00

2025-03-18 08:14:05

2025-01-15 13:09:12

2025-07-31 07:11:53

2023-08-10 14:04:15

代碼模型

2017-05-11 14:00:02

Flask請(qǐng)求上下文應(yīng)用上下文

2025-08-14 14:45:15

2024-03-14 08:11:45

模型RoPELlama

2024-05-06 13:01:21

數(shù)據(jù)模型

2025-08-01 08:50:08

2025-08-08 01:45:00

上下文工程優(yōu)化框架

2024-03-29 12:49:00

AI訓(xùn)練開(kāi)源

2012-12-31 10:01:34

SELinuxSELinux安全

2022-09-14 13:13:51

JavaScript上下文
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)