偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Qwen3-Max：阿里巴巴的萬(wàn)億參數(shù)模型，真正意義上的“思考模式”來(lái)了原創(chuàng)

發(fā)布于 2025-9-30 11:34

瀏覽

0收藏

在過(guò)去兩年，大模型的迭代節(jié)奏越來(lái)越快，從 GPT-4 到 Claude、Gemini，再到國(guó)內(nèi)的百花齊放，大家早已見(jiàn)怪不怪。但就在 2025 年 9 月，阿里巴巴正式發(fā)布了 Qwen3-Max ——一個(gè)超過(guò) 萬(wàn)億參數(shù)（1T+）的 Mixture-of-Experts（MoE）大模型。

與以往的“預(yù)覽版”不同，這一次，阿里直接把它推向了生產(chǎn)級(jí)落地。不僅在 Qwen Chat 面向普通用戶開放，還通過(guò) 阿里云 Model Studio API 提供開發(fā)者調(diào)用。這意味著，它已經(jīng)不只是實(shí)驗(yàn)室里的新鮮玩具，而是真正能跑在業(yè)務(wù)里的“大模型引擎”。

今天，我們就來(lái)拆解一下：Qwen3-Max 到底帶來(lái)了哪些突破？它和前一代相比，有什么質(zhì)的變化？又為什么特別強(qiáng)調(diào)“思考模式（Thinking Mode）”？

一、規(guī)模與架構(gòu)：從 360 億 Token 到萬(wàn)億參數(shù)的跨越

阿里官方明確表示，Qwen3-Max 是迄今為止最強(qiáng)大的 Qwen 模型，不僅在規(guī)模上跨過(guò)了 1T 參數(shù)大關(guān)，還采用了 稀疏激活的 MoE 架構(gòu)。

這里我們簡(jiǎn)單解釋一下：

MoE（Mixture-of-Experts）就像一個(gè)大型團(tuán)隊(duì)，每個(gè)專家只在需要時(shí)被調(diào)用，避免所有人都同時(shí)上場(chǎng)，從而既保證模型容量，又控制計(jì)算成本。
Qwen3-Max 在訓(xùn)練時(shí)使用了36 萬(wàn)億（36T）Token，大約是 Qwen2.5 的兩倍。數(shù)據(jù)分布覆蓋多語(yǔ)言、代碼、STEM 學(xué)科與推理任務(wù)，明顯針對(duì)企業(yè)級(jí)場(chǎng)景做了優(yōu)化。

訓(xùn)練后，它還遵循了 四階段配方：

長(zhǎng)鏈路推理冷啟動(dòng)（CoT cold-start）；
以推理為核心的強(qiáng)化學(xué)習(xí)（Reasoning RL）；
“思考模式”與“非思考模式”的融合訓(xùn)練；
通用領(lǐng)域的再?gòu)?qiáng)化（General RL）。

這套流程不僅是規(guī)模的堆砌，更是針對(duì)推理、編程和復(fù)雜任務(wù)定制的優(yōu)化方案。

二、兩種模式：Instruct 與 Thinking 的分工

Qwen3-Max 最大的亮點(diǎn)之一，就是明確區(qū)分了 兩條產(chǎn)品線：

Qwen3-Max-Instruct

對(duì)標(biāo)傳統(tǒng) ChatGPT 類體驗(yàn)
主打聊天、代碼生成、常規(guī)推理
追求低延遲、快速響應(yīng)

Qwen3-Max-Thinking

面向復(fù)雜的“Agent” 類場(chǎng)景
支持多步推理、工具調(diào)用、長(zhǎng)鏈路思考
適用于代碼執(zhí)行、搜索檢索、任務(wù)規(guī)劃

一個(gè)關(guān)鍵細(xì)節(jié)是：思考模式必須啟用 ??incremental_output=true?? 的流式輸出。如果開發(fā)者忘記設(shè)置這個(gè)參數(shù)，模型就不會(huì)進(jìn)入真正的“深度思考”狀態(tài)。這是阿里在 API 層面給出的明確契約，也避免了調(diào)用時(shí)的混亂。

換句話說(shuō)：

Instruct模式像一個(gè)聰明的助手，反應(yīng)快但不“深度糾結(jié)”；
Thinking模式則像一個(gè)團(tuán)隊(duì)智囊，需要多花點(diǎn)時(shí)間思考，但能把問(wèn)題考慮得更透徹，甚至?xí)鲃?dòng)調(diào)用工具解決難題。

三、性能實(shí)測(cè)：代碼、Agent、數(shù)學(xué)全面升級(jí)

那么，這個(gè)“萬(wàn)億參數(shù) + 思考模式”的組合，實(shí)際表現(xiàn)如何？

1. 編程（SWE-Bench Verified）

Qwen3-Max-Instruct 在 SWE-Bench Verified 上拿到了 69.6 分。

這一成績(jī)超過(guò)了 DeepSeek V3.1（非思考模式）的基線；
略低于 Claude Opus 4（非思考模式）。

Qwen3-Max：阿里巴巴的萬(wàn)億參數(shù)模型，真正意義上的“思考模式”來(lái)了-AI.x社區(qū)

要知道，SWE-Bench 不只是寫幾行代碼，而是要在真實(shí)的代碼庫(kù)環(huán)境里完成修復(fù)和提交。能在這里站穩(wěn)腳跟，說(shuō)明 Qwen3-Max 的代碼推理和上下文理解能力，已經(jīng)不輸國(guó)際一線大模型。

2. 智能 Agent（Tau2-Bench）

在 Tau2-Bench ——一個(gè)專門評(píng)測(cè) 工具調(diào)用與任務(wù)規(guī)劃 的基準(zhǔn)上，Qwen3-Max 取得了 74.8 分，領(lǐng)先于同類對(duì)手。

這背后的意義在于：

企業(yè)在搭建 AI Agent 時(shí)，不再需要寫一堆“手工策略”；
模型本身已經(jīng)學(xué)會(huì)了“什么時(shí)候該調(diào)用工具、調(diào)用哪個(gè)工具”。

Qwen3-Max：阿里巴巴的萬(wàn)億參數(shù)模型，真正意義上的“思考模式”來(lái)了-AI.x社區(qū)

對(duì)于想要部署 AI 客服、自動(dòng)化運(yùn)維、企業(yè)知識(shí)庫(kù)的團(tuán)隊(duì)來(lái)說(shuō)，這是一大好消息。

3. 數(shù)學(xué)與推理（AIME25 等）

Qwen3-Max-Thinking 模式在 AIME25 等數(shù)學(xué)基準(zhǔn)上，幾乎達(dá)到了“接近滿分”的表現(xiàn)。

Qwen3-Max：阿里巴巴的萬(wàn)億參數(shù)模型，真正意義上的“思考模式”來(lái)了-AI.x社區(qū)

雖然這些結(jié)果目前大多是廠商披露或社區(qū)復(fù)現(xiàn)，還沒(méi)有完整的技術(shù)報(bào)告支撐，但至少表明：通過(guò)延長(zhǎng)推理鏈路 + 工具輔助，復(fù)雜任務(wù)的可解性顯著提升。

四、如何看待這些提升？

從企業(yè)應(yīng)用的角度，我們可以把 Qwen3-Max 的進(jìn)步總結(jié)為三點(diǎn)：

代碼層面： SWE-Bench 的提升，意味著它不僅能寫“Demo 代碼”，還能真正改動(dòng)大型倉(cāng)庫(kù)，支持生產(chǎn)級(jí)代碼輔助。
Agent 層面： Tau2-Bench 的成績(jī)，意味著它能更好地替代“人工腳本”，讓 AI 自己學(xué)會(huì)判斷和選擇。
推理層面：數(shù)學(xué)任務(wù)的突破說(shuō)明，長(zhǎng)鏈路推理 + 工具調(diào)用的結(jié)合，是未來(lái)大模型的必經(jīng)之路。

換句話說(shuō)，Qwen3-Max 的價(jià)值不在于簡(jiǎn)單對(duì)話，而在于它能直接作為“企業(yè) AI 中臺(tái)”的核心引擎。

五、實(shí)用示例：如何調(diào)用 Qwen3-Max？

阿里云開放的 API 已經(jīng)支持開發(fā)者調(diào)用，我們來(lái)看一個(gè) Python 示例：

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.getenv("API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3-max",
    messages=[
      {'role': 'user', 'content': 'Give me a short introduction to large language model.'}
    ]
)

print(completion.choices[0].message)

如果你要開啟“思考模式”，只需要在調(diào)用時(shí)添加：

completion = client.chat.completions.create(
    model="qwen3-max-thinking",
    messages=[ ... ],
    incremental_output=True
)

注意：

??qwen3-max-instruct??? 與??qwen3-max-thinking?? 是不同的模型名；
思考模式必須啟用流式輸出，否則無(wú)法進(jìn)入長(zhǎng)鏈路推理。

六、未來(lái)展望：阿里的大模型戰(zhàn)役

Qwen3-Max 的發(fā)布，至少釋放了三個(gè)信號(hào)：

國(guó)內(nèi)廠商已經(jīng)能量產(chǎn)萬(wàn)億參數(shù)模型，并不再停留在“實(shí)驗(yàn)室階段”；
思考模式將成為大模型的必備特性，未來(lái)更多 Agent 應(yīng)用都會(huì)依賴這種長(zhǎng)鏈路推理；
開放生態(tài)正在形成：從 Qwen Chat 到 Model Studio API，阿里在積極吸引開發(fā)者加入。

對(duì)于企業(yè)來(lái)說(shuō)，現(xiàn)在正是嘗試的最佳時(shí)機(jī)。無(wú)論是代碼自動(dòng)化、Agent 智能體，還是數(shù)學(xué)推理、知識(shí)庫(kù)問(wèn)答，Qwen3-Max 都提供了一個(gè)高性能的起點(diǎn)。

結(jié)語(yǔ)

過(guò)去我們說(shuō)大模型像“萬(wàn)能的聰明助手”，而 Qwen3-Max 的思考模式，更像是一個(gè)會(huì)反復(fù)推敲、會(huì)自己動(dòng)手找工具的“超級(jí)智囊”。

它的價(jià)值，不僅僅在于分?jǐn)?shù)和參數(shù)，而在于能否成為企業(yè)真實(shí)場(chǎng)景中的可靠底座。

阿里已經(jīng)邁出了第一步，接下來(lái)，就看開發(fā)者和企業(yè)如何把這臺(tái)“萬(wàn)億級(jí)引擎”跑起來(lái)。

你怎么看？如果給你一個(gè)能真正“思考”的大模型，你會(huì)用它來(lái)解決什么問(wèn)題？

本文轉(zhuǎn)載自??Halo咯咯?? 作者：基咯咯

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

萬(wàn)億參數(shù)模型

已于2025-9-30 11:34:13修改

贊

收藏

回復(fù)

舉報(bào)

熱門內(nèi)容榜 ? 最近上榜

回復(fù)

相關(guān)推薦

阿里巴巴AI研究團(tuán)隊(duì)打破視頻生成技術(shù)壁壘，EasyAnimate實(shí)現(xiàn)高質(zhì)量長(zhǎng)視頻生成

Syrupup ? 5826瀏覽 ? 0回復(fù)
阿里巴巴重磅開源EasyAnimate！基于DiT的長(zhǎng)視頻制作生態(tài)系統(tǒng)

angel ? 6322瀏覽 ? 0回復(fù)
上海交大&阿里巴巴推出虛擬試衣新里程碑式工作——AnyFit：任意場(chǎng)景、任意組合！

angel ? 4403瀏覽 ? 0回復(fù)
阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率

xuxiangda ? 5015瀏覽 ? 0回復(fù)
阿里巴巴提出CODEXGRAPH：打破大模型與代碼庫(kù)的壁壘，引領(lǐng)軟件工程新革命

AI論文解讀 ? 5732瀏覽 ? 0回復(fù)
阿里巴巴研究院推出 XiYan-SQL：用于Text-to-SQL的多生成器集成人工智能框架

Halo咯咯 ? 1.1w瀏覽 ? 0回復(fù)
阿里巴巴Qwen團(tuán)隊(duì)發(fā)布QwQ-32B-Preview：包含320億參數(shù)的開放模型，專為解決高級(jí)推理任務(wù)而設(shè)計(jì)

Halo咯咯 ? 7054瀏覽 ? 0回復(fù)
突破與超越：CosyVoice 2.0—阿里巴巴通義實(shí)驗(yàn)室的語(yǔ)音進(jìn)階新作

穿越時(shí)空111 ? 8393瀏覽 ? 0回復(fù)
阿里巴巴語(yǔ)音實(shí)驗(yàn)室發(fā)布新成果，多模態(tài)方法顯著提升視頻主題分割性能

xuxiangda ? 3991瀏覽 ? 0回復(fù)
阿里巴巴Qwen研究員推出ProcessBench：衡量數(shù)學(xué)推理過(guò)程錯(cuò)誤識(shí)別能力的新AI基準(zhǔn)

Halo咯咯 ? 3665瀏覽 ? 0回復(fù)
阿里巴巴AI研究院發(fā)布CosyVoice 2：改進(jìn)的流式語(yǔ)音合成模型

Halo咯咯 ? 6459瀏覽 ? 0回復(fù)
AMD開源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 2820瀏覽 ? 0回復(fù)
推理、編碼打平DeepSeek V3但參數(shù)減一半，一張H100就能跑，還有巨獸2萬(wàn)億參數(shù)模型！

51CTO技術(shù)棧 ? 2938瀏覽 ? 0回復(fù)
阿里開源4800億參數(shù)編程大模型Qwen3-Coder

AI博物院 ? 8353瀏覽 ? 0回復(fù)
騰訊HunYuan跟阿里Qwen在開源上干起來(lái)了？

NLP工作站 ? 3109瀏覽 ? 0回復(fù)
Qwen3-Max Preview 發(fā)布：阿里帶來(lái)首個(gè)萬(wàn)億參數(shù)大模型，挑戰(zhàn)長(zhǎng)上下文極限

Halo咯咯 ? 4738瀏覽 ? 0回復(fù)
云棲大會(huì)阿里掀桌子了！Qwen3-Max、VL、Omini、Agent ... 統(tǒng)統(tǒng)發(fā)布！

探索AGI ? 2468瀏覽 ? 0回復(fù)
Qwen3-Omni評(píng)測(cè)：真正的全能多模態(tài)AI，還是過(guò)度宣傳的幻象？

Halo咯咯 ? 3238瀏覽 ? 0回復(fù)
阿里巴巴的機(jī)器學(xué)習(xí)發(fā)展歷程

坦途于胸 ? 992瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Glyph：智譜AI用“視覺(jué)壓縮”讓上下文延長(zhǎng)到100萬(wàn)Token的新思路 2天前發(fā)布
MiniMax M2：2300 億參數(shù)的“小巨人”，正改寫大模型競(jìng)爭(zhēng)邏輯 2天前發(fā)布

熱門推薦

為什么它能成為強(qiáng)化學(xué)習(xí)的“黃金標(biāo)準(zhǔn)”？深扒 Proximal Policy Optimization (PPO) 的核心奧秘 0回復(fù)

微軟開源 VibeVoice-1.5B：90分鐘多角色語(yǔ)音合成，讓TTS進(jìn)入“長(zhǎng)音頻時(shí)代” 0回復(fù)

GPU vs TPU：誰(shuí)才是2025年大模型訓(xùn)練的最優(yōu)解？最新性能榜單揭曉 0回復(fù)

不止能切文本：多向量檢索如何讓RAG搞定復(fù)雜PDF 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

上一篇：別只看跑分了！OpenAI 新出的 GDPval 評(píng)測(cè)，讓大模型的真實(shí)經(jīng)濟(jì)價(jià)值一目了然

下一篇： mmBERT：3萬(wàn)億詞訓(xùn)練出的新一代多語(yǔ)言編碼器，速度快 4 倍，還能照顧到冷門語(yǔ)言

社區(qū)精華內(nèi)容

目錄