偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<dfn id="vk5wg"><strong id="vk5wg"></strong></dfn>

<bdo id="vk5wg"></bdo>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

阿里萬億參數(shù)大模型震撼發(fā)布！Qwen3-Max編程能力超越GPT-5

作者：阿丸筆記 2025-09-25 09:09:22

這說明什么？說明中國的AI技術(shù)積累已經(jīng)到了一個臨界點(diǎn)。不再是跟在后面學(xué)習(xí)模仿，而是能夠在某些領(lǐng)域?qū)崿F(xiàn)反超。當(dāng)然，我覺得現(xiàn)在說"全面超越"還為時過早。GPT-5在通用能力、推理深度等方面可能還有優(yōu)勢。但在編程這個垂直領(lǐng)域，Qwen3-Max確實(shí)展現(xiàn)出了強(qiáng)勁的競爭力。

你有沒有想過，什么時候國產(chǎn)AI能在編程領(lǐng)域真正"扳倒"GPT-5？

昨天阿里云棲大會上，這個問題有了答案。通義千問Qwen3-Max正式發(fā)布，直接放出了一個讓硅谷都震驚的成績單：萬億參數(shù)規(guī)模，編程能力測試全球第一。

說實(shí)話，當(dāng)我看到這些數(shù)據(jù)的時候，第一反應(yīng)是"這怎么可能"。但仔細(xì)查了查，發(fā)現(xiàn)這次阿里是真的憋了個大招。

萬億參數(shù)到底意味著什么？

先說數(shù)字：Qwen3-Max擁有超過1萬億參數(shù)，訓(xùn)練數(shù)據(jù)量達(dá)到36萬億tokens。這個規(guī)模什么概念？

我們來對比一下：GPT-4大概是1.7萬億參數(shù)，Claude 3.5 Sonnet的具體參數(shù)沒公開，但業(yè)界估計在幾千億級別。Qwen3-Max這個萬億級別，在目前公開的模型中確實(shí)算是頂級規(guī)模了。

但光有參數(shù)量還不夠，關(guān)鍵是能力得跟得上。這次Qwen3-Max最亮眼的就是編程能力。

編程測試全球第一，超越GPT-5

這里有個很有意思的數(shù)據(jù)：在SWE-Bench這個程序員都認(rèn)可的編程能力測試中，Qwen3-Max拿到了69.6分，直接位列全球第一。

圖片

SWE-Bench是什么？簡單說就是讓AI去解決GitHub上的真實(shí)bug，包括理解代碼、定位問題、編寫修復(fù)方案，這基本上就是程序員日常工作的完整流程了。

我特意去查了一下其他模型的成績：

? GPT-5-Codex：大概65分左右
? Claude 3.5 Sonnet：60分上下
? DeepSeek Coder：55分左右

這個差距看起來不大，但在編程這種精確度要求極高的任務(wù)上，幾分的差距往往意味著質(zhì)的飛躍。

Agent能力也很強(qiáng)

除了編程，Qwen3-Max在Agent（智能代理）能力上也表現(xiàn)突出。在Tau2-Bench測試中拿到了74.8分，基本達(dá)到了國際最先進(jìn)水平。

這個能力很重要，意味著它能在最少的人類輸入下自主決策和執(zhí)行任務(wù)。比如你讓它幫你分析一個項(xiàng)目的代碼結(jié)構(gòu)，它不僅能讀懂代碼，還能主動提出優(yōu)化建議、找出潛在bug，甚至直接給出修復(fù)方案。

用了幾天類似功能后，我發(fā)現(xiàn)這種自主性確實(shí)能大幅提高工作效率。以前需要來回對話十幾輪的任務(wù)，現(xiàn)在可能三五輪就搞定了。

開源策略很有野心

最有意思的是阿里的開源策略。他們明確表示要讓通義千問成為"AI時代的Android"。

這個比喻挺有意思的。當(dāng)年Android通過開源策略，最終在移動操作系統(tǒng)領(lǐng)域占據(jù)了絕對主導(dǎo)地位?，F(xiàn)在阿里想在AI大模型領(lǐng)域復(fù)制這個成功路徑。

從商業(yè)角度看，這確實(shí)是個聰明的策略。OpenAI的GPT系列雖然技術(shù)先進(jìn)，但閉源+付費(fèi)的模式限制了普及速度。如果Qwen3-Max真的能在保持技術(shù)領(lǐng)先的同時做到開源免費(fèi)，那確實(shí)有機(jī)會成為開發(fā)者的首選。

阿里CEO吳泳銘在云棲大會上說："大模型是下一代操作系統(tǒng)，超級AI云是下一代計算機(jī)。"

這背后的技術(shù)野心

其實(shí)仔細(xì)想想，Qwen3-Max的發(fā)布時機(jī)很有意思。就在GPT-5正式發(fā)布不久，阿里就拿出了一個在某些關(guān)鍵指標(biāo)上超越GPT-5的模型。

這說明什么？說明中國的AI技術(shù)積累已經(jīng)到了一個臨界點(diǎn)。不再是跟在后面學(xué)習(xí)模仿，而是能夠在某些領(lǐng)域?qū)崿F(xiàn)反超。

當(dāng)然，我覺得現(xiàn)在說"全面超越"還為時過早。GPT-5在通用能力、推理深度等方面可能還有優(yōu)勢。但在編程這個垂直領(lǐng)域，Qwen3-Max確實(shí)展現(xiàn)出了強(qiáng)勁的競爭力。

更重要的是，這代表了一種趨勢：AI大模型的競爭格局正在發(fā)生變化，不再是硅谷一家獨(dú)大，而是進(jìn)入了多極化競爭時代。

對程序員來說，這絕對是個好消息。更多的選擇意味著更好的工具、更低的成本，最終受益的還是我們這些天天寫代碼的人。

你們覺得呢？會考慮試試Qwen3-Max嗎？

責(zé)任編輯：武曉燕來源：阿丸筆記

Qwen3-Max GPT-5 大模型

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營