偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

拜拜Claude!阿里最強(qiáng)萬(wàn)億模型編程秒了Opus4,實(shí)測(cè)在此

人工智能 新聞
沒(méi)錯(cuò),就是前幾日大家期待已久的Qwen3-Max-Preview (Instruct)。

總參數(shù)達(dá)到1萬(wàn)億,阿里迄今為止最大的模型來(lái)了!

沒(méi)錯(cuò),就是前幾日大家期待已久的Qwen3-Max-Preview (Instruct)。

1萬(wàn)億啥概念?幾乎一下子就比前一代Qwen3(235B)多了四倍之多,相當(dāng)于給大學(xué)生換了個(gè)愛(ài)因斯坦的腦子(bushi~

根據(jù)官方介紹,其最大亮點(diǎn)如下:

相較于2.5系列,新版本在中英文理解、復(fù)雜指令遵循、工具調(diào)用等維度實(shí)現(xiàn)了顯著增強(qiáng),同時(shí)大幅減少了知識(shí)幻覺(jué),讓模型更智能、更可靠。

而且發(fā)布即全面上線,目前可通過(guò)通義APP、 Qwen Chat網(wǎng)頁(yè)和阿里云API體驗(yàn)。

更多官方測(cè)評(píng)顯示,Qwen3-Max-Preview一登場(chǎng)不僅比自家前一代最強(qiáng)模型Qwen3(235B)更強(qiáng),而且還打敗了包括Claude Opus 4在內(nèi)的國(guó)內(nèi)外勁敵。

國(guó)內(nèi)外反響更是一片熱烈,隨之而來(lái)的還有一大波測(cè)評(píng):

1萬(wàn)億!模型規(guī)模真是越來(lái)越擴(kuò)張了,迫不及待想要嘗試。

Qwen再次令人驚嘆!

so,模型真實(shí)效果如何?不妨簡(jiǎn)單實(shí)測(cè)一下見(jiàn)真章。

支持多模態(tài),編程已無(wú)需抽卡

綜合官方測(cè)評(píng)和網(wǎng)友反饋,接下來(lái)我們主要考查Qwen3-Max-Preview解答難題和動(dòng)手編程的能力。

需要提醒一下,阿里從Qwen3(235B)開(kāi)始就不再使用混合思維模式,所以這次的Instruct版本僅支持非思考模式

使用Qwen Chat網(wǎng)頁(yè),一上來(lái)就給它扔一道AIME數(shù)學(xué)競(jìng)賽題試試:

(AIME:美國(guó)數(shù)學(xué)邀請(qǐng)賽,是介于AMC10、AMC12及美國(guó)數(shù)學(xué)奧林匹克競(jìng)賽之間的一個(gè)數(shù)學(xué)競(jìng)賽。)

由于Qwen3-Max-Preview支持多模態(tài),這里我們可以直接上傳圖片。

幾乎轉(zhuǎn)眼間,模型就唰唰唰地給出了詳細(xì)作答過(guò)程及結(jié)果,最終答案“204”也與AIME這道題的標(biāo)準(zhǔn)答案一致。

小試牛刀過(guò)后,接下來(lái)進(jìn)入編程環(huán)節(jié)。

用p5js創(chuàng)建多彩的可交互動(dòng)畫。

速度同樣很快,Qwen3-Max-Preview幾乎立即給出了一段完整代碼,而且代碼能夠成功運(yùn)行。

鼠標(biāo)點(diǎn)到哪里,哪里就會(huì)產(chǎn)生交互效果:

生成一個(gè)掃雷游戲。

一句話制作掃雷這種經(jīng)典小游戲也是輕輕松松,而且是一次成功,無(wú)需反復(fù)溝通和抽卡。

代碼成功運(yùn)行后,我們也簡(jiǎn)單試玩了一下,只是很快就“踩雷”了(doge):

最后來(lái)試試制作前端網(wǎng)頁(yè),不妨就讓它來(lái)個(gè)自我介紹:

幫我制作一個(gè)介紹Qwen3-Max-Preview的可交互網(wǎng)站。

網(wǎng)站代碼生成后,既可以保存成文件直接打開(kāi),還能在問(wèn)答末尾點(diǎn)擊“預(yù)覽”一鍵查看效果。

預(yù)覽效果如下,網(wǎng)站設(shè)計(jì)簡(jiǎn)潔直觀,也具有初級(jí)交互效果:

當(dāng)然,如果你更懂提示詞,效果也會(huì)更好,某網(wǎng)友為Qwen3-Max-Preview制作的慶祝網(wǎng)頁(yè)效果就還不錯(cuò)。

順帶一提,不知道Qwen3-Max-Preview的代碼生成速度能不能趕上之前開(kāi)源的Qwen3-Coder,大家可以感受一下后者的速度:

以>107個(gè)token/秒的速度生成4467個(gè)token。

以上實(shí)測(cè)不難看出新模型確實(shí)能力更強(qiáng)了,尤其在編程方面,所有嘗試都是一次成功。

此外,阿里云百煉平臺(tái)還透露了模型的API價(jià)格——當(dāng)前版本根據(jù)輸入Token數(shù),采取階梯計(jì)費(fèi)。

原生支持的上下文長(zhǎng)度及最大輸入/輸出如下:

雖然目前官方并未正式宣布開(kāi)源這款模型,但Qwen身為開(kāi)源陣營(yíng)的重要一員,其后續(xù)仍然值得期待。

One More Thing

就在Qwen3-Max-Preview基礎(chǔ)版發(fā)布后,通義千問(wèn)開(kāi)源負(fù)責(zé)人林俊旸還在朋友圈透露其正式版很快到來(lái)

而且還表達(dá)了自己對(duì)這款模型的感受:

確實(shí)是我們搞過(guò)的最有趣的模型,(雖然)配方上沒(méi)有大改,但比之前的235B版本明顯好了不少。

這也讓他對(duì)繼續(xù)擴(kuò)展模型規(guī)模充滿信心。

另外,關(guān)于正式版人們現(xiàn)在也有了更多推測(cè)。

按照官方之前的節(jié)奏,預(yù)計(jì)大概率后面還有一個(gè)推理版本,而且或許就在幾天之后。(Qwen3-235B推理非推理中間僅隔了4天)

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-05-23 07:51:12

2024-05-13 07:14:03

GPT-4生成式AIAI模型

2025-06-17 09:09:00

2025-02-19 09:34:01

2025-05-26 02:15:00

2025-05-09 09:02:00

2024-04-12 17:41:28

GPT-4TurboClaude

2024-06-21 09:58:38

2025-08-06 13:45:19

編程AI模型

2025-08-07 09:07:21

2024-03-08 13:02:56

Claude 3GPT-4Opus

2024-04-17 16:51:17

2024-03-05 10:55:22

OpenAISOTAClaude 3

2025-03-12 12:07:07

2018-01-09 09:45:02

秒級(jí)監(jiān)控阿里

2024-05-20 15:40:00

AI數(shù)學(xué)

2025-05-29 09:07:37

2023-07-13 15:10:06

2024-08-12 09:47:00

模型數(shù)據(jù)

2024-06-21 13:11:30

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)