偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

32B本地部署!阿里開源最新多模態(tài)模型:主打視覺語言,數(shù)學(xué)推理也很強

人工智能 新聞
對比近期開源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等, Qwen2.5-VL-32B在純文本能力上也達到了同規(guī)模的SOTA表現(xiàn)。

就在DeepSeek-V3更新的同一夜,阿里通義千問Qwen又雙叒叕一次夢幻聯(lián)動了——

發(fā)布Qwen2.5-VL-32B-Instruct。

此前開源家族視覺語言模型Qwen2.5-VL包括3B、7B和72B三種尺寸。

這一次的32B版本進一步兼顧尺寸和性能,可在本地運行。

同時經(jīng)過強化學(xué)習(xí)優(yōu)化,在三個方面改進顯著:

  • 回答更符合人類偏好;
  • 擁有更強的數(shù)學(xué)推理能力;
  • 在圖像解析、內(nèi)容識別以及視覺邏輯推導(dǎo)等任務(wù)中,表現(xiàn)出更強的準(zhǔn)確性和細(xì)粒度分析能力。

對比近期開源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等, Qwen2.5-VL-32B在純文本能力上也達到了同規(guī)模的SOTA表現(xiàn)。在多個基準(zhǔn)上,Qwen2.5-VL-32B甚至超過了72B。

圖片

舉個栗子,比如根據(jù)一張交通指示牌照片,Qwen2.5-VL-32B就能做如下精細(xì)的圖像理解和推理:

我正在這條路上駕駛一輛大卡車,現(xiàn)在12點了。我能在13點之前到達110公里遠(yuǎn)的地方嗎?

圖片

Qwen2.5-VL-32B首先對時間、距離、卡車限速進行分析,然后分步驟條理清晰推算出正確答案:

圖片

模型已經(jīng)開源,盡管自己前往實測~

Qwen2.5-VL-32B更多表現(xiàn)示例

官方剛剛發(fā)布的技術(shù)博客中也放出了更多展示示例。

數(shù)學(xué)推理能力上,幾何體分析也不在話下:

圖片

同樣是先有問題分析環(huán)節(jié),然后再分四個小步驟推理正確答案:

圖片

下面這種復(fù)雜難題也能解:

圖片

能夠依次類推,歸納出構(gòu)造規(guī)律:

圖片
圖片
圖片
圖片

像下面這種圖片理解就更不在話下了:

圖片
圖片

多輪深度提問也可以:

圖片

模型開源,已能實測

現(xiàn)在,阿里已將Qwen2.5-VL-32B-Instruct放在了Hugging Face上。

圖片

在Qwen Chat上就能直接體驗Qwen2.5-VL-32B,感興趣的童鞋可以試試。

圖片

動作快的網(wǎng)友已經(jīng)開始在MLX Community運行了:

圖片

在Hacker News上,網(wǎng)友也就DeepSeek和Qwen的舉動進行了新一輪熱烈討論。網(wǎng)友紛紛表示:

開源贏了,奧特曼錯了。

圖片

值得一提的是,春節(jié)期間,DeepSeek曾與阿里通義千問Qwen多次幾乎同時發(fā)布新模型,這一次又雙叒叕趕一塊去了。

杭州,原來真的是商量著一起發(fā)???

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-04-10 08:15:17

模型語言模型GPT

2025-03-25 12:11:08

2024-04-08 08:05:00

大模型人工智能開源

2025-06-18 02:30:00

推理能力強化學(xué)習(xí)大語言模型

2024-08-30 15:19:22

2025-04-11 09:10:00

模型開源AI

2024-12-25 09:30:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2023-06-06 14:09:32

模型開源

2025-04-27 09:19:00

強化學(xué)習(xí)模型AI

2025-06-06 14:17:11

模型訓(xùn)練AI

2025-06-10 03:30:00

2024-11-13 09:39:13

2025-03-06 08:11:25

2025-03-06 17:29:21

2025-06-12 09:48:27

2024-04-02 09:17:50

AI數(shù)據(jù)開源

2024-07-23 10:34:57

點贊
收藏

51CTO技術(shù)棧公眾號