偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭 原創(chuàng)

發(fā)布于 2025-7-3 18:11
瀏覽
0收藏

小模型的大智慧,正在重構(gòu)全球AI競爭規(guī)則。

?
昨天,在上海張江科學(xué)會堂上,智譜CEO張鵬正式發(fā)布GLM-4.1V-Thinking,旨在探索視覺語言模型中推理的上限。這個僅90億參數(shù)的多模態(tài)模型,在18項關(guān)鍵測試中逼平甚至超越了參數(shù)規(guī)模八倍于己的行業(yè)巨頭Qwen-2.5-VL-72B。
?
智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭-AI.x社區(qū)
?

就在發(fā)布當(dāng)天,浦東創(chuàng)投集團(tuán)與張江集團(tuán)宣布向智譜注資10億元戰(zhàn)略投資,首筆交割即時完成。

?

GLM-4.1V-9B-Thinking的誕生,標(biāo)志著多模態(tài)模型從「感知」向「認(rèn)知」的關(guān)鍵躍遷。在MMStar、MMMU-Pro等28項權(quán)威評測中,它獲得了23項10B級模型最佳成績。

?

智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭-AI.x社區(qū)
?

而這來源于團(tuán)隊的兩大創(chuàng)新機(jī)制:一是思維鏈推理機(jī)制,可以讓模型像人類一樣展示思考過程;二是課程采樣強化學(xué)習(xí)策略,引導(dǎo)AI由淺入深掌握復(fù)雜技能。

?

目前,在arXiv公開的技術(shù)報告顯示單張RTX 3090顯卡即可流暢運行該模型,MIT開源協(xié)議允許免費商用。這意味著普通開發(fā)者不必依賴昂貴的云計算資源也能在本地部署。
?

多模態(tài)能力的全面進(jìn)化

?

在多模態(tài)能力方面,GLM-4.1V-9B-Thinking展現(xiàn)出驚人的場景適應(yīng)性:它能解析長達(dá)兩小時的視頻內(nèi)容,理清人物關(guān)系和事件邏輯;看懂?dāng)?shù)學(xué)題并給出詳細(xì)解題步驟;甚至識別手機(jī)界面元素,幫用戶創(chuàng)建日程會議。
?

在官方演示視頻中,它像足球解說員一樣實時解說足球賽事,從戰(zhàn)術(shù)執(zhí)行到球員跑位,專業(yè)程度甚至不亞于人類解說員。這種能力來源于獨特的架構(gòu)設(shè)計——視覺編碼器采用三維卷積處理視頻流,語言解碼器則通過3D旋轉(zhuǎn)位置編碼增強空間理解。
?
智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭-AI.x社區(qū)

?

訓(xùn)練策略的革新之道

?

智譜團(tuán)隊精心設(shè)計了三階段訓(xùn)練方案。預(yù)訓(xùn)練階段通過海量圖文、視頻數(shù)據(jù)建立基礎(chǔ)認(rèn)知;監(jiān)督微調(diào)階段引入高質(zhì)量思維鏈數(shù)據(jù)集強化推理能力;最關(guān)鍵的強化學(xué)習(xí)階段采用課程采樣技術(shù),讓模型像學(xué)生一樣從易到難攻克STEM解題、GUI操作等復(fù)雜任務(wù)。

?

團(tuán)隊還采用了跨領(lǐng)域泛化設(shè)計。當(dāng)模型在STEM數(shù)據(jù)上訓(xùn)練時,也同步提升了視覺定位和GUI交互能力——數(shù)學(xué)推理中培養(yǎng)的邏輯鏈條,可以遷移到界面操作任務(wù)中。

?

在實際應(yīng)用場景中,GLM-4.1V-9B-Thinking展現(xiàn)出令人驚嘆的多元能力:

?
有網(wǎng)友對一道2025年高考數(shù)學(xué)立體幾何真題進(jìn)行實測,它能逐步推導(dǎo)體積計算過程。

?

智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭-AI.x社區(qū)

?

Prompt:請幫我解決這個題目,給出詳細(xì)過程和答案
?

輸出結(jié)果如下:
?
智譜開源多模態(tài)推理新王者!9B參數(shù)挑戰(zhàn)72B巨頭-AI.x社區(qū)
【圖片來源于網(wǎng)絡(luò),侵刪】
?

這些場景進(jìn)一步驗證了技術(shù)報告的核心結(jié)論:當(dāng)強化學(xué)習(xí)加入訓(xùn)練流程后,模型在GUI操作、視頻理解等任務(wù)上的性能直線提升。

?

隨著“Agents開拓者計劃”的推進(jìn),這批開源模型將化身千萬智能體,融入教育課件、醫(yī)療影像、工業(yè)質(zhì)檢的各個環(huán)節(jié)中。

?

這或許正孕育著中國AI登頂?shù)南乱粋€支點。

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦