偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

阿里通義團(tuán)隊開源 R1-Omni：多模態(tài)模型 + RLVR，讓各模態(tài)作用清晰可見

作者：汪淼 2025-03-12 13:09:16

人工智能開源

通義實驗室團(tuán)隊探索了 RLVR 與視頻全模態(tài)模型的結(jié)合，宣布開源 R1-Omni 模型。R1-Omni 的一大亮點在于其透明性（推理能力）。通過 RLVR 方法，音頻信息和視頻信息在模型中的作用變得更加清晰可見。

3 月 11 日消息，隨著 DeepSeek R1 的推出，強化學(xué)習(xí)在大模型領(lǐng)域的潛力被進(jìn)一步挖掘。Reinforcement Learning with Verifiable Reward（RLVR）方法的出現(xiàn)，為多模態(tài)任務(wù)提供了全新的優(yōu)化思路，無論是幾何推理、視覺計數(shù)，還是經(jīng)典圖像分類和物體檢測任務(wù)，RLVR 都展現(xiàn)出了顯著優(yōu)于傳統(tǒng)監(jiān)督微調(diào)（SFT）的效果。

然而，現(xiàn)有研究多聚焦于 Image-Text 多模態(tài)任務(wù)，尚未涉足更復(fù)雜的全模態(tài)場景。基于此，通義實驗室團(tuán)隊探索了 RLVR 與視頻全模態(tài)模型的結(jié)合，于今日宣布開源 R1-Omni 模型。

R1-Omni 的一大亮點在于其透明性（推理能力）。通過 RLVR 方法，音頻信息和視頻信息在模型中的作用變得更加清晰可見。

比如，在情緒識別任務(wù)中，R1-Omni 能夠明確展示哪些模態(tài)信息對特定情緒的判斷起到了關(guān)鍵作用。

為了驗證 R1-Omni 的性能，通義實驗室團(tuán)隊將其與原始的 HumanOmni-0.5B 模型、冷啟動階段的模型以及在 MAFW 和 DFEW 數(shù)據(jù)集上有監(jiān)督微調(diào)的模型進(jìn)行了對比。

實驗結(jié)果顯示，在同分布測試集（DFEW 和 MAFW）上，R1-Omni 相較于原始基線模型平均提升超過 35%，相較于 SFT 模型在 UAR 上的提升高達(dá) 10% 以上。在不同分布測試集（RAVDESS）上，R1-Omni 同樣展現(xiàn)了卓越的泛化能力，WAR 和 UAR 均提升超過 13%。這些結(jié)果充分證明了 RLVR 在提升推理能力和泛化性能上的顯著優(yōu)勢。

IT之家附 R1-Omni 開源地址：

論文：https://arxiv.org/abs/2503.05379
Github：https://github.com/HumanMLLM/R1-Omni
模型：https://www.modelscope.cn/models/iic/R1-Omni-0.5B

責(zé)任編輯：龐桂玉來源： IT之家

R1-Omni 多模態(tài)模型開源

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<ruby id="5nuxs"><tbody id="5nuxs"><legend id="5nuxs"></legend></tbody></ruby>

<u id="5nuxs"><button id="5nuxs"></button></u>