偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<blockquote id="ognu6"><p id="ognu6"></p></blockquote>

<style id="ognu6"><rp id="ognu6"></rp></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！

發(fā)布于 2025-6-10 07:19

瀏覽

0收藏

由香港科技大學(xué)、快手科技提出的UNIC（統(tǒng)一上下文視頻編輯）是一個簡單而有效的框架，它以上下文的方式統(tǒng)一單個模型中的各種視頻編輯任務(wù)。從此，視頻編輯用著一個工具就夠了！

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

ID插入

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

ID交換

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

刪除ID

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

相機(jī)控制

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

風(fēng)格化

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

第一幀傳播

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

緊急任務(wù)組合

UNIC 還表現(xiàn)出了新興任務(wù)組合能力。

重新拍攝+風(fēng)格化

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

ID+風(fēng)格化

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

相關(guān)鏈接

論文：https://arxiv.org/pdf/2506.04216
主頁：https://zixuan-ye.github.io/UNIC

論文介紹

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

UNIC：框架和設(shè)計

動機(jī)

基于DDIM反轉(zhuǎn)的方法（例如Video-P2P、FLATTEN）：性能欠佳。附加階段，使推理步驟和總體成本加倍。
基于適配器的方法：需要修改模型架構(gòu)。通過添加適配器模塊引入?yún)?shù)冗余。

它們通常是針對特定任務(wù)的，需要針對每個不同的條件信號訓(xùn)練單獨(dú)的模塊。這嚴(yán)重阻礙了任務(wù)的可擴(kuò)展性和各種編輯功能的統(tǒng)一。

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

統(tǒng)一上下文框架

UNIC 通過將所有輸入（含噪視頻潛伏信號、參考視頻標(biāo)記以及各種多模態(tài)條件標(biāo)記）處理為一個組合序列來統(tǒng)一視頻編輯。這使得擴(kuò)散變換器 (DiT) 的原生注意力機(jī)制能夠“在上下文中”學(xué)習(xí)復(fù)雜的編輯任務(wù)，從而提供靈活性和簡便性。

針對不同任務(wù)的統(tǒng)一模型。
將輸入標(biāo)記定義為三種類型。
沒有特定任務(wù)的適配器模塊。

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

任務(wù)感知 RoPE

根據(jù)任務(wù)類型和視頻長度動態(tài)分配唯一的旋轉(zhuǎn)位置嵌入 (RoPE) 幀索引。這確保了在不同條件下對時間的理解和正確對齊。

條件偏差

為條件標(biāo)記添加特定于任務(wù)的可學(xué)習(xí)嵌入。這有助于模型在模態(tài)重疊時區(qū)分目標(biāo)任務(wù)，從而有效解決歧義。

港科大&快手提出統(tǒng)一上下文視頻編輯框架 UNIC，各種視頻編輯任務(wù)一網(wǎng)打盡，還可進(jìn)行多項任務(wù)組合！-AI.x社區(qū)

結(jié)論

論文提出的統(tǒng)一的上下文內(nèi)視頻編輯UNIC是一個簡單而有效的框架，它以上下文內(nèi)的方式將不同的視頻編輯任務(wù)統(tǒng)一到一個模型中。為此，我們將不同視頻編輯任務(wù)的輸入表示為三種類型的標(biāo)記，并將它們集成為一個統(tǒng)一的標(biāo)記序列，并與擴(kuò)散變換器 (Diffusion Transformer) 的原始全注意力機(jī)制聯(lián)合建模。憑借設(shè)計的任務(wù)感知 RoPE 和條件偏差，該方法可以靈活地執(zhí)行不同的編輯任務(wù)并支持它們的組合。為了便于評估，論文還構(gòu)建了一個統(tǒng)一的視頻編輯基準(zhǔn)。在六個代表性視頻編輯任務(wù)上進(jìn)行的大量實驗表明，該模型在每項任務(wù)上都表現(xiàn)出卓越的性能，并展現(xiàn)出新興的任務(wù)組合能力。

本文轉(zhuǎn)載自???????AIGC Studio???????，作者：AIGC Studio

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

CVPR 2024高分論文：全新生成式編輯框架GenN2N，統(tǒng)一NeRF轉(zhuǎn)換任務(wù)

輕薄滴假象 ? 3854瀏覽 ? 0回復(fù)
邁向統(tǒng)一擴(kuò)散框架！Adobe提出RGB?X：雙重利好下游編輯任務(wù) | SIGGRAPH'24

angel ? 4751瀏覽 ? 0回復(fù)
北大快手攻克復(fù)雜視頻生成難題！新框架輕松組合各種細(xì)節(jié)，代碼將開源

Crystalcxt ? 4132瀏覽 ? 0回復(fù)
CVPR`24 | 4D編輯哪家強(qiáng)？浙大首次提出通用指導(dǎo)4D編輯框架：Instruct 4D-to-4D

angel ? 4715瀏覽 ? 0回復(fù)
圖像編輯多任務(wù)一網(wǎng)打盡！PromptFix，新型擴(kuò)散模型&大規(guī)模視覺指令數(shù)據(jù)集（羅切斯特大學(xué)&微軟）

angel ? 4606瀏覽 ? 0回復(fù)
拋棄UNet，首個基于DiT的圖像編輯框架！DiT4Edit：多尺寸編輯質(zhì)量更優(yōu) | 北大&港科大

angel ? 3789瀏覽 ? 0回復(fù)
中科大重磅開源StableV2V：專注于「人機(jī)交互一致性」的視頻編輯方法

angel ? 4075瀏覽 ? 0回復(fù)
支持25種復(fù)雜編輯類型！浙大等提出AnyEdit：統(tǒng)一高質(zhì)量圖像編輯框架

angel ? 4878瀏覽 ? 0回復(fù)
圖像生成與各種編輯任務(wù)大一統(tǒng)！賈佳亞團(tuán)隊提出DreamOmni：訓(xùn)練收斂速度快且性能強(qiáng)大

angel ? 3404瀏覽 ? 0回復(fù)
NeurIPS 2024 | 像素級LLM實現(xiàn)圖像視頻理解、生成、分割和編輯大統(tǒng)一

angel ? 6223瀏覽 ? 0回復(fù)
即插即用，無縫集成各種模型，港科大&螞蟻等發(fā)布Edicho：圖像編輯一致性最新成果！

angel ? 3838瀏覽 ? 0回復(fù)
視頻編輯最新SOTA！港中文&Adobe等發(fā)布統(tǒng)一視頻生成傳播框架——GenProp

angel ? 3381瀏覽 ? 0回復(fù)
圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！

NLP前沿1 ? 4142瀏覽 ? 0回復(fù)
AI鏡頭控制黑科技喜提多項SOTA！浙大&上交等發(fā)布統(tǒng)一多模態(tài)視頻生成框架OmniCam

angel ? 3157瀏覽 ? 0回復(fù)
統(tǒng)一圖像編輯框架，達(dá)到閉源一流水平；高分辨率自回歸圖像生成；高低層次特征聯(lián)合的圖像生成；視頻試穿框架

AI研究前瞻 ? 2863瀏覽 ? 0回復(fù)
2025年必讀的人工智能書籍清單：從入門到進(jìn)階，一網(wǎng)打盡！

Halo咯咯 ? 1.7w瀏覽 ? 0回復(fù)
ICML 2025 | 快手&上交提出統(tǒng)一多模態(tài)生成理解模型Orthus：多模態(tài)理解/圖像編輯/圖文交織生成一鍵搞定

AIGCStudio ? 3883瀏覽 ? 0回復(fù)
任務(wù)中斷？上下文工程：大模型長期任務(wù)的破局之道

云原生AI百寶箱 ? 1891瀏覽 ? 0回復(fù)
視頻生成模型中的零樣本學(xué)習(xí)和推理能力；視頻生成和編輯統(tǒng)一框架；掩碼擴(kuò)散模型，圖片理解生成一體；物理驅(qū)

AI研究前瞻 ? 2963瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

還在擔(dān)心不會寫提示詞？騰訊混元提出PromptEnhancer，可自動進(jìn)行提示詞改寫生成高保真且風(fēng)格多樣圖像 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

上一篇：開源數(shù)字人克隆神器HeyGem：1秒視頻生成4K超高清AI形象，用AI重塑數(shù)字人創(chuàng)作生態(tài)！

下一篇：字節(jié)提出從單一主題發(fā)展到多主題定制的通用框架UNO，通過情境生成釋放更多可控性

社區(qū)精華內(nèi)容

目錄

<cite id="uaadw"><rp id="uaadw"><form id="uaadw"></form></rp></cite>

^{<blockquote id="uaadw"></blockquote>}

<style id="uaadw"></style>

<thead id="uaadw"></thead>

<sub id="uaadw"><p id="uaadw"><li id="uaadw"></li></p></sub>