偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

ICCV 2025 | 小紅書AIGC團(tuán)隊(duì)提出圖像和視頻換臉新算法DynamicFace

人工智能 新聞
小紅書提出 DynamicFace,讓視頻人臉交換邁入「電影級」工業(yè)流水線!

本論文主要作者來自小紅書 AIGC 團(tuán)隊(duì)(Dynamic-X-Lab),Dynamic?X?LAB 是一個專注于 AIGC 領(lǐng)域的研究團(tuán)隊(duì),致力于推動姿態(tài)驅(qū)動的人像生成與視頻動畫技術(shù)。他們以高質(zhì)量、高可控性的生成模型為核心,圍繞文生圖(t2i)、圖像生成(i2i)、圖像轉(zhuǎn)視頻(i2v)和風(fēng)格遷移加速等方向展開研究,并通過完整的開源方案分享給開發(fā)者與研究者社區(qū)。

圖片

  • 論文標(biāo)題:DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors
  • 論文鏈接:https://arxiv.org/abs/2501.08553
  • 項(xiàng)目主頁:https://dynamic-face.github.io/

近年來,擴(kuò)散模型在圖像與視頻合成領(lǐng)域展現(xiàn)出前所未有的生成能力,為人臉生成與編輯技術(shù)按下了加速鍵。特別是一張靜態(tài)人臉驅(qū)動任意表情、姿態(tài)乃至光照的夢想,正在走向大眾工具箱,并在三大場景展現(xiàn)巨大潛力:

  • 影視行業(yè):導(dǎo)演只需一張定妝照,即可讓演員「數(shù)字替身」在綠幕里實(shí)時完成高難度的表情捕捉與重打光,后期不再為補(bǔ)拍鏡頭而燒預(yù)算,真正進(jìn)入「先拍臉、后拍景」的降本增效時代。
  • 游戲行業(yè):捏臉系統(tǒng)將不再局限于預(yù)設(shè)模板。玩家上傳一張自拍,即刻生成 360° 可旋轉(zhuǎn)、可眨眼、可微表情的個性化角色;配合實(shí)時語音驅(qū)動,NPC 的口型與情緒可隨劇情即時變化,沉浸式體驗(yàn)再升一級。
  • 自媒體與電商:短視頻創(chuàng)作者無需真人出鏡,一張品牌代言照即可批量產(chǎn)出不同光線、不同角度的口播視頻;虛擬主播更可 7x24 小時直播帶貨,表情自然、光影一致,告別「恐怖谷」效應(yīng)。

人臉視頻生成的核心難題在于,如何在根據(jù)參考圖像和外部動作序列,嚴(yán)謹(jǐn)?shù)乇3衷磪⒖既四樕矸萏卣鞑槐粨p傷的同時,還要維持目標(biāo)人臉動作的一致性?,F(xiàn)有方法在追求真實(shí)動態(tài)表現(xiàn)時,通常會遭遇以下三大挑戰(zhàn):

  • 空間與時間建模的內(nèi)在矛盾:許多聚焦于身份一致性的圖像生成模型在空間特征提取方面已足夠優(yōu)秀,然而由于在注入運(yùn)動信息時耦合了目標(biāo)身份特征,進(jìn)而導(dǎo)致運(yùn)動信息不準(zhǔn)確,一旦需要建模時間變化的視頻擴(kuò)散模型時,不準(zhǔn)確的運(yùn)動建模會被逐幀放大,最終陷入身份還原能力和運(yùn)動一致難以兩全的問題。
  • 身份一致性降低:在復(fù)雜或大幅度動作變化情況下,面部區(qū)域極易出現(xiàn)形變、失真,難以保證人物獨(dú)特的面貌特征能隨時保留。這種問題直接影響動畫人物的個體識別度和可信度,也是用戶接受數(shù)字人像動畫的首要阻礙。
  • 整體視頻質(zhì)量受損:當(dāng)前最優(yōu)秀的人像動畫生成模型雖然在動畫效果層面取得進(jìn)展,但往往還需借助外部換臉后處理工具以改善關(guān)鍵幀細(xì)節(jié)??上?,這類后處理雖能暫時修復(fù)細(xì)節(jié),卻往往損傷了整段視頻在視覺上的統(tǒng)一性和自然度,導(dǎo)致畫面出現(xiàn)割裂感和不連貫的現(xiàn)象。

小紅書提出 DynamicFace,讓視頻人臉交換邁入「電影級」工業(yè)流水線!

方法介紹

本研究提出了一種創(chuàng)新性的人臉置換方法 DynamicFace,針對圖像及視頻領(lǐng)域的人臉融合任務(wù)實(shí)現(xiàn)了高質(zhì)量與高度一致性的置換效果。

與傳統(tǒng)人臉置換方法相比,DynamicFace 獨(dú)創(chuàng)性地將擴(kuò)散模型(Diffusion Model)與可組合的 3D 人臉先驗(yàn)進(jìn)行深度融合,針對人臉運(yùn)動與身份信息進(jìn)行了精細(xì)化解耦,以生成更一致的人臉圖像和視頻。

圖片

可組合三維面部先驗(yàn)的顯式條件解耦

針對現(xiàn)有方法在身份與運(yùn)動表征中普遍存在的耦合冗余問題,DynamicFace 提出將人臉條件顯式分解為身份、姿態(tài)、表情、光照及背景五個獨(dú)立的表征,并基于 3DMM 重建模型獲取對應(yīng)參數(shù)。

具體而言,利用源圖像提取身份形狀參數(shù) α,目標(biāo)視頻逐幀提取姿態(tài) β 與表情 θ,隨后渲染生成形狀–姿態(tài)法線圖,減少目標(biāo)人臉身份泄露,最大程度保留源身份;表情信息從二維關(guān)鍵點(diǎn)中提取,建模更精準(zhǔn)的表情信息,僅保留眉毛、眼球及口唇區(qū)域的運(yùn)動先驗(yàn),避免引入目標(biāo)身份特征;光照條件由 UV 紋理圖經(jīng)模糊處理得到,僅保留低頻光照分量;背景條件采用遮擋感知掩碼與隨機(jī)位移策略,實(shí)現(xiàn)訓(xùn)練–推理階段的目標(biāo)臉型對齊。

四條條件并行輸入 Mixture-of-Guiders,每組由 3×3 卷積與零初始化卷積末端構(gòu)成輕量級條件注入模塊,在注入網(wǎng)絡(luò)前經(jīng)過 FusionNet 融合四個條件特征后注入到擴(kuò)散模型中,可在保持 Stable Diffusion 預(yù)訓(xùn)練先驗(yàn)的同時實(shí)現(xiàn)精準(zhǔn)控制。

身份–細(xì)節(jié)雙流注入機(jī)制

為實(shí)現(xiàn)高保真身份保持,DynamicFace 設(shè)計了雙流并行注入架構(gòu)。高層身份流由 Face Former 完成:首先利用 ArcFace 提取 ID Embedding,再通過可學(xué)習(xí) Query Token 與 U-Net 各層 Cross-Attention 交互,確保全局身份一致性;細(xì)節(jié)紋理流由 ReferenceNet 實(shí)現(xiàn),該網(wǎng)絡(luò)為 U-Net 的可訓(xùn)練副本,將 512×512 源圖潛變量經(jīng) Spatial-Attention 注入主網(wǎng)絡(luò),實(shí)現(xiàn)細(xì)粒度的紋理遷移。

即插即用時序一致性模塊

針對時序一致性問題,DynamicFace 會在訓(xùn)練中插入時序注意力層來優(yōu)化幀間穩(wěn)定性,但時序?qū)釉谔幚黹L視頻生成時會出現(xiàn)幀間跳動的現(xiàn)象。為此,我們提出了 FusionTVO,將視頻序列劃分為若干段,并為每段設(shè)置融合權(quán)重,在相鄰段的重疊區(qū)域?qū)嵭屑訖?quán)融合;并在潛變量空間引入總變差(Total Variation)約束,抑制幀與幀之間的不必要波動;對于人臉之外的背景區(qū)域,在每一步去噪迭代過程中采用目標(biāo)圖像中的背景潛變量空間進(jìn)行替換,維持了場景的高保真度。

生成結(jié)果展示

圖片

圖片

圖片

與 SOTA 方法的定性對比實(shí)驗(yàn)

圖片

圖片

圖片

圖片

DynamicFace 可以很好地保持身份(例如,形狀和面部紋理信息)和動作(包括表情和姿勢等),并且生成結(jié)果維持了更好的背景一致性。

具體來說,基于 GAN 的方法往往會生成較為模糊、視覺上并不真實(shí)且身份一致性較差的結(jié)果,但可以維持不錯的運(yùn)動一致性;其他基于擴(kuò)散模型的方法能生成分辨率更高且更真實(shí)的結(jié)果,但運(yùn)動一致性保持較差(如表情不一致,眼神朝向不同等)。

DynamicFace 通過精細(xì)化解耦的條件注入可以保證更優(yōu)的表情一致、眼神一致和姿勢一致性。

與 SOTA 方法的定量對比實(shí)驗(yàn)

圖片

為全面評估 DynamicFace 的性能,研究團(tuán)隊(duì)在 FaceForensics++(FF++)和 FFHQ 數(shù)據(jù)集上進(jìn)行系統(tǒng)性的定量實(shí)驗(yàn),并與當(dāng)前最具代表性的 6 種換臉方法進(jìn)行對比,包括 Deepfakes、FaceShifter、MegaFS、SimSwap、DiffSwap 以及 Face Adapter。

實(shí)驗(yàn)遵循先前論文的參數(shù)設(shè)置:從每個測試視頻中隨機(jī)抽取 10 幀作為評估樣本,并另取連續(xù) 60 幀用于視頻級指標(biāo)計算。所有方法均使用官方開源權(quán)重或公開推理腳本,在輸入分辨率(512×512)下復(fù)現(xiàn)結(jié)果。定量結(jié)果如表中所示:DynamicFace 同時在身份一致性(ID Retrieval)和運(yùn)動一致性(Mouth&Eye Consistency)達(dá)到了最優(yōu)的結(jié)果。

整體而言,實(shí)驗(yàn)結(jié)果充分證明了 DynamicFace 在身份保真與運(yùn)動還原方面的綜合優(yōu)勢,驗(yàn)證了其在高質(zhì)量人臉可控生成中的卓越性能。

更多應(yīng)用樣例

圖片

圖片

我們也展示了一些其他的應(yīng)用示例,DynamicFace 可以對身份保持和人體驅(qū)動等生成結(jié)果進(jìn)行后處理,顯著提升生成結(jié)果的人臉 ID 一致性和表情控制,更多效果展示可以在項(xiàng)目主頁中進(jìn)行查看。期望這種精細(xì)化解耦條件注入的方法能為可控生成的后續(xù)工作提供新思路。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-08-20 07:06:23

2025-08-20 07:49:28

2025-08-05 09:09:00

AI訓(xùn)練模型

2025-02-25 10:04:10

2025-02-06 10:45:00

2024-10-12 10:57:39

2019-05-15 10:23:58

AI人工智能視頻換臉技術(shù)

2020-01-07 14:14:57

AI 數(shù)據(jù)人工智能

2025-01-17 14:38:40

2024-01-12 21:18:22

負(fù)樣本大模型蒸餾

2025-02-10 08:30:00

2015-10-29 13:31:54

Ube臉書模式

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2025-10-29 09:45:35

2025-06-10 05:00:00

2022-11-30 20:30:18

2023-05-26 00:19:07

照片模型個性化

2024-04-29 11:06:53

GDR語言模型

2023-10-09 14:22:48

AI換臉

2021-05-08 05:31:55

人工智能AI換臉軟件
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號