偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

谷歌DeepMind重磅推出多視角視頻擴散模型CAT4D,單視角視頻也能轉換多視角了

人工智能 新聞
給定輸入單目視頻,我們使用多視圖視頻擴散模型生成新視點的多視圖視頻。然后,使用這些生成的視頻將動態(tài) 3D 場景重建為變形 3D 高斯。

本文經AIGC Studio公眾號授權轉載,轉載請聯(lián)系出處。

單目視覺4D重建再突破!谷歌DeepMind等團隊,推出了多視角視頻擴散模型CAT4D,它支持輸入單個視角的視頻,轉換后可以自行拖動。

該模型可以分別固定視角和時間,然后分別輸出了視角不動(機位固定)時間變、時間不變視角動,以及視角時間均變動的效果。 如下圖所示:

圖片圖片

相關鏈接

? 論文:https://arxiv.org/pdf/2411.18613

? 主頁:https://cat-4d.github.io/

論文介紹

圖片

    CAT4D:使用多視圖視頻擴散模型以 4D 形式創(chuàng)建任何內容

工作原理

它是如何運作的

給定輸入單目視頻,我們使用多視圖視頻擴散模型生成新視點的多視圖視頻。然后,使用這些生成的視頻將動態(tài) 3D 場景重建為變形 3D 高斯。

圖片

獨立的攝像頭和時間控制

CAT4D 的核心是多視圖視頻擴散模型,它可以解開攝像機和場景運動的控制。我們通過給定 3 個輸入圖像(帶有相機姿勢)生成三種類型的輸出序列來演示這一點:1)固定視點和變化時間,2)變化視點和固定時間,3)變化視點和變化時間。

圖片

比較

將我們的方法與不同任務的基線進行比較。嘗試選擇不同的任務和場景!

給定 3 個輸入圖像,我們生成三種類型的輸出序列:

1. 固定視點和變化時間

2. 變化視點和固定時間

3. 變化視點和變化時間。

圖片

僅給定動態(tài)場景的一些姿勢圖像,我們就可以通過重建與一個輸入視圖的時間相對應的靜態(tài) 3D 場景來創(chuàng)建“子彈時間”效果。三個輸入圖像顯示在左側,其中第一個是目標子彈時間幀。

圖片

DyCheck 數據集上單目視頻動態(tài)場景重建的比較。

圖片

責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2024-12-16 14:40:00

AI模型訓練

2022-08-28 16:20:44

模型數學

2025-06-18 10:09:13

2024-12-18 15:20:00

視圖生成AI

2023-08-14 08:30:32

2023-10-23 10:11:36

自動駕駛技術

2023-11-23 07:41:54

因果推斷大模型

2024-02-20 13:44:00

AI數據

2021-10-18 10:14:54

數據技術模型

2022-12-13 10:17:05

技術目標檢測

2025-03-13 10:28:07

2022-08-24 14:50:09

谷歌3D

2024-07-08 08:47:00

2024-05-10 07:58:03

2017-07-11 15:00:04

前端CSS3D視角

2010-06-01 09:20:45

jQuery

2012-08-17 09:32:08

云計算架構

2023-02-20 19:52:53

場景商品業(yè)務

2021-06-18 05:59:37

Css前端CSS 特效

2022-06-09 12:07:14

行業(yè)云首席信息官
點贊
收藏

51CTO技術棧公眾號