偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一張圖轉(zhuǎn)3D質(zhì)量起飛!GitHub剛建空倉就有300+人趕來標(biāo)星

人工智能 新聞
論文中指出,即使資源效率更高的Instant-NGP方案在16G顯存GPU上也只能達(dá)到128x128的分辨率。

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

最新“只用一張圖轉(zhuǎn)3D”方法火了,高保真那種。

圖片

對比之前一眾方法,算得上跨越式提升。(新方法在最后一行)

圖片

挑出一個(gè)結(jié)果放大來看,幾何結(jié)構(gòu)細(xì)節(jié)豐富,渲染分辨率也高達(dá)1024x1024。

圖片

新方法Magic123,來自KAUST、Snap和牛津聯(lián)合團(tuán)隊(duì),一作為KAUST博士生錢國成。

只需輸入單個(gè)圖像,不光生成高質(zhì)量3D網(wǎng)格,連有視覺吸引力的紋理也一起打包生成。

圖片

甚至論文剛掛在arXiv上,代碼還沒來得及上傳時(shí),就已經(jīng)有300+人趕來標(biāo)星碼?。槺愦吒?。

圖片

從粗到精,兩階段方案

以往2D轉(zhuǎn)3D最常見方法就是NeRF。但NeRF不光占顯存高,分辨率還低。

論文中指出,即使資源效率更高的Instant-NGP方案在16G顯存GPU上也只能達(dá)到128x128的分辨率。

為進(jìn)一步提高3D內(nèi)容的質(zhì)量,團(tuán)隊(duì)在NeRF之后引入了第二階段,采用DMTet算法將分辨率提高到1024x1024,并且細(xì)化NeRF得出的幾何結(jié)構(gòu)和紋理。

圖片

對于僅有一張的2D參考圖像,首先使用現(xiàn)成的Dense Prediction Transformer模型進(jìn)行分割,再使用預(yù)訓(xùn)練的MiDaS提取深度圖,用于后續(xù)優(yōu)化。

然后進(jìn)入第一步粗階段,采用Instant-NGP并對其進(jìn)行優(yōu)化,快速推理并重建復(fù)雜幾何,但不需要太高分辨率,點(diǎn)到為止即可。

在第二步精細(xì)階段,在用內(nèi)存效率高的DMTet方法細(xì)化和解耦3D模型。DMTet是一種混合了SDF體素和Mesh網(wǎng)格的表示方法,生成可微分的四面體網(wǎng)格。

并且在兩個(gè)階段中都使用Textural inversion來保證生成與輸入一致的幾何形狀和紋理。

團(tuán)隊(duì)將輸入圖像分為常見對象(如玩具熊)、不太常見對象(如兩個(gè)疊在一起的甜甜圈)、不常見對象(如龍雕像)3種。

圖片

發(fā)現(xiàn)僅使用2D先驗(yàn)信息可以生成更復(fù)雜的3D結(jié)構(gòu),但與輸入圖像的一致性不高。

僅使用3D先驗(yàn)信息能產(chǎn)生精確但缺少細(xì)節(jié)的幾何體。

團(tuán)隊(duì)建議綜合使用2D和3D先驗(yàn),并經(jīng)過反復(fù)試驗(yàn),最終找到了二者的平衡點(diǎn)。

圖片

2D先驗(yàn)信息使用了Stable Diffusion 1.5,3D先驗(yàn)信息使用了哥倫比亞大學(xué)/豐田研究所提出的Zero-1-to-3。

圖片

在定性比較中,結(jié)合兩種先驗(yàn)信息的Magic123方法取得了最好的效果。

圖片

在定量比較中,評估了Magic123在NeRF4和RealFusion15數(shù)據(jù)集上的表現(xiàn),與之前SOTA方法相比在所有指標(biāo)上取得Top-1成績。

圖片

那么Magic123方法有沒有局限性呢?

也有。

在論文最后,團(tuán)隊(duì)指出整個(gè)方法都建立在“假設(shè)參考圖像是正視圖”的基礎(chǔ)上,輸入其他角度的圖像會(huì)導(dǎo)致生成的幾何性質(zhì)較差。

比如從上方拍攝桌子上的食物,就不適合用這個(gè)方法了。

另外由于使用了SDS損失,Magic123傾向于生成過度飽和的紋理。尤其是在精細(xì)階段,更高分辨率會(huì)放大這種問題。

項(xiàng)目主頁:https://guochengqian.github.io/project/magic123/

論文:https://arxiv.org/abs/2303.11328

GitHub:https://github.com/guochengqian/Magic123

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-07-16 12:02:11

2024-12-31 07:15:00

2023-11-26 17:03:33

公司AI

2025-03-21 09:30:42

2020-09-01 13:30:03

人工智能機(jī)器學(xué)習(xí)技術(shù)

2011-09-22 10:07:52

奧圖碼投影儀

2021-02-07 09:01:10

Java并發(fā)編程

2024-09-30 09:35:55

圖像生成AI

2023-08-21 10:57:17

3D模型

2024-01-07 23:05:19

圖像2D

2019-09-11 10:12:12

華為

2023-12-22 09:29:07

模型3D

2015-03-10 10:15:27

AppleWatch開發(fā)Swift

2021-08-05 09:49:44

鴻蒙HarmonyOS應(yīng)用

2022-08-22 14:17:31

3D模型

2024-03-04 13:20:00

數(shù)據(jù)模型

2012-04-10 17:36:49

NEC投影機(jī)

2023-06-25 10:34:56

3D開源

2015-09-14 09:07:15

Java多線程

2025-03-27 09:26:30

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)