偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

新聞 人工智能 算法
最近,來自伯克利大學(xué)的研究人員提出了一個(gè)叫做Plenoxels的方法。不需要神經(jīng)網(wǎng)絡(luò),僅僅通過梯度下降和正則化便實(shí)現(xiàn)了同樣的效果,而且速度還快了100倍!

 [[441881]]

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

萬萬沒想到,把照片變3D這件事,離了神經(jīng)網(wǎng)絡(luò)也是這般絲滑。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

而在此之前,新視角合成這方面的“大牛”,是近兩年大火的NeRF (神經(jīng)輻射場(chǎng))。

它是一個(gè)簡(jiǎn)單的全連接神經(jīng)網(wǎng)絡(luò),使用2D圖像的信息作為訓(xùn)練數(shù)據(jù),還原擁有體積的3D場(chǎng)景。

但最近,來自伯克利大學(xué)的研究人員提出了一個(gè)叫做Plenoxels的方法。

不需要神經(jīng)網(wǎng)絡(luò),僅僅通過梯度下降和正則化便實(shí)現(xiàn)了同樣的效果,而且速度還快了100倍!

那么他們是如何做到這點(diǎn)的呢?

由NeRF到Plenoxels的進(jìn)化

為了幫助大家理解Plenoxels,我們先來簡(jiǎn)單介紹一下NeRF模型。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍
本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

要準(zhǔn)備NeRF的數(shù)據(jù),我們首先需要一部相機(jī)。

拍了很多張各個(gè)角度的照片后,沿相機(jī)射線將每一張2D圖片的坐標(biāo)視圖方向構(gòu)成一個(gè)5D向量 (x, y, z, θ, φ)作為mlp (多層全連接神經(jīng)網(wǎng)絡(luò))的輸入。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

我們從圖(b)上可以看到,射線上的點(diǎn)有了顏色,每點(diǎn)的顏色c = (r, g, b)和密度(σ)就是輸出向量。

接著NeRF使用體積渲染技術(shù)將得到的顏色與密度進(jìn)行3D渲染。

由于渲染函數(shù)是可導(dǎo)的,我們可以最小化合成效果與實(shí)際效果的誤差,從而進(jìn)行神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化。

其中mlp使用的參數(shù)多可達(dá)到5MB,實(shí)際訓(xùn)練起來就會(huì)發(fā)現(xiàn)訓(xùn)練時(shí)間十分漫長(zhǎng),通常要1-4天。

這個(gè)速度與Plenoxels的11分鐘相比確實(shí)是無法接受的。

2D圖片變3D,聽起來不是個(gè)小工程,Plenoxels不用神經(jīng)網(wǎng)絡(luò)是如何實(shí)現(xiàn)的呢?其實(shí)并不復(fù)雜。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

Plenoxels發(fā)現(xiàn)NeRF成功的秘訣其實(shí)是它的體積渲染方程,與其最耗時(shí)的神經(jīng)網(wǎng)絡(luò)關(guān)系不大。

那么你一定會(huì)好奇這個(gè)體積渲染方程究竟是何方神圣,我們就先來看一下。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

σi代表不透明度,ci代表顏色,δi代表距離。Ti代表有多少光經(jīng)過射線上的點(diǎn)i,是通過密度和距離計(jì)算的。

這個(gè)體積渲染方程其實(shí)就是將射線上每個(gè)點(diǎn)的顏色,不透明度,光,還有距離進(jìn)行了一個(gè)整合處理。

體積渲染方程介紹過了,那么不需要神經(jīng)網(wǎng)絡(luò)的Plenoxels是如何表示圖片的呢?

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

Plenoxels首先重建了一個(gè)稀疏的體素表格,每個(gè)被占用的體素都帶有不透明度球諧系數(shù)。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

我們的顏色信息就存儲(chǔ)在這些球諧系數(shù)中,每個(gè)顏色通道需要9個(gè)系數(shù)表示,一共有三個(gè)顏色,那么每個(gè)體素就需要27個(gè)球諧系數(shù)來表示它的顏色。

相機(jī)射線經(jīng)過的每個(gè)點(diǎn)的顏色和不透明度,就是通過其最近處的8個(gè)體素的三線性插值計(jì)算的。

接著與NeRF一樣,使用體積渲染技術(shù)將得到的顏色與不透明度進(jìn)行3D渲染。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍
本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

Plenoxels通過對(duì)渲染的像素的平均平方誤差 (MSE)進(jìn)行最小化,來優(yōu)化體素的不透明度和球諧系數(shù),并且使用TV正則化幫助消除噪聲。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

我們可以看出,是否使用TV正則化的效果區(qū)別還是很大的!

提速100倍,僅需11分鐘

我們用最直觀的方法對(duì)比一下兩個(gè)模型速度上的差距。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

看到了嗎,只用幾秒Plenoxels就可以達(dá)到一個(gè)比較清晰的效果,而NeRF只有一個(gè)模糊的影子。

同樣是單個(gè)場(chǎng)景,NeRF使用型號(hào)為v100的單個(gè)GPU訓(xùn)練需要耗時(shí)1-2天,而Plenoxels使用單個(gè)GPU通常只需要11分鐘。

這時(shí)有一個(gè)問題一定縈繞在你的腦海里,速度提升了這么多,效果真的不會(huì)受影響嗎?

空口無憑,我們還是要用數(shù)據(jù)說話。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

PSNR (峰值信噪比):是最普遍,最廣泛使用的評(píng)鑒畫質(zhì)的客觀量測(cè)法,PSNR值越大,就代表失真越少。

SSIM (結(jié)構(gòu)相似性):衡量實(shí)際圖像和合成圖像的相似度,當(dāng)兩張圖像一模一樣時(shí),SSIM的值等于1。

LPIPS (學(xué)習(xí)感知圖像塊相似度):用于度量實(shí)際圖像和合成圖像之間的差別,值越低代表圖片越相似。

可以看到Plenoxels對(duì)比其他模型的表現(xiàn)不說樣樣最好,但也絕不落后他人,關(guān)鍵在于它的速度整整快了兩個(gè)數(shù)量級(jí)

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

正因?yàn)?strong>Plenoxels速度上的大幅提升,使得一些目前處于瓶頸的下游應(yīng)用變得可能,例如多次反射照明 (multi-bounce lighting)和大型場(chǎng)景的3D建模 (3D generative models)。

如果能在相機(jī)和體素散列上進(jìn)行有效優(yōu)化,模型甚至可以讓端到端三維重建成為擁有pipeline的實(shí)際應(yīng)用。

相信Plenoxels的潛力不僅于此,讓我們一起期待它落地后的成果吧!

UC伯克利本科生一作

效果強(qiáng)勁的Plenoxels來自UC伯克利的學(xué)生團(tuán)隊(duì),一作Alex Yu還是一名本科生。

在大學(xué)里,他不僅同時(shí)學(xué)習(xí)計(jì)算機(jī)應(yīng)用數(shù)學(xué)兩門專業(yè),還在伯克利的BAIR ( Berkeley Artificial Intelligence Research)實(shí)驗(yàn)室進(jìn)行3D計(jì)算機(jī)視覺的相關(guān)研究。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

Alex計(jì)劃在2022的秋季開始他的PhD旅程,讓人不禁感嘆AI界真是人才輩出。

在未來經(jīng)過PhD的學(xué)習(xí)后,他又會(huì)迸發(fā)出怎樣的能量呢,讓我們一起拭目以待吧!

GitHub代碼開源

目前,Plenoxels項(xiàng)目的代碼已經(jīng)在GitHub上開源。

本科生新算法打敗NeRF,不用神經(jīng)網(wǎng)絡(luò)照片也能動(dòng)起來,提速100倍

小伙伴們要注意的是,拍攝照片的時(shí)候要盡可能環(huán)繞物體,并且嘗試不同的高度哦。

快來試試效果如何吧!

 

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2021-09-26 09:23:01

GC算法垃圾

2009-06-19 11:18:51

Factory BeaSpring配置

2022-06-07 09:00:32

PythonAI靜態(tài)圖片

2020-11-16 11:50:21

Python代碼命令

2019-10-29 08:50:31

深度學(xué)習(xí)編程人工智能

2019-02-27 14:06:53

AIAdamSGD

2021-08-10 15:37:45

AI 數(shù)據(jù)機(jī)器學(xué)習(xí)

2013-05-27 15:35:18

用友UAP移動(dòng)應(yīng)用移動(dòng)平臺(tái)

2022-02-24 08:30:24

操作系統(tǒng)CPU程序

2010-09-01 17:35:41

云計(jì)算

2020-09-21 21:40:19

AI 數(shù)據(jù)人工智能

2021-08-02 23:19:06

微信小程序人工智能

2019-10-10 09:41:54

AI 數(shù)據(jù)人工智能

2011-06-01 14:51:54

jQuery

2019-05-21 14:18:09

PygamePython編程語言

2010-09-08 09:48:56

Gif播放教程Android

2012-09-03 09:21:51

2024-01-29 13:03:00

框架3DHM視頻

2013-02-28 10:35:59

hadoop大數(shù)據(jù)Hortonworks

2020-09-07 06:30:00

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)圖形
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)