偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

手機1秒生成3D全息圖,MIT團隊新作

新聞 機器學習
來自MIT的團隊開發(fā)了一種新算法,不需要復(fù)雜儀器、也不需要等幾個小時,生成這樣一張全息圖,只需要在智能手機上耗費不到1秒的時間。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

一張圖片的焦距,能在老鼠玩具和日歷尺之間自由切換:

甚至能完成圖片上任一物體的對焦,呈現(xiàn)出不同物體在不同深度時的照片:

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

這張具有神奇魔力的圖片,就是集成了“全部物體信息”的全息圖

生成這類全息圖,往往需要大量計算才能完成。

然而,來自MIT的團隊開發(fā)了一種新算法,不需要復(fù)雜儀器、也不需要等幾個小時,生成這樣一張全息圖,只需要在智能手機上耗費不到1秒的時間。

要知道,就在去年11月份,三星的科學家們生成3D全息視頻所用的處理器,尺寸還是太大,沒能整合到手機上:

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

那么,這種快速生成3D全息圖的方法,究竟是怎么做到的?

用神經(jīng)網(wǎng)絡(luò)快速“切蛋糕”

首先,全息圖是什么?

舉個例子,visa信用卡上的鴿子,就利用了全息圖來做防偽標志。

[[387030]]

全息圖即“全部的信息”,這種圖片包含物體的幅度相位信息。

普通照相機,拍攝出來的照片只包含物體的幅度信息(亮暗),相位信息(遠近)卻無法直接保存。

這也是為什么,我們平時看見的2D照片“沒有立體感”。

此前,計算機要想360°全方位生成全息圖,通常得從多個角度進行干涉、衍射,再將相位信息拼合起來,與振幅信息疊加后生成圖片。

多角度生成相位信息,就像是在一個球形蛋糕上精準地切割8刀,將之分成8塊,對每塊進行相位重現(xiàn):

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

然而,這種方法所需要的計算量往往巨大,耗時很久,完全無法在智能手機上運行。

因此,MIT團隊思考,能不能采用深度學習的方法,只通過3個角度,就把“蛋糕”分成8塊,來生成全息圖?

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

他們精挑細選出了4000張包含幅度、相位信息的圖像,以及這些圖像對應(yīng)的3D全息圖,用來訓練神經(jīng)網(wǎng)絡(luò)。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

整體思路大致如下:獲取物體的相位信息后,生成點云,再結(jié)合殘差神經(jīng)網(wǎng)絡(luò),生成整體的全息圖。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

那么,這種全息圖的效果如何呢?

可對焦任意物體,內(nèi)存占用不到1MB

事實證明,利用神經(jīng)網(wǎng)絡(luò)進行預(yù)測,只需要不到640KB的內(nèi)存就能生成全息圖。

如果在消費級GPU上,這種神經(jīng)網(wǎng)絡(luò)模型,每秒能生成60張分辨率為1080p的彩色3D全息圖。

而在智能手機如iPhone 11 Pro上,每秒能生成1.1張全息圖;至于Google Edge TPU上,每秒則能生成2張全息圖。

以動畫角色大雄兔(Big Buck Bunny)為例,右下角是它的深度圖。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

從圖中可見,利用神經(jīng)網(wǎng)絡(luò)(右)生成的全息圖像,幾乎和用原有方法(左)生成的全息圖像一模一樣。

而且,無論是遠處的小黃花,還是近處的兔子眼睛,都能完美對焦。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

表面上看起來是一樣的話,具體到幅度和相位信息上如何呢?

從圖中可見,利用神經(jīng)網(wǎng)絡(luò)預(yù)測的幅度和相位信息,也與真實值非常接近。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

即使是現(xiàn)實中的照片,也與實際生成目標非常接近了。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

當然,從細節(jié)來看的話,還是略微有一點差距。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

相比于現(xiàn)有的VR和AR方案,3D全息圖是3D可視化的另一個實現(xiàn)方案。

但在使用VR的時候,用戶實際上是盯著2D顯示屏,產(chǎn)生3D錯覺,因此可能會產(chǎn)生視覺疲勞、頭暈等癥狀。

而3D全息圖則允許眼睛調(diào)整焦距,即交替地對前景和背景進行聚焦,能有效緩解這種癥狀。

下一步,團隊計劃添加眼球追蹤技術(shù),讓用戶的眼睛看向哪里,哪里就生成部分高清全息圖。

[[387036]]

在這種方案下,計算機只需要部分生成全息圖,實時運用下,效果也能更快更好。

以及,索尼贊助了這項研究,所以……

[[387037]]

作者介紹

[[387038]]

論文一作史亮,2014年畢業(yè)于北航,碩士畢業(yè)于斯坦福,目前于MIT就讀博士,研究方向包括VR/AR,以及機器學習和計算機圖形學。

[[387039]]

論文二作李北辰,2018年畢業(yè)于清華大學,目前于MIT就讀博士,研究方向是機器學習在計算機圖形學中的應(yīng)用。

論文地址:
https://www.nature.com/articles/s41586-020-03152-0.pdf

 

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2022-02-11 15:30:55

量子科學技術(shù)

2024-03-05 11:31:00

AI數(shù)據(jù)

2024-07-16 12:02:11

2024-07-04 09:26:16

2024-09-20 16:20:00

2014-07-31 10:10:53

全息影像手機數(shù)碼

2025-01-16 10:05:00

3D模型代碼

2023-07-14 09:41:01

3DAI

2023-12-14 12:57:00

模型數(shù)據(jù)

2025-01-10 14:00:00

3D模型生成

2024-10-28 07:40:00

2024-12-10 15:17:11

2023-11-27 13:43:00

AI模型

2011-05-26 10:55:39

2024-03-20 15:51:00

AI數(shù)據(jù)

2025-01-09 12:32:18

2020-08-26 10:37:21

阿里3D

2024-07-03 14:29:38

2011-09-22 10:07:52

奧圖碼投影儀

2011-12-21 12:46:43

點贊
收藏

51CTO技術(shù)棧公眾號