偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

CityDreamer:一鍵生成無邊界的3D城市

人工智能 新聞
近日,來自南洋理工大學(xué) S-Lab 的研究者提出了一個(gè)新的框架 CityDreamer,專注于生成無邊界的 3D 城市。

近些年,3D 自然場(chǎng)景的生成出現(xiàn)了大量的研究工作,但是 3D 城市生成的研究工作還寥寥無幾。這主要是因?yàn)?3D 城市生成更難,人類對(duì)于其中的結(jié)構(gòu)失真更敏感。近日,來自南洋理工大學(xué) S-Lab 的研究者提出了一個(gè)新的框架 CityDreamer,專注于生成無邊界的 3D 城市,讓我們先看一下效果。

看起來還不錯(cuò)?這都來自于以下的這篇研究。

圖片

  • 論文地址:https://arxiv.org/abs/2009.00610
  • 項(xiàng)目地址:https://haozhexie.com/project/city-dreamer
  • 代碼地址:https://github.com/hzxie/city-dreamer

為滿足元宇宙中對(duì) 3D 創(chuàng)意工具不斷增長(zhǎng)的需求,三維場(chǎng)景生成最近受到了相當(dāng)多的關(guān)注。其中,生成 3D 城市比 3D 自然場(chǎng)景更復(fù)雜。在自然場(chǎng)景中,相同類別的物體通常有相似的外觀,例如樹通常是綠色的。但是在城市中,建筑的外觀非常多樣,但它們被賦予了相同的類別,這將導(dǎo)致建筑外觀的質(zhì)量下降。

為了解決這個(gè)問題,研究人員提出了 CityDreamer 以生成無邊界的 3D 城市,它將建筑和城市背景(包括道路、綠化、水域)生成分別用 2 個(gè)不同的模塊生成。這兩個(gè)模塊都采用鳥瞰(Bird's Eye View, BEV)作為場(chǎng)景表示,并采用體積渲染器(Volumetric Renderer )通過對(duì)抗訓(xùn)練生成逼真的圖像。

值得注意的是,場(chǎng)景參數(shù)化的方式經(jīng)過精心定制,以適應(yīng)背景物體和建筑物的獨(dú)特特征。每個(gè)類別中的背景對(duì)象通常具有相似的外觀,同時(shí)呈現(xiàn)出不規(guī)則的紋理。因此,CityDreamer 引入生成哈希網(wǎng)格來保持自然性,同時(shí)維護(hù) 3D 一致性。相比之下,建筑實(shí)例表現(xiàn)出各種各樣的外觀,但其立面的紋理通常顯示出規(guī)則的周期性圖案。研究人員因此,設(shè)計(jì)了周期性位置編碼,這對(duì)于處理多樣性的建筑立面來說是簡(jiǎn)單而有效的。

為了使生成的城市在布局上和外觀上都更逼真,研究人員們構(gòu)建了 2 個(gè)數(shù)據(jù)集:OSM 和 GoogleEarth。前者從 OpenStreetMap [1] 提取了超過 80 個(gè)知名城市、超過 6000km2 的俯視視角的高度圖和語義分割圖;后者從 Google Earth Studio [2] 上提取了美國(guó)紐約市的 400 環(huán)形軌跡,包含 24,000 張圖像及對(duì)應(yīng)的語義分割和建筑實(shí)例分割標(biāo)注。這些標(biāo)注是通過將從 OSM 數(shù)據(jù)集生成的 3D 城市布局投影至圖像上生成的。這種方式可以很容易地將標(biāo)注數(shù)據(jù)擴(kuò)展至世界上的其他城市。

方法

圖片

CityDreamer 將 3D 城市生成分解為 4 步:無邊界城市布局生成、城市背景生成、建筑實(shí)例生成和圖像融合。

無邊界城市布局生成

CityDreamer 將無限的城市布局生成轉(zhuǎn)化為可擴(kuò)展的語義地圖和高度場(chǎng)的生成問題。為此,CityDreamer 采用了基于 MaskGIT [3] 的無邊界布局生成器(Unbounded Layout Generator, ULG),它天然地支持 inpainting 和 outpainting 功能。具體來說,ULG 使用了 VQVAE 來編碼語義圖和高度場(chǎng)的圖像切片,將它們轉(zhuǎn)換為離散潛在空間并創(chuàng)建 Codeboook。在推理過程中,ULG 以自回歸的方式生成 Codebook 索引,隨后,ULG 使用 VQVAE 的解碼器生成一對(duì)語義圖和高度場(chǎng)。由于 VQVAE 生成固定大小的語義圖和高度場(chǎng),因此 ULG 使用圖像 outpainting 來創(chuàng)建任意大小的語義圖和高度場(chǎng)。在此過程中,ULG 采用滑動(dòng)窗口來預(yù)測(cè)每一步的局部 Codebook 索引,滑動(dòng)期間有 25% 的重疊。

城市背景生成

City Background Generator (CBG) 主要用于生成城市的背景,具體包括道路、綠化和水域。該模塊使用了鳥瞰視圖(BEV)作為場(chǎng)景的表示。具體而言,該表示使用由語義圖和高度圖組成的 BEV 表征來表達(dá)一個(gè)大尺度三維場(chǎng)景。

針對(duì)城市背景相同類別通常具有相似外觀的特性,CBG 引入生成哈希網(wǎng)格(Generative Hash Grid)作為場(chǎng)景的參數(shù)化:保持自然性,同時(shí)維護(hù) 3D 一致性。具體而言,CBG 使用哈希函數(shù)圖片來將場(chǎng)景特征圖片 和空間點(diǎn)坐標(biāo)圖片映射到多尺度混合的可學(xué)習(xí)參數(shù)上:

圖片

為了保證渲染的三維一致性,我們使用基于體積渲染的渲染網(wǎng)絡(luò)來完成三維空間特征到二維圖像的映射。對(duì)于相機(jī)光線上的一點(diǎn),我們經(jīng)過查詢生成式哈希網(wǎng)格得到其對(duì)應(yīng)的特征,使用經(jīng)風(fēng)格噪聲調(diào)制的多層 MLP 來得到其對(duì)應(yīng)點(diǎn)的顏色和體密度,最終通過體渲染來將一條相機(jī)光線上的所有點(diǎn)積分為對(duì)應(yīng)像素的顏色。

建筑實(shí)例生成

Building Instance Generator (BIG) 用于生成城市的建筑。和城市背景生成一樣,我們使用了鳥瞰視圖作為場(chǎng)景的表示,使用基于體積渲染的渲染網(wǎng)絡(luò)來完成三維空間特征到二維圖像的映射。觀察到建筑立面和屋頂分布的顯著差異,建筑立面和屋頂在 BIG 中被分配了 2 個(gè)不同的類別標(biāo)簽。

針對(duì)建筑立面所呈現(xiàn)出的周期性規(guī)律,我們?cè)O(shè)計(jì)了更輕量化的場(chǎng)景參數(shù)化方式:基于周期性函數(shù)的場(chǎng)景參數(shù)化。具體而言,BIG 將建筑特征圖片和空間坐標(biāo)圖片通過周期性函數(shù)映射到一個(gè)高維空間中:

圖片

其中,$\rm Concat$ 表示連接(Concatenation)操作,圖片 被定義為

圖片

圖像融合

給定城市背景的圖像和掩膜(分別用 圖片圖片表示) 以及 建筑實(shí)例的圖像和掩膜的集合( 分別用 圖片和 圖片表示),CityDreamer 使用如下方式得到融合后的圖像圖片

圖片

其中 n 表示建筑實(shí)例的數(shù)量。

實(shí)驗(yàn)

下圖展示了 CityDreamer 和其他 SOTA 方法的對(duì)比,這些方法包括 PersistentNature [4]、SceneDreamer [5] 和 InfiniCity [6]。實(shí)驗(yàn)結(jié)果表明,CityDreamer 的效果明顯優(yōu)于其他方法。

圖片

圖片

下圖展示了更多視角的生成結(jié)果,該結(jié)果證明了 CityDreamer 的魯棒性。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-04-27 15:54:02

模型研究

2024-07-16 12:02:11

2025-04-07 08:35:00

3DAI生成

2025-01-10 14:00:00

3D模型生成

2023-12-14 12:51:28

LLM3D場(chǎng)景

2025-03-31 10:08:00

AI模型測(cè)試

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2024-07-04 09:26:16

2024-07-31 15:30:05

2024-12-10 15:17:11

2025-01-09 12:32:18

2025-02-05 11:00:00

2024-05-16 09:24:17

3D技術(shù)

2025-02-24 10:40:00

3D模型生成

2023-07-14 09:41:01

3DAI

2025-01-14 09:24:46

2024-09-27 17:58:26

2024-09-20 16:20:00

2025-01-07 13:19:48

模型AI訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)