偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

3D高斯?jié)姙R,可輸入視圖量高達500!推理速度提升3倍,內(nèi)存少80%

人工智能 新聞
ZPressor能高效壓縮3D高斯?jié)姙R(3DGS)模型的多視圖輸入,解決其在處理密集視圖時的性能瓶頸,提升渲染效率和質(zhì)量。

在增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)等前沿應用領(lǐng)域,新視角合成(Novel View Synthesis, NVS)正扮演著越來越關(guān)鍵的角色。

近年來,3D高斯?jié)姙R(3D Gaussian Splatting, 3DGS)技術(shù)橫空出世,憑借其革命性的實時渲染能力和卓越的視覺質(zhì)量,迅速成為NVS領(lǐng)域的一大突破。

然而,傳統(tǒng)3DGS對耗時的「逐場景優(yōu)化」的依賴,嚴重限制了其在實際應用中的部署。前饋3DGS(Feed-Forward 3DGS),通過單次前向推理獲取場景的三維信息。

這種演進看似解決了核心問題,但隨之而來的挑戰(zhàn)卻讓其在「多視角」前步履維艱:當前的前饋3DGS模型在處理密集輸入視圖時,其可擴展性受到了根本性的制約。

深入分析現(xiàn)有前饋3DGS模型的架構(gòu),可以發(fā)現(xiàn)其核心癥結(jié)在于編碼器容量的有限性。當輸入視圖變得密集時,編碼器難以有效處理隨之而來的「信息過載」,導致計算成本飆升。

這種現(xiàn)象并非偶然,而是源于場景總信息量(即所有視圖特征的聯(lián)合熵)中存在大量冗余信息。在特征提取之后,如何去除這些不相關(guān)信息,同時保留其預測能力,是高效利用輸入視圖信息的關(guān)鍵。

以當前最先進的模型DepthSplat為例,實驗結(jié)果清晰地表明,隨著輸入視圖數(shù)量的增加,其性能會顯著下降,同時計算成本也急劇攀升。

圖片

例如,在處理36個輸入視圖時,DepthSplat的PSNR等指標會大幅降低,推理時間和內(nèi)存占用也會顯著增加。這揭示了信息過載對模型性能和資源消耗的直接因果關(guān)系:過多的冗余信息不僅拖慢了處理速度,更降低了最終的渲染質(zhì)量。

浙江大學的研究人員提出ZPressor,一種即插即用的輕量級模塊,壓縮前饋3DGS特征,增強模型密集視角擴展性和性能,36個輸入視圖下提升4.65dB,推理時間減少70%,顯存占用減少80%,并拓展可輸入的視圖數(shù)目到接近500個。

圖片

論文地址:https://www.arxiv.org/abs/2505.23734

項目主頁:https://lhmd.top/zpressor

代碼鏈接:https://github.com/ziplab/ZPressor

為了從理論層面理解并解決信息過載問題,研究人員引入了信息瓶頸(Information Bottleneck, IB)原理。

IB原理為學習緊湊型表示提供了一個堅實的理論基礎(chǔ),其核心思想是:從輸入(X)中提取一個壓縮表示(Z),使Z盡可能地保留與目標(Y)相關(guān)的信息,同時盡可能地壓縮X中與Y無關(guān)的信息。

可以直觀地理解為,IB原理旨在最小化「壓縮分數(shù)」(即Z攜帶關(guān)于X的信息量),同時最大化「預測分數(shù)」(即Z對于預測目標Y的有效信息量)。

該原理為3DGS面臨的「信息過載」這一「甜蜜負擔」提供了理論上的「減負」之道。

基于對信息瓶頸原理的理解,研究人員提出了ZPressor,一個輕量級、且 「架構(gòu)無關(guān)」的模塊。

ZPressor的核心功能在于高效地將多視圖輸入壓縮成一個緊湊的潛在狀態(tài)Z,這種壓縮并非簡單地丟棄信息,而是巧妙地保留了場景中的必要信息,同時有效剔除冗余,從而直接解決了前向式3DGS模型長期以來面臨的「信息過載」難題 (1)。

三步走,打造高效「信息壓縮機」

ZPressor的精妙之處在于其將復雜的信息壓縮過程分解為三個步驟,打造了一個高效的「信息壓縮機」。

第一步:錨點視圖選擇(Anchor View Selection)

ZPressor首先通過 「最遠點采樣」(farthest point sampling)方法來選擇錨點視圖。這一迭代過程基于相機位置,確保所選的錨點在空間上具有多樣性,并能最大限度地代表整個場景。

第二步:支持視圖歸屬(Support-to-Anchor Assignment)

一旦錨點視圖確定,每個剩余的支持視圖都會根據(jù)相機距離被分配到其最近的錨點視圖。精準的歸屬機制確保了支持視圖中互補的場景細節(jié)能夠與空間上最相關(guān)的錨點視圖進行分組,保證了信息的「對口」融合,避免了無序。

第三步:視圖信息融合(Views Information Fusion)

這是ZPressor實現(xiàn)信息壓縮的關(guān)鍵步驟。它采用定制化的交叉注意力(cross-attention)模塊進行信息融合。

具體而言,從錨點視圖中提取的特征充當「查詢」(query),而支持視圖的特征則提供「鍵」(keys)和「值」(values)。

通過這種方式,支持視圖的信息被有效地整合到錨點視圖中,不僅捕捉了兩者之間的關(guān)聯(lián)性,還在保持緊湊性的同時避免了冗余。

最終,交叉注意力機制的運用,讓這些互補信息真正「融會貫通」,形成精煉而全面的Z態(tài)。

性能飆升,內(nèi)存狂降,讓3DGS「脫胎換骨」

ZPressor對前向式3DGS模型產(chǎn)生了變革性的影響,這一點通過對DepthSplat、MVSplat和pixelSplat等經(jīng)典模型在DL3DV-10K、RealEstate10K和ACID等大規(guī)?;鶞蕯?shù)據(jù)集進行的廣泛實驗中得到了充分驗證。

圖片

圖片

圖片

更令人振奮的是,ZPressor解決了現(xiàn)有模型在內(nèi)存方面的根本性障礙。例如,pixelSplat在輸入視圖超過8個時就因「內(nèi)存溢出」(OOM)而無法運行,而ZPressor不僅使其能夠成功運行至少36個視圖,還在性能上帶來了顯著提升。

圖片

ZPressor在效率方面的優(yōu)勢同樣令人驚嘆。它有助于在輸入視圖數(shù)量增加時,保持3D高斯數(shù)量、測試時推理延遲和峰值內(nèi)存使用量的穩(wěn)定。這與基線模型中這些指標呈線性增長的趨勢形成了鮮明對比,后者很快就會變得難以承受。

圖片

研究人員也通過實驗驗證了場景中確實存在可見的信息瓶頸,并且信息瓶頸在平衡壓縮和信息保存方面至關(guān)重要。

不止于此,應用前景更加廣闊

本研究對現(xiàn)有前饋3DGS模型的容量限制進行了深入分析,并從信息瓶頸原理的視角揭示了其根本原因。

在此基礎(chǔ)上,研究團隊提出了ZPressor——一個輕量級、架構(gòu)無關(guān)的模塊,通過高效壓縮多視圖輸入,成功幫助模型克服了固有的局限性,實現(xiàn)了對更多輸入視圖的處理能力。

實驗結(jié)果表明,ZPressor不僅在適中視圖設(shè)置下持續(xù)提升了現(xiàn)有基線模型的性能,更在密集輸入場景下顯著增強了模型的魯棒性,同時保持了極具競爭力的效率(包括內(nèi)存和速度)。

ZPressor所帶來的持續(xù)性能提升和效率改進,其意義遠不止于基準測試中的亮眼數(shù)據(jù)。這種可擴展性、魯棒性和效率的提升,直接指向了ZPressor在現(xiàn)實世界應用中的深遠影響。ZPressor的出現(xiàn),使得AR/VR能夠提供更流暢、更逼真的體驗,同時降低對硬件資源的需求,從而加速這些技術(shù)的普及和應用。

研究人員提出的基于信息瓶頸的「化繁為簡」壓縮范式,也絕不只局限于3DGS領(lǐng)域。

有理由相信,在眾多存在「冗余信息」和「信息瓶頸」挑戰(zhàn)的其他AI領(lǐng)域——無論是多模態(tài)數(shù)據(jù)處理、大規(guī)模傳感器融合,還是復雜系統(tǒng)狀態(tài)估計——ZPressor所蘊含的「信息瓶頸」智慧,都可能成為解決之道,開啟一個全新的「通用信息壓縮」時代!

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2021-03-18 15:29:10

人工智能機器學習技術(shù)

2021-12-22 10:04:11

模型人工智能3D

2025-06-06 09:07:00

2025-04-23 08:50:00

3D算法AI

2024-03-07 08:00:00

高斯?jié)姙R算法排序算法

2023-12-11 09:00:00

人工智能3D模型

2023-12-06 13:36:00

模型數(shù)據(jù)

2009-03-29 09:47:24

蘋果Iphone移動OS

2024-05-16 09:24:17

3D技術(shù)

2024-09-10 13:30:00

2024-06-24 08:15:00

2021-06-09 08:30:52

CSS33D旋轉(zhuǎn)視圖3D動畫

2022-04-14 11:02:11

3D打印眼鏡制造業(yè)

2020-06-19 10:33:16

阿里AIICML

2025-01-26 10:19:21

2025-09-30 09:03:00

2024-11-13 09:29:41

SpringCRaCCRIU

2012-02-14 11:07:53

惠普筆記本

2024-06-28 13:47:17

2021-12-27 15:25:24

神經(jīng)網(wǎng)絡AI算法
點贊
收藏

51CTO技術(shù)棧公眾號