偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉

人工智能
人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉摘要:從單視圖輸入生成多視圖圖像是一個(gè)基本而又具有挑戰(zhàn)性的問(wèn)題。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉摘要:從單視圖輸入生成多視圖圖像是一個(gè)基本而又具有挑戰(zhàn)性的問(wèn)題。它在視覺(jué),圖形和機(jī)器人方面有廣泛的應(yīng)用。我們的研究表明,廣泛使用的生成對(duì)抗網(wǎng)絡(luò)(GAN)可能由于單路徑框架而學(xué)習(xí)“不完整”表示:編碼器 - 解碼器網(wǎng)絡(luò),后面是鑒別器網(wǎng)絡(luò)。我們提出CR-GAN來(lái)解決這個(gè)問(wèn)題。除了單一的重構(gòu)路徑之外,我們還引入了一代代,以保持學(xué)習(xí)嵌入空間的完整性。這兩種學(xué)習(xí)途徑以參數(shù)共享的方式進(jìn)行協(xié)作和競(jìng)爭(zhēng),從而顯著提高了對(duì)“未見(jiàn)”數(shù)據(jù)集的泛化能力。更重要的是,雙路徑框架可以將標(biāo)記和未標(biāo)記數(shù)據(jù)結(jié)合起來(lái)進(jìn)行自我監(jiān)督學(xué)習(xí),進(jìn)一步豐富了實(shí)際世代的嵌入空間。實(shí)驗(yàn)結(jié)果證明CR-GAN明顯優(yōu)于最先進(jìn)的方法,特別是在野外條件下從“看不見(jiàn)的”輸入產(chǎn)生時(shí)。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉

 

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉簡(jiǎn)介:從單視圖輸入生成多視圖圖像是視覺(jué),圖形和機(jī)器人中廣泛應(yīng)用的一個(gè)有趣問(wèn)題。然而,這是一個(gè)具有挑戰(zhàn)性的問(wèn)題,因?yàn)?)計(jì)算機(jī)需要“想象”在應(yīng)用3D旋轉(zhuǎn)后給定對(duì)象的樣子; 2)多視圖生成應(yīng)該保留相同的“身份”。一般來(lái)說(shuō),此問(wèn)題的先前解決方案包括模型驅(qū)動(dòng)的綜合[Blanz和Vetter,1999],數(shù)據(jù)驅(qū)動(dòng)的生成[Zhu et al。,2014; Yan et al。,2016],以及兩者的結(jié)合[Zhu et al。,2016; Rezende等,2016]。最近,生成對(duì)抗網(wǎng)絡(luò)(GANs)[Goodfellow et al。,2014]在多視圖生成中顯示出令人印象深刻的結(jié)果[Tran et al。,2017;趙等人,2017]。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉

 

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉貢獻(xiàn):這些基于GAN的方法通常具有單路徑設(shè)計(jì):編碼器 - 解碼器網(wǎng)絡(luò)之后是鑒別器網(wǎng)絡(luò)。編碼器(E)將輸入圖像映射到潛在空間(Z),其中嵌入首先被操縱然后被饋送到解碼器(tt)以生成新穎的視圖。然而,我們的實(shí)驗(yàn)表明,這種單通道設(shè)計(jì)可能存在嚴(yán)重的問(wèn)題:它們只能學(xué)習(xí)“不完整”的表示,對(duì)“看不見(jiàn)”或無(wú)約束的數(shù)據(jù)產(chǎn)生有限的泛化能力。以圖1為例。在訓(xùn)練期間,E的輸出僅構(gòu)成Z的子空間,因?yàn)槲覀兺ǔ>哂杏邢迶?shù)量的訓(xùn)練樣本。這將使tt僅“看到”Z的一部分。在測(cè)試期間,E極有可能在子空間之外映射“看不見(jiàn)的”輸入。結(jié)果,由于意外的嵌入,tt可能產(chǎn)生差的結(jié)果。

為了解決這個(gè)問(wèn)題,我們建議CR-GAN學(xué)習(xí)多視圖生成的完整表示。主要思想是,除了重建路徑之外,我們引入另一代路徑來(lái)從Z中隨機(jī)采樣的嵌入創(chuàng)建視圖特定圖像。請(qǐng)參考圖2進(jìn)行說(shuō)明。這兩條路徑共享相同的tt。換句話說(shuō),在生成路徑中學(xué)習(xí)的tt將指導(dǎo)重建路徑中的E和D的學(xué)習(xí),反之亦然。 E被迫成為tt的倒數(shù),產(chǎn)生完整Z空間的完整表示。更重要的是,雙路徑學(xué)習(xí)可以很容易地利用標(biāo)記和未標(biāo)記的數(shù)據(jù)進(jìn)行自我監(jiān)督學(xué)習(xí),這可以在很大程度上豐富自然世代的Z空間??傊?,我們有以下貢獻(xiàn):

據(jù)我們所知,我們是第一個(gè)研究GAN模型的“完整表示”的人;我們建議使用雙路徑學(xué)習(xí)方案學(xué)習(xí)“完整”表示的CR-GAN;CR-GAN可以利用未標(biāo)記的數(shù)據(jù)進(jìn)行自我監(jiān)督學(xué)習(xí),從而提高生成質(zhì)量;CR-GAN可以在野外條件下從甚至“看不見(jiàn)的”數(shù)據(jù)集生成高質(zhì)量的多視圖圖像。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉

 

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉提出的方法:不完整表示的玩具示例,單路徑網(wǎng)絡(luò),即跟隨鑒別器網(wǎng)絡(luò)的編碼器 - 解碼器網(wǎng)絡(luò),可能具有學(xué)習(xí)“不完整”表示的問(wèn)題。如圖2左側(cè)所示,編碼器E和解碼器tt只能“觸摸”Z的子空間,因?yàn)槲覀兺ǔ>哂杏邢迶?shù)量的訓(xùn)練數(shù)據(jù)。當(dāng)使用“未見(jiàn)”數(shù)據(jù)作為輸入時(shí),這將導(dǎo)致測(cè)試中的嚴(yán)重問(wèn)題。 E很可能將新的輸入映射到子空間之外,這不可避免地導(dǎo)致窮人的世代,因?yàn)閠t從未“看到”嵌入。玩具示例用于解釋這一點(diǎn)。我們使用Multi-PIE [Gross et al。,2010]來(lái)訓(xùn)練單通路網(wǎng)絡(luò)。如圖1的頂部所示,只要輸入圖像被映射到學(xué)習(xí)的子空間,網(wǎng)絡(luò)就可以在Multi-PIE(第一行)上生成逼真的結(jié)果。然而,當(dāng)測(cè)試來(lái)自IJB-A [Klare等人,2015]的“看不見(jiàn)的”圖像時(shí),網(wǎng)絡(luò)可能產(chǎn)生不令人滿意的結(jié)果(第二行)。在這種情況下,新圖像被映射到學(xué)習(xí)的子空間之外。

這個(gè)事實(shí)激勵(lì)我們訓(xùn)練可以“覆蓋”整個(gè)Z空間的E和tt,這樣我們就可以學(xué)習(xí)完整的表示。我們通過(guò)引入單獨(dú)的生成路徑來(lái)實(shí)現(xiàn)這一目標(biāo),其中生成器專注于將整個(gè)Z空間映射到高質(zhì)量圖像。圖2說(shuō)明了單通路和雙通路網(wǎng)絡(luò)之間的比較。請(qǐng)參閱圖3(d),了解我們的方法。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉實(shí)驗(yàn):CR-GAN的目標(biāo)是在床上空間學(xué)習(xí)完整的表現(xiàn)形式。我們通過(guò)將雙路架構(gòu)與自我監(jiān)督學(xué)習(xí)相結(jié)合來(lái)實(shí)現(xiàn)這一目標(biāo)。我們進(jìn)行實(shí)驗(yàn)以分別評(píng)估這兩個(gè)貢獻(xiàn)。然后我們將我們的CR-GAN與DR-GAN進(jìn)行比較[Tran et al。,2017],顯示了嵌入空間中的視覺(jué)結(jié)果和t-SNE可視化。我們還將CR-GAN和BiGAN與圖像重建任務(wù)進(jìn)行比較。

實(shí)驗(yàn)設(shè)置,數(shù)據(jù)集。我們?cè)谟泻蜎](méi)有視圖標(biāo)簽的數(shù)據(jù)集上評(píng)估CR-GAN。 Multi-PIE [Gross et al。,2010]是在受限環(huán)境下收集的標(biāo)記數(shù)據(jù)集。我們使用了第一次會(huì)話的250個(gè)主題,其中包括60個(gè)內(nèi)的9個(gè)姿勢(shì),20個(gè)照明和兩個(gè)表達(dá)。前200個(gè)科目用于培訓(xùn),其余50個(gè)用于測(cè)試。 300wLP [Zhu et al。,2016]通過(guò)面部剖析方法[Zhu et al。,2016]從300W增加[Sagonas et al。,2013],其中也包含視圖標(biāo)簽。我們采用偏航角為60°到+ 60°的圖像,并將它們分成9個(gè)間隔。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉

 

為了評(píng)估未標(biāo)記的數(shù)據(jù)集,我們使用CelebA [Liu等人,2015年]和IJB-A [Klare等人,2015]。 CelebA包含大量具有不平衡視點(diǎn)分布的名人圖像。因此,我們收集了72,000張圖像的子集,其范圍從60°到+ 60°。請(qǐng)注意,CelebA中圖像的視圖標(biāo)簽僅用于收集子集,而在培訓(xùn)過(guò)程中不使用視圖或標(biāo)識(shí)標(biāo)簽。我們還使用包含5,396個(gè)圖像的IJB-A進(jìn)行評(píng)估。該數(shù)據(jù)集具有挑戰(zhàn)性,因?yàn)榇嬖趶V泛的身份和姿勢(shì)變化。

人工智能根據(jù)正臉生成多個(gè)側(cè)臉,利用生成對(duì)抗網(wǎng)絡(luò)生成多角度側(cè)臉結(jié)論:在本文中,我們研究了GAN模型的學(xué)習(xí)“完整表示”。 我們建議CR-GAN使用雙路徑框架來(lái)實(shí)現(xiàn)目標(biāo)。 我們的方法可以利用標(biāo)記和未標(biāo)記的數(shù)據(jù)進(jìn)行自我監(jiān)督學(xué)習(xí),從而在野外條件下從甚至“看不見(jiàn)的”數(shù)據(jù)中產(chǎn)生高質(zhì)量的多視圖圖像。 

責(zé)任編輯:龐桂玉 來(lái)源: 今日頭條
相關(guān)推薦

2022-02-21 18:06:02

人臉識(shí)別神經(jīng)網(wǎng)絡(luò)技術(shù)

2022-07-05 13:55:50

人工智能工具刷臉

2018-07-11 10:46:05

人工智能計(jì)算機(jī)視覺(jué)面部屬性

2023-07-04 09:49:50

人工智能GAN

2024-04-01 08:00:00

2022-09-20 08:00:00

暗數(shù)據(jù)機(jī)器學(xué)習(xí)數(shù)據(jù)

2025-06-27 03:00:00

2022-08-10 14:52:02

DeepFakeAI

2020-05-28 10:45:36

機(jī)器學(xué)習(xí)人工智能 PyTorch

2023-10-31 10:33:35

對(duì)抗網(wǎng)絡(luò)人工智能

2023-08-02 18:26:31

2017-03-24 08:35:25

人工智能性格看臉

2018-08-16 21:23:20

2018-01-26 10:18:39

人工智能機(jī)器人智能點(diǎn)餐

2023-12-11 16:34:35

人工智能GenAI精確編碼

2023-10-08 15:59:43

人工智能AI

2023-05-05 14:02:59

人工智能聊天機(jī)器人

2021-03-12 10:40:46

CycleGAN網(wǎng)絡(luò)圖像深度學(xué)習(xí)

2019-05-06 15:10:08

人工智能AI掃碼刷臉

2023-08-14 10:38:39

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)