偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

人臉識別新工具:數(shù)據(jù)少也能認(rèn)識“國際臉”

新聞 人臉識別
日前,亞馬遜的一款人臉識別工具錯(cuò)誤地將28位美國國會議員與罪犯相匹配,這一新聞引發(fā)關(guān)注。

 日前,亞馬遜的一款人臉識別工具錯(cuò)誤地將28位美國國會議員與罪犯相匹配,這一新聞引發(fā)關(guān)注。人臉識別工具為何出現(xiàn)這樣的錯(cuò)誤?其實(shí),機(jī)器與人類一樣,見到陌生的外國人也會有“臉盲”,只能識別“當(dāng)?shù)厝?rdquo;,對于來自其他國家/地區(qū)的“外地人”識別精度較低,這一問題如何解決呢?

引用公開的個(gè)人信息進(jìn)行研究與驗(yàn)證 鄧偉洪團(tuán)隊(duì)供圖

[[280604]]

研究團(tuán)隊(duì)在討論 鄧偉洪團(tuán)隊(duì)供圖

其關(guān)鍵在于讓人臉識別工具盡量多地認(rèn)識全球各地居民的臉,而這一過程卻并不容易實(shí)現(xiàn)。北京郵電大學(xué)教授鄧偉洪告訴《中國科學(xué)報(bào)》,人臉識別工具研發(fā)過程中,使用的訓(xùn)練數(shù)據(jù)越多、越齊全,精度就會越高。但由于不同國家/地區(qū)對公民個(gè)人信息的保護(hù),這些信息收集越來越難。沒有訓(xùn)練數(shù)據(jù)就意味著人臉識別工具只認(rèn)識“熟人”,而對于訓(xùn)練數(shù)據(jù)中缺失的人群的識別精度較低。

近日,鄧偉洪研究團(tuán)隊(duì)的一項(xiàng)研究獲得新進(jìn)展,該團(tuán)隊(duì)揭示了當(dāng)前人臉識別算法中普遍存在跨國家/地區(qū)識別偏差問題,構(gòu)建了評價(jià)偏差程度的人臉數(shù)據(jù)集RFW,提出了減小識別偏差的信息最大化自適應(yīng)神經(jīng)網(wǎng)絡(luò),以改進(jìn)對目標(biāo)域的識別能力。10月27日,相關(guān)研究結(jié)果在由IEEE主辦的國際計(jì)算機(jī)視覺大會(ICCV)上發(fā)表。

人臉識別工具的地域之困

卷積神經(jīng)網(wǎng)絡(luò)是人工智能的代表算法之一,具有很強(qiáng)的圖像表征學(xué)習(xí)能力。2012年,深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域興起,其出現(xiàn)極大地推進(jìn)了人臉識別的發(fā)展,并成為人臉識別領(lǐng)域的主流技術(shù)。

目前,全球的人臉識別工具大多根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)的技術(shù)開發(fā),但該技術(shù)的人臉數(shù)據(jù)的源域基于西方人的面部特征,面對不同的目標(biāo)域,即不同國家/地區(qū)居民的面部信息識別需求往往“力不從心”。

鄧偉洪表示,由于缺乏基準(zhǔn)測試庫,這一領(lǐng)域的研究長期進(jìn)展緩慢。一款人臉識別工具即使在當(dāng)?shù)氐淖R別率很高,也難以精準(zhǔn)到全球人類。這就造成了人臉識別工具較強(qiáng)的地域性。

為了推動該研究,鄧偉洪研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的測試庫——RFW,以科學(xué)客觀地評測人臉識別中的偏差。

在RFW數(shù)據(jù)庫的基礎(chǔ)上,研究人員驗(yàn)證了微軟、亞馬遜、百度、曠視的商業(yè)API和學(xué)術(shù)界最先進(jìn)的4個(gè)算法。

“這種識別的偏差確實(shí)存在,一些地區(qū)的錯(cuò)誤率甚至高于西方國家的兩倍。”鄧偉洪說。

該論文的評審專家表示,RFW與現(xiàn)有數(shù)據(jù)庫相比,該數(shù)據(jù)庫中的數(shù)據(jù)分布更均勻,這將成為跨國家/地區(qū)識別的一個(gè)較好的基準(zhǔn)評價(jià)數(shù)據(jù)。

為了探究這種偏差是否是由訓(xùn)練數(shù)據(jù)的分布不平衡引起的,研究人員收集了一個(gè)涵蓋全球各地區(qū)人類信息的訓(xùn)練數(shù)據(jù)庫,最終發(fā)現(xiàn)偏差的發(fā)生受到數(shù)據(jù)和算法兩方面影響。

該論文第一作者、北京郵電大學(xué)博士生王玫解釋,數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)平衡、算法相同,但某些國家/地區(qū)人類的面部信息識別難度較大,導(dǎo)致識別準(zhǔn)確率較低。

如何在數(shù)據(jù)少、面部識別難的情況下提高識別率?研究人員并沒有放棄,他們決定進(jìn)一步的研究算法,借助算法讓人臉識別工具舉一反三。

學(xué)習(xí)靠“自覺”

傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)庫搭建過程中需要人工標(biāo)注個(gè)人信息,這一操作面臨隱私泄露的風(fēng)險(xiǎn)。用于物體識別的無監(jiān)督域自適應(yīng)方法給了研究人員啟發(fā)。

該方法采用無監(jiān)督學(xué)習(xí)的方式,將源域和目標(biāo)域映射到域不變的特征空間,并提高目標(biāo)域性能。研究人員想通過算法解決這一問題,讓機(jī)器自行學(xué)習(xí)。

“這就相當(dāng)于研究人員把試卷出好,機(jī)器作答。”鄧偉洪說。

實(shí)現(xiàn)并不簡單,在具體操作層面,物體識別不同于人臉識別。物體識別的源域和目標(biāo)域可以重疊,且信息獲取相對便宜,充足的源域數(shù)據(jù)使識別工具能夠區(qū)分和判別目標(biāo)域信息。

因此,研究人員提出了一種信息最大化自適應(yīng)網(wǎng)絡(luò)。王玫介紹,該方法一方面減小源域和目標(biāo)域的全局分布差異,另一方面能夠?qū)W習(xí)有區(qū)分性的目標(biāo)域特征。

“也就是說,卷積神經(jīng)網(wǎng)絡(luò)可以在無監(jiān)督的情況下,‘自覺’地學(xué)習(xí)目標(biāo)域人臉的特征。”王玫說。

為了解決兩個(gè)域之間類別不重疊的問題,信息最大化自適應(yīng)網(wǎng)絡(luò)采用譜聚類算法生成“偽標(biāo)簽”,并在監(jiān)督下利用偽標(biāo)簽對網(wǎng)絡(luò)進(jìn)行預(yù)適應(yīng),初步提高目標(biāo)域的性能。

這種聚類方案與其他不適用于人臉識別的域自適應(yīng)方法有著本質(zhì)區(qū)別。王玫解釋,新方法可以在全新的目標(biāo)域上自主學(xué)習(xí),不需要人工干預(yù),避免了隱私泄露的風(fēng)險(xiǎn)。

為了進(jìn)一步提高網(wǎng)絡(luò)輸出的鑒別性,研究人員還提出了一種新的基于互信息的自適應(yīng)方法,它以無監(jiān)督的方式在目標(biāo)域的特征之間產(chǎn)生更大的間距。

與一般的有監(jiān)督的損失和有監(jiān)督的互信息不同,該方法具有無監(jiān)督的特性,其可以利用所有無標(biāo)簽的目標(biāo)域數(shù)據(jù),無論這些數(shù)據(jù)是否被成功地分配了偽標(biāo)簽。

基于公開數(shù)據(jù)進(jìn)行驗(yàn)證

這套方案是否能在非監(jiān)督的情況下,提高人臉識別工具對不同國家/地區(qū)居民臉部信息的識別率呢?

研究人員采用全球各地名人的公開數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,信息最大化自適應(yīng)網(wǎng)絡(luò)可以成功地將識別能力從源域應(yīng)用到其他國家/地區(qū)的目標(biāo)域人群中,且識別性能優(yōu)于其他域自適應(yīng)方法。消融實(shí)驗(yàn)研究發(fā)現(xiàn),互信息損失對減少識別偏差有重要作用。

王玫補(bǔ)充,信息最大化自適應(yīng)網(wǎng)絡(luò)在跨姿態(tài)、跨場景的應(yīng)用上也有很好的泛化性能。

鑒于較好的實(shí)驗(yàn)結(jié)果,研究團(tuán)隊(duì)已經(jīng)對外發(fā)布RFW數(shù)據(jù)集,以推進(jìn)研究進(jìn)一步深入。

目前,已有哈佛大學(xué)、帝國理工學(xué)院、清華大學(xué)、思科、華為、NEC、IBM等20多個(gè)國家的科研院所、企業(yè)的科研團(tuán)隊(duì)申請使用RFW進(jìn)行多人種人臉識別研究。

值得一提的是,該方法在進(jìn)行自適應(yīng)學(xué)習(xí)的同時(shí),仍然需要利用源域地區(qū)采集的標(biāo)注數(shù)據(jù)對模型進(jìn)行訓(xùn)練。這就意味源域數(shù)據(jù)具有隱私泄露風(fēng)險(xiǎn)。如何在源域數(shù)據(jù)不外傳的情況下進(jìn)行目標(biāo)域的自適應(yīng)學(xué)習(xí),將是非常值得研究的問題。

鄧偉洪表示,下一步希望在完全不采集目標(biāo)域數(shù)據(jù)的情況下,提出具有更強(qiáng)泛化能力的新算法,直接提高人臉識別工具在未知目標(biāo)域的準(zhǔn)確率。

相關(guān)論文信息:http://whdeng.cn/RFW/index.html

 

 

責(zé)任編輯:張燕妮 來源: 中國科學(xué)報(bào)
相關(guān)推薦

2021-11-10 15:13:45

人臉識別人工智能數(shù)據(jù)

2020-11-25 08:24:13

人臉識別

2021-03-17 22:36:51

人臉識別隱私安全

2021-11-03 10:49:33

人臉識別人工智能技術(shù)

2021-11-03 13:32:28

MetaFacebook人臉識別

2017-09-15 13:48:58

支付寶

2021-03-19 14:44:08

人臉識別安全數(shù)據(jù)

2017-09-19 09:28:55

2023-05-13 09:09:54

AR谷歌

2010-06-29 10:59:44

Windows 8人臉識別

2020-11-05 18:59:23

指紋識別人臉識別生物識別

2017-09-28 15:42:03

2017-09-17 09:11:35

支付寶螞蟻金服人臉識別

2021-08-10 15:52:56

人臉識別AI人工智能

2021-05-10 11:08:00

人工智能人臉識別

2021-04-18 14:18:17

人臉識別人工智能AI

2020-12-03 18:41:53

人臉識別監(jiān)視監(jiān)管

2018-04-04 14:17:11

有臉識別指紋識別信息泄露

2020-12-28 12:39:53

面部識別人工

2023-05-15 20:19:26

谷歌AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號