偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

小心!AI能「看懂」你的唇語,悄悄話不再安全!

人工智能
將識(shí)別出的單詞或短語組合成完整的句子,進(jìn)行一下上下文理解,確保語法和語義的正確性。

小心悄悄話被AI聽見!(噓)

最近國外一款可以讀唇語的AI軟件火了!

具體效果如下:

紅毯上布萊克·萊弗利小聲說:“好緊張”,笑著說話時(shí)肉眼很難分辨唇語,但AI可以。

乍一看只能看見一排白牙(bushi)的侃爺,唇語也能被輕松破解。

看完后網(wǎng)友們開始紛紛評(píng)論,大開腦洞:

求“聯(lián)名”型網(wǎng)友:快把它和Siri結(jié)合一下吧!這樣我就不用像小傻子一樣對(duì)著電腦大喊了!

圖片圖片

測(cè)評(píng)型網(wǎng)友:我想用它試試“座機(jī)畫質(zhì)”的視頻!

圖片圖片

擔(dān)心安全型網(wǎng)友:我有點(diǎn)害怕,我想戴口罩了。(嗚嗚)

圖片圖片

實(shí)測(cè) Readtheirlips 效果如何

量子位整理了一些視頻,為大家親測(cè)了一下Readtheirlips的使用效果。

先試了一下奧特曼在斯坦福的訪談視頻,把生成的文本和原始對(duì)話對(duì)照了一下,內(nèi)容完美契合~

而面對(duì)小表情比較多的老馬,Readtheirlips的發(fā)揮依舊穩(wěn)定。

不過以上兩個(gè)視頻都是人物全程正臉對(duì)著鏡頭的。

換成了說話時(shí)愛比劃的小扎,Readtheirlips直接顯示錯(cuò)誤。(視頻中人物不是全程正臉)

圖片圖片

而主角換成卡帕西之后,因?yàn)樗f話太快,生成的文本出現(xiàn)了識(shí)別錯(cuò)誤的情況。(左側(cè)為Readtheirlips生成,右側(cè)為文字處理軟件生成)

圖片圖片

最后,我們嘗試著上傳了一個(gè)16分鐘的視頻,Readtheirlips直接顯示錯(cuò)誤,無法識(shí)別內(nèi)容。

圖片圖片

總結(jié)一下

Readtheirlips識(shí)別視頻的時(shí)間在一分鐘左右 。

就像他們標(biāo)明的那樣如果人物的正臉不能正對(duì)鏡頭,那么模型就很難給出正確答案。

圖片圖片

而面對(duì)語速過快的視頻內(nèi)容,Readtheirlips只能識(shí)別出其中的一些內(nèi)容。

對(duì)此,團(tuán)隊(duì)成員回應(yīng)道:

是的,我們還沒有研究到這里,但是會(huì)很快解決這個(gè)問題!

圖片圖片


而關(guān)于上傳視頻的時(shí)長(zhǎng)限制,他們這么說:

現(xiàn)在只支持3分鐘以內(nèi)的視頻,但是以后我們會(huì)一點(diǎn)一點(diǎn)往上提升的!

圖片圖片

AI如何“聽”悄悄話

看完親測(cè)視頻,咱們也來嘮一下Readtheirlips的工作原理。

看看它是怎么讀取人類唇語的:

首先,研究團(tuán)隊(duì)用大量的標(biāo)注數(shù)據(jù)(已知的嘴唇運(yùn)動(dòng)動(dòng)作及其對(duì)應(yīng)的文本內(nèi)容)來對(duì)模型進(jìn)行訓(xùn)練。

在此基礎(chǔ)上,用戶要上傳一段視頻,這段視頻要包含說話者的面部特寫,尤其是嘴部動(dòng)作。

然后模型會(huì)對(duì)視頻進(jìn)行嘴部運(yùn)動(dòng)的分析:先是通過面部檢測(cè)識(shí)別嘴唇的位置,然后再提取嘴唇的幾何特征,(形狀、開合程度、運(yùn)動(dòng)軌跡等),最后分析嘴唇在說話過程中的動(dòng)態(tài)變化。(速度、方向和形狀變化)

之后,模型會(huì)將提取的嘴唇特征與訓(xùn)練數(shù)據(jù)中的特征進(jìn)行匹配,來識(shí)別出視頻中人物所說的內(nèi)容。

將識(shí)別出的單詞或短語組合成完整的句子,進(jìn)行一下上下文理解,確保語法和語義的正確性。

最終將識(shí)別出的內(nèi)容輸出為文本形式

圖片圖片

開發(fā)團(tuán)隊(duì)

Readtheirlips的開發(fā)團(tuán)隊(duì)Symphonic Labs是一家初創(chuàng)公司。

圖片圖片

領(lǐng)英上顯示它今年4月份才剛剛成立,截至目前,公司人數(shù)不到10人。

圖片圖片

他們之前還研發(fā)過一款通過閱讀唇語即可完成實(shí)時(shí)文本轉(zhuǎn)錄的軟件Symphonic

兩款軟件的試玩鏈接都已附上,感興趣的朋友們可以去嘗試一下~

Readtheirlips 試玩鏈接:
https://www.readtheirlips.com/Symphonic 試玩鏈接:
https://symphoniclabs.com/參考鏈接:
https://x.com/crsamra/status/1833494380357013879

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2022-01-10 23:57:36

人工智能語音識(shí)別技術(shù)

2021-03-05 15:09:59

人工智能人臉識(shí)別安全

2016-12-02 20:10:22

人工智能唇語序列

2021-05-21 06:28:33

AI人工智能

2021-05-21 10:49:52

人工智能數(shù)據(jù)技術(shù)

2022-04-02 16:23:33

元宇宙區(qū)塊鏈

2018-11-30 08:44:23

WIFI萬能鑰匙密碼

2021-10-12 15:58:53

手機(jī)數(shù)據(jù)隱私

2014-12-03 13:18:13

2018-08-21 15:34:39

筆記本電池隱患

2023-06-27 07:09:39

2025-05-21 14:03:46

2018-04-24 10:29:40

2009-04-11 21:41:00

2012-01-09 11:12:17

2015-07-20 13:39:17

Windows 10數(shù)據(jù)

2020-06-16 09:55:52

數(shù)據(jù)庫MySQL技術(shù)

2021-08-12 06:55:19

數(shù)據(jù)AI大數(shù)據(jù)

2013-03-21 09:24:01

云存儲(chǔ)智能手機(jī)

2017-07-21 16:26:43

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)