驗(yàn)證碼的末日:AI識(shí)別準(zhǔn)確率首次達(dá)到100%
很多網(wǎng)站服務(wù)會(huì)要求用戶從一堆圖片中選擇特定物體,以此來(lái)驗(yàn)證用戶是否真人。這種圖片識(shí)別驗(yàn)證碼(CAPTCHA)最常見(jiàn)的形式是在復(fù)雜的街景照片中識(shí)別自行車、斑馬線、交通燈等日常物體。然而,最近有研究指出,一些本地運(yùn)行的AI機(jī)器人使用特別訓(xùn)練的圖像識(shí)別模型,已經(jīng)做到100%的成功率,達(dá)到甚至超過(guò)了人類水平!

驗(yàn)證碼殺手:YOLO模型
ETH蘇黎世的博士生安德烈亞斯·普萊斯納(Andreas Plesner)及其同事的最新研究聚焦于谷歌的reCAPTCHA v2,這一系統(tǒng)要求用戶在圖片網(wǎng)格中識(shí)別出包含諸如自行車、斑馬線或交通燈等物體的街景圖像。盡管谷歌幾年前已經(jīng)開(kāi)始逐步淘汰該系統(tǒng),轉(zhuǎn)而采用“隱形”的reCAPTCHA v3以分析用戶行為,但reCAPTCHA v2仍被全球數(shù)百萬(wàn)網(wǎng)站廣泛使用,尤其在v3系統(tǒng)對(duì)用戶的“人類”可信度打分過(guò)低時(shí),常作為備用驗(yàn)證手段。
研究團(tuán)隊(duì)為了破解reCAPTCHA v2,使用了開(kāi)源的YOLO(You Only Look Once)目標(biāo)識(shí)別模型,這一模型因其實(shí)時(shí)檢測(cè)物體的能力而備受青睞,甚至早在電子游戲作弊機(jī)器人中就得到了應(yīng)用。研究者將這一模型進(jìn)行了微調(diào),使用了1.4萬(wàn)張標(biāo)記過(guò)的交通圖像進(jìn)行訓(xùn)練,最后得到了一個(gè)能夠?qū)︱?yàn)證碼網(wǎng)格圖像進(jìn)行精準(zhǔn)識(shí)別的系統(tǒng)。
為了規(guī)避谷歌對(duì)機(jī)器人行為的檢測(cè),研究團(tuán)隊(duì)采取了多種措施,比如使用VPN來(lái)避免因IP地址重復(fù)嘗試而被發(fā)現(xiàn),同時(shí)還設(shè)計(jì)了一個(gè)特殊的鼠標(biāo)移動(dòng)模型,以模擬人類用戶的活動(dòng)。另外,自動(dòng)化代理也利用了真實(shí)瀏覽器和瀏覽歷史中的cookie信息,使其表現(xiàn)得更加“人性化”。
驗(yàn)證碼全面淪陷
研究顯示,根據(jù)不同的物體類別,YOLO模型對(duì)驗(yàn)證碼的識(shí)別準(zhǔn)確率從69%(摩托車)到100%(消防栓)不等。綜合這些措施,機(jī)器人成功地一次次突破了驗(yàn)證碼防線,有時(shí)候甚至比人類挑戰(zhàn)的次數(shù)更少。盡管這種提升對(duì)比人類并無(wú)顯著統(tǒng)計(jì)學(xué)意義,但也足以證明這項(xiàng)技術(shù)的有效性。
過(guò)去,學(xué)術(shù)界曾多次嘗試?yán)脠D像識(shí)別模型來(lái)破解reCAPTCHA,但成功率大多在68%到71%之間浮動(dòng)。而此次AI識(shí)別驗(yàn)證碼的成功率首次達(dá)到100%,標(biāo)志著我們正式進(jìn)入了“后驗(yàn)證碼時(shí)代”。
然而,這并不是驗(yàn)證碼的首次“淪陷”。早在2008年,研究人員就展示了如何訓(xùn)練機(jī)器人突破專為視覺(jué)障礙用戶設(shè)計(jì)的音頻驗(yàn)證碼;到了2017年,神經(jīng)網(wǎng)絡(luò)也已經(jīng)能夠破解那些要求用戶輸入亂碼字體中字母的文本驗(yàn)證碼。
如今,隨著本地運(yùn)行的AI也能輕松破解基于圖像的驗(yàn)證碼,人類身份識(shí)別的技術(shù)將繼續(xù)轉(zhuǎn)向更微妙的設(shè)備指紋識(shí)別方法。谷歌云的一位發(fā)言人向《新科學(xué)家》表示:“我們非常專注于幫助客戶保護(hù)用戶,同時(shí)盡量不顯示視覺(jué)挑戰(zhàn),這也是為什么我們?cè)?018年推出了reCAPTCHA v3。今天,reCAPTCHA在全球700萬(wàn)個(gè)網(wǎng)站上的大部分保護(hù)機(jī)制已經(jīng)完全‘隱形化’。我們正在持續(xù)提升reCAPTCHA的能力。”
人與機(jī)器的識(shí)別邊界正在模糊
隨著人工智能系統(tǒng)在越來(lái)越多的任務(wù)上逐步逼近甚至超越人類能力,確保網(wǎng)絡(luò)另一端的用戶是一個(gè)真人變得越來(lái)越難。
正如論文作者所寫:“從某種意義上說(shuō),一個(gè)好的驗(yàn)證碼可以在最智能的機(jī)器與最不智能的人類之間劃分精確界限?!倍S著機(jī)器學(xué)習(xí)模型逐漸接近人類能力,找到一個(gè)“好”的驗(yàn)證碼(技術(shù))變得越來(lái)越困難。















 
 
 











 
 
 
 