2024年是時候拋棄驗證碼了
如果不用解決驗證碼,每年可以建造77600所房子。但年復(fù)一年,驗證碼仍然在浪費我們的時間和金錢。2024年是一個完美的年份,徹底擺脫驗證碼。
驗證碼和打印機(jī)是一回事
前幾天,我在線辦理了一些拖延已久的事務(wù)。其中之一是取消不再需要的新聞訂閱。這是那天的最后一個任務(wù),我只剩下5分鐘來完成它。我用郵件中提供的鏈接前往公司網(wǎng)站。
要取消訂閱,我需要登錄賬戶并勾選一個復(fù)選框以停用電子郵件訂閱。理論上這是一個五分鐘就能完成的完美任務(wù)。
但在登錄頁面,一個驗證碼迎面而來,用來驗證我是人類。因為我很急,所以我快速點擊所有顯示人行道的照片。不幸的是,我漏掉了一個。于是我開始快速點擊照片,以便在去牙醫(yī)的約定之前完成這最后一個任務(wù)。
令我驚訝的是,越來越多的照片出現(xiàn),盡管我不斷點擊人行道,我還是無法通過驗證。五分鐘過去了,我只好放棄。
這幾乎就像打印機(jī)一樣,驗證碼似乎能感覺到你很急迫的時候。
驗證碼的誕生和發(fā)展歷程頗具戲劇性
在計算機(jī)科學(xué)領(lǐng)域,人類基礎(chǔ)計算(Human-based Computation, HBC)與社交媒體是主要研究領(lǐng)域之一。驗證碼(CAPTCHA)就是HBC的一個實際應(yīng)用,最初的概念是興奮人心的。根據(jù)維基百科的描述,HBC是一種計算機(jī)科學(xué)技術(shù),它通過將某些步驟外包給人類來執(zhí)行機(jī)器的功能,通常以微工作(microwork)的形式。
驗證碼的誕生很快就成為HBC的實際應(yīng)用之一。從一方面來看,人們在照片上分類物品,這對于訓(xùn)練AI執(zhí)行相同任務(wù)非常有用。
另一方面,驗證碼還提供了一定級別的安全保護(hù)。因為當(dāng)時人們認(rèn)為機(jī)器人無法解決驗證碼問題。因此,在1997年,當(dāng)Eran Reshef, Gili Raanan和Eilon Solan申請了驗證碼的專利時,這一技術(shù)被認(rèn)為對所有人都有益。這一想法非常棒,原始作者發(fā)明它是一個偉大的創(chuàng)舉。
但14年后的今天,我們可以看到驗證碼的發(fā)展方向已經(jīng)發(fā)生了變化?,F(xiàn)在,驗證碼不僅僅是安全措施,它的應(yīng)用場景和技術(shù)實現(xiàn)都有了很大的進(jìn)展和變化。盡管驗證碼最初是為了提高在線服務(wù)的安全性而設(shè)計,但隨著時間的推移,其復(fù)雜性增加,常常給用戶帶來不便,這也引發(fā)了對驗證碼未來發(fā)展方向的重新思考和討論。
因為驗證碼(CAPTCHA),每年大約有77600個家庭無法在美國建造自己的家園。
這個數(shù)字來源于一個驚人的計算:2021年,人類每天在解決驗證碼上浪費了500年的時間,相當(dāng)于每年182,000年。如果把這個時間轉(zhuǎn)換成金錢,按照平均美國收入計算,大約相當(dāng)于320億美元。
這筆資金足以每年為77600個家庭在美國建造住房。這顯示了驗證碼在時間和金錢上的巨大浪費。這些數(shù)字可能因為不同的假設(shè)和平均值有所變動,但事實是,人類在驗證碼上的時間消耗是巨大的。雖然對于個人而言,解決一個驗證碼可能只需幾秒鐘到五分鐘,但累積起來的總時間是非??捎^的。
驗證碼已經(jīng)不再有效地區(qū)分人類和機(jī)器人了
在2021年,尼古拉·潘科夫(Nikolay Pankov)寫了一篇文章,概括了驗證碼的問題,他指出:“CAPTCHA不再可靠地防止入侵者,并且它們讓真實用戶感到煩惱??傊?,可能是時候放棄這種過時的機(jī)制了?!?/p>
驗證碼的本意是保護(hù)在線資源不受機(jī)器人和不良行為者的侵害,目的是限制資源的使用。如果機(jī)器人訪問一個頁面,它會占用寶貴的傳輸帶寬,而這是公司需要支付的。因此,我們并不希望機(jī)器人訪問我們的網(wǎng)站。
不僅如此,驗證碼也無法防止DDoS攻擊,這種攻擊可能導(dǎo)致人們失去大量積蓄。但我們知道,幾年來,驗證碼并沒有解決這個問題。機(jī)器人可以很容易地解決驗證碼,無論是通過AI還是人工支持。此外,有些機(jī)器人甚至將解決驗證碼的任務(wù)外包給其他人。
圖片
例如,一個機(jī)器人想在一個網(wǎng)站上發(fā)表帶有鏈接的評論,但該網(wǎng)站要求它解決驗證碼。于是,機(jī)器人就將同樣的謎題展示給由黑客操作的一個中等實用的應(yīng)用或網(wǎng)站的訪客。因此,黑客很快就利用HBC來解決HBC問題。
總的來說,驗證碼不再提供任何保護(hù)。它已經(jīng)不能長時間地區(qū)分訪客是人還是機(jī)器人。
驗證碼歧視人類
有眾多報道稱驗證碼對某些人群存在歧視。例如,盲人在解決音頻驗證碼時會遇到困難(如果這種驗證碼存在的話)。這其實并不是什么新問題,我們早在2019年前后就已經(jīng)知道了。
驗證碼還可能基于國籍、種族、地理位置等因素歧視人群,這是一個鮮為人知的事實。例如,當(dāng)你需要指出哪些圖片是出租車時,如果圖片中的出租車來自另一個國家,你可能會感到困難。
特倫斯·伊登(Terence Eden)在2017年這樣總結(jié)道:
猜猜看,谷歌?在我的國家,出租車通常是黑色的。我看過足夠多的電影,知道美國的出租車都是黃色的。但在我訪問過的每一個其他國家,出租車都是五顏六色的混合體。
盡管有其缺陷,驗證碼仍被廣泛使用,這是為什么呢?
公司使用驗證碼完全是為了自身利益
這一切都?xì)w結(jié)于金錢。驗證碼最初是作為一種基于人類的計算手段被發(fā)明出來,用以解決一個真實的問題(區(qū)分人類和機(jī)器人)。
盡管它在核心功能上失敗了,但它仍被用于基于人類的計算。
你看,AI模型并不知道人行道長什么樣。公司必須向AI提供大量的照片和描述……
通過數(shù)百萬次的重復(fù),AI最終能夠區(qū)分人行道和貓。
為了做到這一點,構(gòu)建AI模型的公司必須收集大量的分類數(shù)據(jù)來訓(xùn)練這些AI模型。
總結(jié)一下:
- 驗證碼沒有解決問題(區(qū)分人類和機(jī)器人)
- 驗證碼對人類的成本極大(每年77600戶家庭)
- 只有提供驗證碼解決方案的公司從中受益
因此,2024年一個非常有意義的問題是,驗證碼是否應(yīng)該繼續(xù)使用。