外媒揭秘Facebook內(nèi)容清理工作:累死AI都完不成的任務(wù)
AI 只能學(xué)習(xí)見過的東西。每次Schroepfer和他的超過150名工程專家剛做出標(biāo)記和清理有害材料的AI解決方案時(shí),AI系統(tǒng)沒見過的新的、可疑帖子(因此也就抓不到)又冒頭了。Facebook的項(xiàng)目負(fù)責(zé)人Schroepfer說:“我真希望自己沒看過那些東西。”
編者按:最近一系列的丑聞讓社交網(wǎng)絡(luò)巨頭Facebook坐在了火山口上。“平臺(tái)是中立的,不能干涉用戶生成內(nèi)容”再也不能成為借口。但是20億用戶每天產(chǎn)生的內(nèi)容量要想清理簡(jiǎn)直是天方夜譚。哪怕使用了AI加以輔佐,也總會(huì)有AI意想不到的情況出現(xiàn)。這就好比一場(chǎng)貓捉老鼠的游戲,又像是西西弗斯推巨石上山,每每快到山頂時(shí),石頭就會(huì)從其手中滑脫,又得重新推回去,干著無止境的勞動(dòng)。CTO 原本要幫助Facebook面向未來探索AI應(yīng)用的新領(lǐng)域,現(xiàn)在不得不背負(fù)起這一沉重的負(fù)擔(dān)。Cade Metz與Mike Isaac在外媒的一篇文章報(bào)道了Facebook內(nèi)容清理方面的努力。
有那么半小時(shí),我們是坐在Facebook總部的一個(gè)會(huì)議室里的。周圍都是白板,上面放滿了藍(lán)色和紅色記號(hào)筆,我們?cè)谟懻搹脑撋缃痪W(wǎng)絡(luò)剔除有害內(nèi)容的技術(shù)難度。然后我們調(diào)出了一段視頻證明這種挑戰(zhàn)是難以對(duì)付的:新西蘭克賴斯特徹奇的槍擊案。
今年3月,一名槍手在2個(gè)清真寺射殺了51人,而且還在Facebook上進(jìn)行視頻直播。公司用了大概1個(gè)小時(shí)才把視頻從網(wǎng)站清除。不過此時(shí)血腥鏡頭已經(jīng)在社交媒體上傳播開了。
Schroepfer沉默了。他的眼里好像有東西在閃。
一分鐘后,他試圖保持鎮(zhèn)靜的語氣:“我們現(xiàn)在正致力于此事。這不會(huì)是一夜之功。但是我不希望6個(gè)月后再來一次這場(chǎng)對(duì)話。我們可以做得比這好得多。”
問題是此話當(dāng)真還是Facebook只是在開玩笑。
過去3年,這個(gè)社交網(wǎng)絡(luò)就一直因?yàn)橛腥嗽谄渚W(wǎng)站上發(fā)布虛假、誤導(dǎo)和不合適的內(nèi)容的擴(kuò)散而受到審查。CEO扎克伯格已經(jīng)調(diào)用了一項(xiàng)技術(shù),據(jù)他說可以幫助消除有問題的帖子:人工智能。
去年,在國會(huì)面前,扎克伯格作證說Facebook正在開發(fā)基于機(jī)器的系統(tǒng)來“識(shí)別特定類別的不良活動(dòng)”,并且宣布“在5到10年內(nèi),我們將擁有AI工具”來偵測(cè)和移除仇恨言論。此后他就不斷在媒體、與華爾街的電話會(huì)議及Facebook自己的活動(dòng)上重復(fù)這些話。
Schroepfer——或者內(nèi)部被叫做Schrep——就是Facebook的項(xiàng)目負(fù)責(zé)人。他要帶領(lǐng)團(tuán)隊(duì)開發(fā)對(duì)數(shù)百萬此類帖子進(jìn)行分類和刪除的自動(dòng)化工具。但是這項(xiàng)任務(wù)就像西西弗斯推石頭上山一樣——是徒勞的,他在最近接受的3次采訪中均承認(rèn)了這一點(diǎn)。
這是因?yàn)槊看蜸chroepfer和他的超過150名工程專家剛做出標(biāo)記和清理有害材料的AI解決方案時(shí),AI系統(tǒng)沒見過的新的、可疑帖子(因此也就抓不到)又冒頭了。再加上“不良活動(dòng)”往往是旁觀者的看法,而且不要說機(jī)器了,就連人類對(duì)它是什么也意見不一致,這使得這項(xiàng)任務(wù)更加困難。
在一次采訪中,Schroepfer被迫承認(rèn)光靠AI沒法治好Facebook的病。他說:“我的確認(rèn)為現(xiàn)在進(jìn)入了收官階段。”但“我并不認(rèn)為‘一切均已解決’,可以收拾東西回家了。”
但是壓力還在。過去的一周,在克賴斯特徹奇的視頻飽受批評(píng)之后,F(xiàn)acebook修改了政策,對(duì)流媒體服務(wù)的使用進(jìn)行了限制。周三在巴黎出席有法國總統(tǒng)馬克龍和新西蘭總理杰辛達(dá)·阿德恩參與的峰會(huì)時(shí),該公司簽署了一份保證書,承諾對(duì)其用于識(shí)別暴力內(nèi)容的工具進(jìn)行重新檢查。
44歲的Schroepfer現(xiàn)在處在一個(gè)自己永遠(yuǎn)都不想坐的位置。多年來,他的工作一直都是幫助Facebook建設(shè)和一流的AI實(shí)驗(yàn)室。在這里,最聰明的頭腦將解決利用機(jī)器從照片中選出人臉等技術(shù)挑戰(zhàn)。他和扎克伯格希望做出一個(gè)可以跟Google,這個(gè)被廣泛視為AI研究人員實(shí)力最雄厚的公司匹敵的AI部門。所以他從紐約大學(xué)、倫敦大學(xué)以及巴黎第六大學(xué)招聘博士。
但慢慢地,他已經(jīng)變成了威脅和有害內(nèi)容消除者的角色。現(xiàn)在,他和他招進(jìn)來的人很多時(shí)間都花在利用AI識(shí)別和刪除死亡威脅、自殺視頻、錯(cuò)誤信息以及徹底謊言上面了。
John Lilly是Moziila前CEO,現(xiàn)在是Greylock Partners的風(fēng)投家,1990年代中期時(shí)曾與Schroepfer一起讀計(jì)算機(jī)科學(xué)。她說:“我們誰都沒見過這樣的事情。該怎么解決這些問題沒人任何人可以求助。”
Facebook允許我們跟Schroepfer交流,因?yàn)樗胝故疽幌翧I是怎么捕捉那些討厭的內(nèi)容的,大概也是因?yàn)樗鼘?duì)人性化自己的主管感興趣。據(jù)很多認(rèn)識(shí)他的人說,這位CTO經(jīng)常展現(xiàn)他的感受。
Jocelyn Goldfein就跟Schroepfe在Facebook共事過。前者是Zetta Venture Partners的風(fēng)投家,他作證說:“我見過Schrep在工作中哭過,我不認(rèn)為說這樣的話是不合時(shí)宜。”
但是沒幾個(gè)人能預(yù)測(cè)到Schroepfer對(duì)我們的問題會(huì)作何反應(yīng)。在其中2次采訪中,對(duì)于AI可能會(huì)是解決方案他開始傳遞的是樂觀的信息,然后就變得情緒化。他一度說有時(shí)候來上班都是一種掙扎。每次談到Facebook所面臨的問題規(guī)模以及他所擔(dān)負(fù)的要改變局面的責(zé)任時(shí),他都會(huì)哽咽。
談到那些有問題的帖子時(shí)他說:“永遠(yuǎn)都不可能降到0。”
“多么沉重的負(fù)擔(dān),多么巨大的責(zé)任啊。”
2013年12月的一個(gè)星期天,Clément Farabet走進(jìn)了內(nèi)華達(dá)太浩湖Harrah賭場(chǎng)酒店的這家頂樓套房。在里面,他受到了Schroepfer和扎克伯格的歡迎。
扎克沒有穿鞋。接下來的30分鐘里,這位CEO穿著襪子來回踱步,一邊跟紐約大學(xué)AI研究人員Farabet交談。扎克伯格稱AI是“下一個(gè)大事物”,是“Facebook的下一步”。Schroepfer則坐在沙發(fā)上,偶爾插插話來強(qiáng)調(diào)某一點(diǎn)。
他們到城里來是為了招募AI人才。那一年太浩湖是NIPS(神經(jīng)信息系統(tǒng)處理大會(huì))的舉辦地。而NIPS是專業(yè)的AI學(xué)術(shù)會(huì)議,每年都會(huì)吸引全球的頂級(jí)研究人員到來。Facebook管理層已經(jīng)引進(jìn)了Yann LeCun,這名紐約大學(xué)學(xué)者被認(rèn)為是現(xiàn)代AI運(yùn)動(dòng)之父之一,被招進(jìn)來后他創(chuàng)立了Facebook的AI實(shí)驗(yàn)室。把LeCun看作自己的導(dǎo)師的Farabet也在他們的最后人選當(dāng)中。
說到扎克伯格,F(xiàn)arabet說:“他基本上誰都想要。他知道這一塊的每一位研究人員的名字。”
那段時(shí)間是Facebook令人陶醉的日子,然后他們的軌跡和AI工作的使命開始改變了。
當(dāng)時(shí),從Google到Twitter,硅谷最大型的科技公司都在爭(zhēng)相成為AI的中堅(jiān)。這種技術(shù)已被互聯(lián)網(wǎng)公司摒棄了多年。但在大學(xué),像LeCun這樣的研究人員已經(jīng)悄悄地培育出名為“神經(jīng)網(wǎng)絡(luò)”的AI系統(tǒng),這種復(fù)雜的數(shù)學(xué)系統(tǒng)可通過分析海量數(shù)據(jù)自行學(xué)習(xí)任務(wù)。出乎硅谷許多人的意料,這些晦澀且多少有些神秘的系統(tǒng)終于開始工作了。
Schroepfer和扎克伯格希望把Facebook推入到這場(chǎng)競(jìng)爭(zhēng)當(dāng)中,把這一迅速改進(jìn)的技術(shù)視為公司必須抓住的東西。AI可以幫助該社交網(wǎng)絡(luò)識(shí)別發(fā)布到網(wǎng)站上面的照片和視頻中的人臉,Schroepfer說,而且還可以用來進(jìn)行更好的定向廣告,組織其新聞流,并進(jìn)行語言翻譯。AI還可以用來提供像“聊天機(jī)器人”這樣的數(shù)字電子產(chǎn)品,讓企業(yè)跟客戶進(jìn)行互動(dòng)。
Schroepfer說:“我們打算招募全世界最好的人才。我們要建設(shè)新型的研究實(shí)驗(yàn)室。”
從2013年開始,Schroepfer就一直在招募專長(zhǎng)神經(jīng)網(wǎng)絡(luò)的研究人員,當(dāng)時(shí)該領(lǐng)域的明星酬金都是數(shù)百萬甚至上千萬美元(4、5年期)。在2013年的那個(gè)星期天,他們并沒有成功招到Farabet,后者后來自己創(chuàng)辦了一家AI初創(chuàng)企業(yè),隨后被Twitter收購了。但Schroepfer從Google、NYU以及蒙特利爾大學(xué)等處挖來了幾十名頂級(jí)研究人員。
Schroepfer還組建了第二個(gè)組織,應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì),任務(wù)是將Facebook AI實(shí)驗(yàn)室的技術(shù)轉(zhuǎn)化為現(xiàn)實(shí)世界的應(yīng)用,比如臉部識(shí)別、語言翻譯以及增強(qiáng)現(xiàn)實(shí)工具等。
2015年底,部分AI工作開始轉(zhuǎn)化。催化劑是巴黎恐襲。在那場(chǎng)襲擊中,伊斯蘭激進(jìn)分子殺死了130人,并導(dǎo)致500人受傷。事后,據(jù)匿名人士透露,扎克伯格問應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)Facebook可以怎樣去打擊恐怖主義。
作為回應(yīng),該團(tuán)隊(duì)利用新的Facebook AI實(shí)驗(yàn)室內(nèi)部開發(fā)的技術(shù)來建設(shè)一套識(shí)別在該社交網(wǎng)絡(luò)上宣傳恐怖主義的系統(tǒng)。該工具會(huì)對(duì)Facebook里面提到了伊斯蘭國或者基地組織的帖子進(jìn)行分析,然后把那些最有可能違背公司反恐政策的帖子標(biāo)記出來。然后再對(duì)帖子進(jìn)行人工審核。
這是Facebook利用AI查貼刪貼的轉(zhuǎn)折點(diǎn)。
這項(xiàng)工作很快就有了強(qiáng)勁的發(fā)展勢(shì)頭。2016年11月,特朗普當(dāng)選美國總統(tǒng),大家對(duì)Facebook網(wǎng)站成為虛假信息的溫床開始抵制,因?yàn)槟切┨摷傩畔⒖赡苡绊懙酵镀辈⑶覟樘乩势盏膭龠x打下基礎(chǔ)。
盡管該公司已開始否認(rèn)自己在虛假信息傳播和選舉中所扮演的角色,但仍開始在2017年初將技術(shù)資源轉(zhuǎn)移到自動(dòng)識(shí)別廣泛的有害內(nèi)容上,包括裸露照片和假賬號(hào)等。它還設(shè)立了幾十個(gè)“防垃圾(integrity)”崗位,專門來跟網(wǎng)站不同板塊的有害內(nèi)容做斗爭(zhēng)。
到2017年中,有害內(nèi)容檢測(cè)已經(jīng)成為了應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)工作的重心。Schroepfer說:“我們的內(nèi)容理解工作的頭號(hào)優(yōu)先事項(xiàng)顯然是誠信。”
然后,到了2018年3月,紐約時(shí)報(bào)等報(bào)道了英國政治咨詢機(jī)構(gòu)劍橋分析在未經(jīng)同意的情況下收割來數(shù)百萬Facebook用戶的信息,然后為特朗普的競(jìng)選團(tuán)隊(duì)提供投票人的檔案信息。對(duì)該社交網(wǎng)絡(luò)的怒火開始爆發(fā)了。
很快Schroepfer就被叫過去處理這起事件。2018年4月,他被指定為主管飛到倫敦面對(duì)英國的一個(gè)議會(huì)委員會(huì),去回答對(duì)方有關(guān)劍橋分析丑聞的質(zhì)疑。在那里,他被議會(huì)委員會(huì)的成員拷問了4個(gè)小時(shí)。
向全球直播的聽證會(huì)期間,工黨政客Ian Lucas對(duì)著面色鐵青的這位主管發(fā)問:“Schroepfer先生,你的頭兒是不是誠信的?我仍然不相信你的公司具有誠信。”
Forest Key是虛擬現(xiàn)實(shí)初創(chuàng)企業(yè)Pixvana的CEO,兩人自從1990年代末一起在一家電影效果技術(shù)初創(chuàng)企業(yè)共事以來就認(rèn)識(shí)了。他說:“我很難看得下去。這是多么沉重的負(fù)擔(dān)啊。這是多么巨大的責(zé)任啊。”
用AI來牽制Facebook的內(nèi)容問題的挑戰(zhàn)仍在繼續(xù)——Schroepfer的擔(dān)子很重。
“勸說工程師不要打退堂鼓”
剛到Facebook的時(shí)候,Schroepfer被看作是問題解決者。
Schroepfer從小在佛羅里達(dá)德爾雷比奇長(zhǎng)大,他的父母經(jīng)營著一個(gè)1000瓦的調(diào)頻電臺(tái),先是放搖滾樂,后來又換成R&B,1993年,Schroepfer搬到了加州上斯坦福。他在那里本科和研究生讀的都是計(jì)算機(jī)科學(xué),跟Lilly和Adam Nash(現(xiàn)為Dropbox的高管)這些技術(shù)專家混在一起。
畢業(yè)后,Schroepfer呆在硅谷,開始一段痛苦的技術(shù)事業(yè)。他先是在一家電影效果初創(chuàng)企業(yè)嶄露頭角,之后又成立了一家為大規(guī)模數(shù)據(jù)中心開發(fā)軟件的公司,那家公司隨后被Sun Microsystems收購。2005年,他加入了Mozilla擔(dān)任工程副總裁。這家非營利組織的瀏覽器挑戰(zhàn)了微軟IE瀏覽器的壟斷。當(dāng)時(shí),沒有什么技術(shù)任務(wù)比他們的項(xiàng)目要大。
Mozilla聯(lián)合創(chuàng)始人Mike Shaver曾跟Schroepfer共事過幾年,他說:“瀏覽器是復(fù)雜產(chǎn)品,當(dāng)時(shí)的競(jìng)爭(zhēng)格局很不可思議。甚至在他的職業(yè)生涯早期,我對(duì)他的處理能力也從來都沒懷疑過。”
2008年,F(xiàn)acebook聯(lián)合創(chuàng)始人Dustin Moskovitz從工程負(fù)責(zé)人的位置退下。Schroepfer加盟接管了他的角色。當(dāng)時(shí)Facebook服務(wù)的用戶約為200萬人,他的工作是保證網(wǎng)站在用戶數(shù)暴漲的情況下不間斷運(yùn)行。這份工作涉及到管理成千上萬的工程師,以及全球數(shù)以萬計(jì)的計(jì)算機(jī)服務(wù)器。
Schroepfer說:“大部分的工作就像是著火的巴士正在從山上滾下來但4個(gè)輪子都癟了。問題是怎么讓它繼續(xù)走。”他的的一天很大一部分是“跟工程師談話讓他們冷靜下來不要沖動(dòng)想不干”因?yàn)樗麄冋於荚谔幚韱栴}。
接下來的幾年,他的團(tuán)隊(duì)開發(fā)了一系列的新技術(shù)來泡那么大的一個(gè)服務(wù)(Facebook現(xiàn)在的用戶已經(jīng)超過20億)。他們推出了新的編程工具幫助公司更快更可靠地把Facebook交付到筆記本和手機(jī)上。它引入了定制服務(wù)器到數(shù)據(jù)中心,讓龐大的服務(wù)器計(jì)算機(jī)網(wǎng)絡(luò)運(yùn)營變得流暢。到最后,F(xiàn)acebook顯著減少了服務(wù)中斷。
Schroepfer說:“我已經(jīng)不記得上一次跟因?yàn)閿U(kuò)充問題而筋疲力盡的工程師對(duì)話是什么時(shí)候了。”
因?yàn)檫@些努力,Schroepfer的責(zé)任也越來越大。2013年,他被提拔為CTO。他的工作變成了著眼未來,跟蹤公司應(yīng)該探索的新的技術(shù)領(lǐng)域。想知道他的角色有多重要?他的辦公桌就在扎克伯格的旁邊,夾在這位CEO與COO Sheryl Sandberg中間。
關(guān)于Schroepfer,扎克伯格說:“他是公司很多人如何思考和運(yùn)營的很好代表。Schrep的超級(jí)能力可以跨不同問題領(lǐng)域教導(dǎo)和建設(shè)團(tuán)隊(duì)。我還沒跟其他任何能夠像他那樣做到這一點(diǎn)的人共事過。”
所以,毫不奇怪扎克伯格會(huì)找到Schroepfer去處理Facebook上所有那些有害內(nèi)容。
西蘭花 vs. 大麻
最近的一個(gè)下午,在一間Facebook的會(huì)議室,Schroepfer從他的屁股筆記本電腦里取出了兩張圖片。一張是西蘭花的圖片,另一張是聚成一團(tuán)的大麻花蕾。每個(gè)人都盯著這些圖片。有的不大敢確定哪個(gè)是哪個(gè)。
Schroepfer展示這些圖片是想說明一點(diǎn)。即便是我們當(dāng)中的一些人分辨都有困難,但現(xiàn)在Facebook的AI系統(tǒng)能夠從成千上萬中圖像中找出模式,從而自行分辨大麻的蓓蕾。一旦AI標(biāo)記出大麻圖片,其中很多都是附加在Facebook廣告上,利用圖片通過該社交網(wǎng)絡(luò)賣大麻的,公司就會(huì)找出來刪掉。
Schroepfer說:“現(xiàn)在我們可以主動(dòng)逮住這類東西了。”
問題在于大麻與西蘭花之對(duì)決不僅是進(jìn)展的信號(hào),也是Facebook遭遇限制的標(biāo)志。Schroepfer的團(tuán)隊(duì)已經(jīng)開發(fā)出公司用于識(shí)別和移除大麻圖片、裸體及恐怖分子相關(guān)內(nèi)容的AI系統(tǒng)。但是那些系統(tǒng)不能把那些圖片全都揪出來,因?yàn)榭倳?huì)有預(yù)想不到的內(nèi)容出現(xiàn),意味著還是會(huì)有數(shù)百萬裸體、大麻相關(guān)以及恐怖分子相關(guān)的帖子繼續(xù)進(jìn)入到Facebook用戶的視線。
識(shí)別流氓圖片也是AI較為容易的任務(wù)之一。建造識(shí)別假新聞或者仇恨言論的系統(tǒng)會(huì)更困難。假新聞很容易就能塑造成看似真實(shí)的樣子。仇恨言論也有問題,因?yàn)闄C(jī)器識(shí)別語言的微妙差別實(shí)在是太難了。很多微妙差異會(huì)因語言而異,而對(duì)話的上下文也會(huì)快速地演變,導(dǎo)致機(jī)器難以跟上。
AI Foundation是一家探索人工智能如何與虛假信息斗爭(zhēng)的非營利組織。其研究負(fù)責(zé)人Delip Rao把這一挑戰(zhàn)說成是“一場(chǎng)軍備競(jìng)賽。”AI是根據(jù)之前出現(xiàn)的東西搭建的。但沒有任何東西可學(xué)的情況太常見了。行為改變。攻擊者創(chuàng)造出新技術(shù)。顯然,這是一場(chǎng)貓捉老鼠的游戲。
Rao說:“有時(shí)候你比那些導(dǎo)致傷害的人領(lǐng)先一步。有時(shí)候他們?cè)谀愕那邦^。”
那個(gè)下午,Schroepfer試圖用數(shù)據(jù)和數(shù)字回答我們有關(guān)貓捉老鼠游戲的問題。他說Facebook現(xiàn)在自動(dòng)移除了該社交網(wǎng)絡(luò)96%的裸體內(nèi)容。仇恨言論更棘手一點(diǎn),他說——公司目前只捕捉到其中的51%(Facebook后來說提高到65%了)
Schroepfer承認(rèn)軍備競(jìng)賽元素的存在。他說,盡管Facebook可自動(dòng)檢測(cè)和移除有問題的直播視頻流,但并沒有識(shí)別出3月份新西蘭的視頻,因?yàn)檫@段視頻跟過去任何上傳到該社交網(wǎng)絡(luò)的內(nèi)容都不一樣。這段視頻用的是第一人稱視角,就像計(jì)算機(jī)游戲一樣。
在設(shè)計(jì)識(shí)別圖像暴力的系統(tǒng)時(shí),F(xiàn)acebook一般都要后向拿現(xiàn)有圖像進(jìn)行處理——那些踢貓的人,狗攻擊人,汽車撞上行人,一個(gè)人拿棒球棒揮向另一人等的圖片。但是,他說:“那些跟這個(gè)視頻均無太多的相似之處。”
那次槍擊視頻的新穎性正是它之所以令人如此震驚的原因,Schroepfer說。“這也是它沒有馬上被標(biāo)記出來的原因。”并且補(bǔ)充說自己看了那段視頻好幾次,以弄清楚Facebook下次可以如何去識(shí)別出來。
最后他說:“我真希望自己沒看過那些東西。”