人機辯論大戰(zhàn):AI空談情懷,也是要輸?shù)?/h1>

藍(lán)色的舞臺上,正中間立著一塊黑色的面板,面板上藍(lán)色的扁圓形屏幕正在閃動,后面?zhèn)鞒隼潇o而理性的女聲。
而右側(cè)的講臺上,一位西裝革履的小哥正在聆聽這個面板的“演講”,時而動筆記錄,時而面色凝重,時而嘴角露出邪魅一笑,看起來信心滿滿,胸有成竹。
這是 IBM 的 AI 與人類冠軍辯手的對決,也是今年 Think 2019 大會的一個環(huán)節(jié)。
人機大戰(zhàn)的一方是 IBM 的的 AI,Project Debater,那塊黑色面板就是它在人間的載體。去年 6 月,它擊敗了 2016 以色列全國辯論冠軍 Noa Ovadia,創(chuàng)下了 AI 在辯論方面擊敗人類的歷史記錄。
△ 左為 Project Debater,右為哈利什
另一方則是 2012 年歐洲辯論冠軍哈利什·納塔拉(Harish Natarajan),一位牛津本、劍橋碩的學(xué)霸,本科主修政治、哲學(xué)、經(jīng)濟(PPE)專業(yè),因此他也是英國前首相卡梅倫的學(xué)弟;碩士則在研究哲學(xué)和國際關(guān)系;現(xiàn)在則是 AKE 咨詢公司的經(jīng)濟風(fēng)險主管。
誰勝誰敗?由現(xiàn)場觀眾的選票決定。
這場辯論的規(guī)則比較簡單,拿到辯題后,雙方各有 15 分鐘的時間進(jìn)行準(zhǔn)備,提出自己的論點和可以反駁對方的論據(jù);
正式開始后,雙方各有 4 分鐘的時間進(jìn)行開場立論,之后各有 4 分鐘時間進(jìn)行駁論,最后各有 2 分鐘時間進(jìn)行總結(jié);
而場下的觀眾評審則是由灣區(qū)學(xué)校里的頂尖辯手和 100 多名記者組成,在辯論開始前和開始之后,觀眾評審們各進(jìn)行一次投票,選出自己支持的觀點,辯論后觀點支持人數(shù)增加的一方獲勝,另一方失敗。
直擊人機辯論
主持人送出一句“May the best debater win”的祝福,人類辯手出場,Project Debater“站”在臺上靜靜等待。
他們今天的辯題,也算關(guān)乎人類的未來,起碼關(guān)乎下一代:
We should subsidize preschool。
我們應(yīng)該資助幼兒園。
正方:AI 辯手,反方:人類代表哈利什。
AI 認(rèn)為,資助幼兒園這不僅僅是個經(jīng)濟問題,也是道德和政治問題。她的觀點可以歸結(jié)為三個方面:資助幼兒園能幫兒童擺脫貧窮、有助于后續(xù)的學(xué)業(yè),甚至還能節(jié)約醫(yī)療開支、降低犯罪率。
從立論陳述到總結(jié)陳詞,AI 都旁征博引:
為了說明高質(zhì)量幼兒園能讓孩子在之后的學(xué)業(yè)上表現(xiàn)更好,她引用了杜克大學(xué)的一項研究;
為了說明幼兒園和犯罪率之間的關(guān)系,她拿來新澤西州的案例,還用了好幾次“大量研究表明”,列舉了不少數(shù)據(jù);最后的總結(jié),還用上了人類作文要訣——名人名言。
人類代表哈利什也說,AI 提供了豐富的信息,列舉了很多事實和數(shù)據(jù)。
而他的辯論風(fēng)格和 AI 截然不同,人類辯手當(dāng)然不能和一臺電腦比拼查資料舉例論證的能力。
哈利什選擇抓住弱點反駁,再談現(xiàn)實狀況。他抓住的弱點,是 AI 反復(fù)論證的“拯救貧窮”,談的顯示狀況,是政府的錢是有限的,投資了幼兒園就要耽誤其他方面。
他說,投資幼兒園幫不了最貧窮的人,而是那些本來無論如何也要送孩子去幼兒園的中產(chǎn)。而“良好的幼兒園”帶來的那些好處,一來只是推論,二來也不是窮人能享受得到的。
所以,還不如花在更實在的地方。
這場辯論充滿反差感。AI 動之以情,講人文關(guān)懷和人類尊嚴(yán);人類曉之以理,談?wù)J(rèn)清現(xiàn)實精打細(xì)算。
在駁論環(huán)節(jié)的最后,AI 甚至還學(xué)會了“升華”。她(對,官方給定義了性別)說:資助幼兒園事關(guān) basic human decency,人類基本尊嚴(yán)。
在圍觀了整個過程的量子位看來,“人類基本尊嚴(yán)”由黑色面板背后的冷靜女聲說出來,現(xiàn)場觀眾大概不會有什么共鳴。AI 雖然打著感情牌,整體辯論風(fēng)格卻是充滿英美老牌報刊的氣息,如同托福高分作文一般,講論點列論據(jù)。
而人類代表抑揚頓挫,有一絲絲網(wǎng)絡(luò)論壇上流傳的陰謀論味道:別聽她的,能得到好處的,還是那群中產(chǎn)!
我們節(jié)選了開場環(huán)節(jié)的視頻,來一起領(lǐng)略一下 AI 與人類的辯論:
最終,旁征博引談人類尊嚴(yán)的 AI 還是輸給了抓住漏洞狠狠攻擊的人類。
辯論開始前,現(xiàn)場 79% 的觀眾支持投資幼兒園,而 20 分鐘辯論過后的第二輪投票,支持者只剩下 62%。

人類冠軍說服了 17% 的觀眾。
best debater,屬于人類代表哈利什。
主持人在公布結(jié)果、恭喜人類辯手時,甚至一度口誤,把“congratulations to him”說成了“to them”。
“帶路黨”哈利什
雖然取得了本場人機大戰(zhàn)的勝利,哈利什卻是個 AI 帶路黨。他認(rèn)為在不久的將來,AI 的辯論水平總會比人強。
在賽后采訪中,他說,AI 根據(jù)論點來引用論據(jù)、統(tǒng)計數(shù)據(jù)的能力讓他印象深刻,Project Debater 如果和人類的能力結(jié)合起來,潛力巨大。
哈利什認(rèn)為,相比象棋、圍棋、星際 2 這些項目,機器想在辯論上贏過人類要難得多。在辯論賽中取勝,需要三個條件:
· 一,辯手需要巨大的信息量支持,并將這些信息組成支持己方觀點的論點;
· 二,辯手必須將復(fù)雜的論點用清晰、有條理的方式講出來;
· 三,辯手需要讓觀眾認(rèn)同這些論點至關(guān)重要。
也就是說,整個辯論的過程中,辯手需要謹(jǐn)慎的發(fā)言,表達(dá)情感,使用修辭,恰當(dāng)舉例。機器很容易在第一點中勝過人類,它可以方便的獲取大量信息,并組成論點;但第二點和第三點對機器來說非常具有挑戰(zhàn)性。
雖然難度很大,不過哈利什還是覺得未來會有 AI 在這三個方面都能超越人類。
AI 是怎么辯論的
辯論,需要收集信息、形成結(jié)構(gòu)化論點、再用精確的語言表達(dá)出來,要清晰,要有說服力。
面對現(xiàn)場辯論中的陌生辯題,Project Debater 需要幾分鐘的時間來做準(zhǔn)備。
整個過程,從搜尋資料開始。她會為了立論陳述從語料庫中搜尋有用的短文本,找出幾百條相關(guān)的片段。
下一步,就是根據(jù)這些片段,構(gòu)建出強力、豐富的論據(jù),來支撐要談的觀點。移除冗余信息,選擇最強的語句和證據(jù),根據(jù)主題把它們組織起來,構(gòu)成敘述的基礎(chǔ)。
幾分鐘時間準(zhǔn)備好 4 分鐘立論陳述之后,Project Debater 還要聽取對手發(fā)言,準(zhǔn)備駁論。
這個過程無論是對人類來說,還是對機器來說都很難。作為一個 AI,Project Debater 需要識別對手的論點和論據(jù),尋找論點論據(jù)來回應(yīng)它們。
和人類冠軍面對面的 Project Debater,從 2014 年就開始為此準(zhǔn)備了。
它自帶一個龐大的知識庫,從報紙雜志摘錄了 100 億個句子,還具備理解和生成語言的能力,還用知識圖譜來尋找辯題背后隱含的悖論。

從項目開始到現(xiàn)在,Project Debater 團(tuán)隊發(fā)表了 30 多篇論文,還開放了一個數(shù)據(jù)集。
花這么長時間培養(yǎng)一個會辯論的 AI,有什么用?IBM 說,它可以幫網(wǎng)上各種論壇、評論區(qū)的辯論變得更文明更有營養(yǎng),還能幫律師準(zhǔn)備庭審資料,甚至能在金融領(lǐng)域輔助投資決策。
負(fù)責(zé)說話的那個女聲,更是可以用到各種各樣的領(lǐng)域。
離開爸爸保護(hù)的 AI 辯手
去年六月的那場辯論賽,人類高手輸給了 Project Debater。
不過,當(dāng)時的觀眾評審是一群自帶利益相關(guān)體質(zhì)的 IBM 研究員,也就是 Project Debater 的爸爸。
比賽進(jìn)行了兩場,第一場是 Project Debater 對戰(zhàn) 2016 年以色列全國辯論冠軍 Noa Ovadia,討論“我們是否應(yīng)當(dāng)資助太空探索”,Project Debater 為正方,Noa Ovadia 為反方。
第二場則是 Project Debater 對戰(zhàn)另一位以色列辯論專家 Dan Zafrir,討論“我們是否應(yīng)當(dāng)更多的使用遠(yuǎn)程醫(yī)療”,依然是 Project Debater 正方,人類反方。
當(dāng)時的兩場辯論賽中,Project Debater 的語言表達(dá)相對生硬,但傳遞出的信息量更大,Project Debater 說服的觀眾更多一些——當(dāng)然,負(fù)責(zé)投票的觀眾們是 Project Debater 的“爸爸”,畢竟是自家兒子,投票的時候也可能偏心了。























