幸好圖靈不是一位好棋手
咱就是說,還好祖師爺圖靈不是一位國際象棋大師!
不然整個世界的AI發(fā)展脈絡以及技術進展速度,可能和現(xiàn)在完全不一樣……
看到這兒有的人可能犯嘀咕:不是,為啥這么說????
國際象棋不是和AI關系密切,從計算機科學發(fā)展之初就相互促進,共同演進嗎?
注意了,這句話的重點在于:還好圖靈不是一位國際象棋“大師”。
如果他是個大師的話,可能就專精棋藝,不一定會被選中召去布萊切利莊園(英國二戰(zhàn)時期的密碼破譯中心)。
當然,圖靈也有可能還是被選中去布萊切利莊園工作。但就不會因為棋藝不佳,只能常常和水平旗鼓相當?shù)奶萍{德·米奇(Donald Michie)對弈。
二人不僅成為好友,還合作了博弈樹算法——這成為后來AlphaGo的核心。
兩人每周都會一起下棋,并且因為下棋時的閑聊,對后來的AI發(fā)展帶來深遠影響。
如果當初圖靈棋藝高超,下棋的對手不是米奇,很多歷史,可能就此改寫。
好了,我們現(xiàn)在詳細來看這究竟是怎么一回事。
“人菜癮大”的國際象棋棋手圖靈
圖靈會下國際象棋,愛下國際象棋,這事兒聲名遠播。
但有的人可能不清楚,圖靈的國際象棋棋藝水平算不得高超,甚至可以說得上是有一些平庸 (doge)。
這里和大家分享分享一則閑聞軼事——
1939年,正值二戰(zhàn)爆發(fā)前夕,英方急需破解德軍的恩尼格瑪密碼機以獲取軍事情報。
因此,不少在密碼破譯方面有突出表現(xiàn)的人才都被召至了英國政府密碼學校的所在地,也就是布萊切利莊園。
圖靈就是其中之一。
他在那兒工作了好幾年,在此期間發(fā)明了舉世聞名的圖靈機。
以上是大家都知道的事,但大家可能不知道,布萊切利莊園時期,除了潛心研究密碼破譯等相關工作,圖靈最愛的事情就是和同事來幾局國際象棋。
當時圖靈的同事中不乏一些知名的國際象棋頂級大師,比如休·亞歷山大(Hugh Alexander)和哈里·戈隆貝克(Harry Golombek)什么的。
和他們相比,圖靈是什么水平呢?
據(jù)傳某一次對弈過程中,圖靈給自己下成了死局,死活破不了。急得戈隆貝克把棋盤轉了一百八十度,自己動手來幫圖靈挽回局勢。

顯然,和碾壓式的對手下棋不是長久之計。
圖靈很快為自己物色了一個更合適的下棋搭子,18歲的唐納德·米奇。
米奇沒啥數(shù)學背景,但是學習能力很強,學東西很快,后來成為了布萊切利測試小組的關鍵成員——測試小組選拔的人都是具備橫向思維、模式識別和邏輯推理能力的精英。
在測試小組工作期間,米奇和圖靈成了好朋友,甚至離開布萊切利莊園后,兩人還長期保持聯(lián)系。
最關鍵的是,因為兩人在國際象棋方面的造詣差不多,棋逢對手,順理成章成了下棋搭子。
每周,兩人都會在布萊切利莊園不遠處小鎮(zhèn)上的酒館里下棋。
后來米奇回憶說,邊下棋邊閑聊的時候,他們倆聊的話題常常圍繞“學習型機器(learning machines)”和“機器下棋”(mechanising chess)等展開。
米奇表示:
對我來說,這些談話對我在機器智能領域的探索起到了啟蒙作用。
受此影響,米奇成了AI研究先驅(qū)
二戰(zhàn)結束后,天才們紛紛離開了布萊切利莊園,但米奇對機器智能領域的探索沒有結束。
過了幾年,米奇和人合作了一套紙上機器(即沒有任何硬件和軟件,僅用紙筆模擬機器運作邏輯)的下棋算法,名叫MACHIAVELLI。
這套算法的核心策略是走一步看一步,即根據(jù)對手的走子選擇下一步棋怎么下。
Be like:
- 輸入:對手走了什么棋
- 中間:按照一套寫在紙上的規(guī)則判斷局勢
- 輸出:決定下一步走什么
這個策略和他在布萊切利莊園破譯密碼時的思路如出一轍,都是用“受限搜索”的方式來縮小可能性。
而圖靈發(fā)明的Bombe機,用的也是這套思路。

△圖靈和Bombe機(AI繪圖)
提一個小插曲,米奇的這套算法后來被另一個同仁點名批評。
1948年,當年同在布萊切利莊園工作過的杰克·古德(Jack Good)——他是一位杰出的數(shù)學家,也是一位國際象棋大?!チ颂伺=?,旁觀了米奇演示MACHIAVELLI。
一周后,結束旅程的杰克給圖靈寫了封信,信里指出了MACHIAVELLI的缺陷。
只會“走一步看一步”。
杰克覺得這套算法一定是個臭棋簍子,即使能非常準確的評估位置,但棋局一旦復雜化,它就很容易抓瞎了。
不過,這種試圖縮小范圍,通過啟發(fā)函數(shù)選出最佳答案,而不是窮舉的思路辦法,后來被命名為“啟發(fā)式搜索”,并被廣泛使用。
啟發(fā)式搜索突破傳統(tǒng)的暴力計算方式,實現(xiàn)AI的智能決策,解決了復雜問題的計算可行性。
現(xiàn)在,它其實已經(jīng)應用于日常生活的各個方面,比如導航、物流、游戲規(guī)則制定、AI診斷等。
1960s,米奇還和詹姆斯·多蘭(James E. Doran)依據(jù)啟發(fā)式搜索開發(fā)了圖遍歷程序(Graph Traverser Program),解決從起點到終點的最佳路徑問題。
其邏輯結構,奠定了AI中路徑規(guī)劃、博弈搜索、圖像識別等基礎。
“研究計算機下棋,并不是在浪費納稅人的錢”
同樣是1960s,米奇在在愛丁堡大學創(chuàng)立了機器智能與感知系(Department of Machine Intelligence and Perception)。
這里逐漸發(fā)展為歐洲最重要的AI研究中心之一。
到了70年代,由于AI發(fā)展史上具有里程碑意義的批判性文獻《萊特希爾報告》的發(fā)布,英國AI研究的經(jīng)費被大幅削減,米奇的研究也受到了限制。
但他繼續(xù)用有限的資金對國際象棋殘局進行研究。
米奇適始終堅信,國際象棋在AI研究中十分重要,如他在《國際象棋殘局模式知識的表示》的草稿中明確提到的那樣,“研究國際象棋并不是在浪費納稅人的錢,沒有其它同樣合適的材料可以用來研究某些重要的科學問題”。
中途有一段時間,米奇轉型成了遺傳學家,但他始終沒有離開AI研究。
而國際象棋幾乎貫穿了他整個AI研究生涯。
他在一篇論文里進一步說明,這種策略游戲適合AI研究及其主要優(yōu)勢:
國際象棋是一個定義明確且規(guī)范化的領域。它挑戰(zhàn)著各種認知功能中的最高智力水平,包括邏輯概念形成、計算、死記硬背、類比思維、演繹和歸納推理等等。USCF評級系統(tǒng)提供了一個普遍接受的績效數(shù)值標度。這個游戲可以輕易分解成子游戲,這些子游戲可以接受密集的單獨分析。
對米奇來說,國際象棋不僅僅是一種方便且有趣的探索機器智能的方式,更是AI研究中的“果蠅”,完美適用于“研究機器中知識的表示和測量”。
米奇的觀念影響了許多后來者,其對國際象棋殘局的研究,在70、80年代許多項目中起到了關鍵作用。
他的博士生羅斯·昆蘭就受此影響,后來開發(fā)出了ID3決策樹學習算法。
這是CLS開發(fā)的一系列程序之一,旨在應對米奇提出的具有挑戰(zhàn)性的歸納任務。
即僅根據(jù)基于模式的特征來判斷在固定的移動步數(shù)內(nèi),“國王-車”對“國王-馬”殘局中,馬是否處于劣勢。
昆蘭曾在論文中特別致謝了國際象棋棋局。
One More Thing
如果當年圖靈是個頂尖優(yōu)秀的國際象棋棋手,可能后來的一切都會不一樣。
蝴蝶效應嘛~
但現(xiàn)實的發(fā)展就是,國際象棋背后的許多東西都予以計算機科學乃至如今的AI以啟迪。
而且學習國際象棋,很大程度上有助于培養(yǎng)一個人集中注意力、解決問題和做決策的能力。
不過,和深藍大戰(zhàn)三百回合的歷史最偉大棋手之一卡斯帕羅夫曾表示,“一個人擅長國際象棋,并不意味著你在其他領域也特別出色或擅長”。
現(xiàn)在,由于生成式AI時代的到來,大家對國際象棋水平和AI能力之間的關系有了更深的理解。
Hacker News上有網(wǎng)友討論分享了ta的親身感受,那就是國際象棋的高分選手可能邏輯上面真的很差。
還有網(wǎng)友表示,現(xiàn)在大家追求的AGI,既不擅長下棋,也不像我們想象中那樣善于偽裝成人類。
所以我們追求的AGI,到底是什么啊?





















