清華大學張鈸院士:融合倍增的第三代人工智能三空間融合模型解讀
人工智能現(xiàn)在發(fā)展到哪個階段了?存在哪些問題與局限性?如何突破?
近日,清華大學人工智能研究院院長、中國科學院院士張鈸(bó)教授在“紀念《中國科學》創(chuàng)刊70周年專刊”上發(fā)表了聯(lián)合署名文章——《邁向第三代人工智能》。

什么是第三代人工智能?
通過這篇文章,首次全面闡述了第三代人工智能的理念與發(fā)展方向。
文章認為,第三代人工智能的發(fā)展路徑是融合第一代的知識驅動和第二代的數(shù)據(jù)驅動的人工智能。

1956年8月,在美國漢諾斯小鎮(zhèn)寧靜的達特茅斯學院中,約翰·麥卡錫、克勞德·香農(nóng)、赫伯特·西蒙等一眾大??茖W家們聚在一起,主要討論一個影響人類甚至是地球未來的議題:如何用機器來模仿人類學習以及其他方面的智能。
因為時代背景的限制,會議開了兩個月的時間,也沒有達成普遍共識,但是這次會議討論的內(nèi)容,是有一個明確的討論主題:人工智能。
人工智能元年是1956年,也是由此而來的。
在人工智能60多年的發(fā)展歷史中,一直存在兩個相互競爭的范式:
第一是符號主義,也就是第一代人工智能。
到上個世紀八十年代之前一直主導著AI的發(fā)展。作為第一代知識驅動的人工智能,主要是利用知識、算法與算力三個要素來構造AI。
第二是連接主義(或稱亞符號主義),也就是第二代人工智能。
從上個世紀九十年代逐步發(fā)展,到本世紀初進入高潮,大有替代符號主義之勢。第二代數(shù)據(jù)驅動的人工智能,利用數(shù)據(jù)、算法與算力三個要素構造AI。
由于第一代與第二代人工智能都有明顯的局限性,都是分別從一個側面來模擬人類的智能行為,因此,都還是弱人工智能。
因為以今天的科技研究與視角來分析,這兩種范式只是從不同的側面模擬人類的心智 (或大腦),具有各自的片面性,不可能觸及人類真正的智能。
同時利用知識、數(shù)據(jù)、算法和算力等4個要素, 建立新的可解釋和魯棒的AI理論與方法,發(fā)展安全,可信,可靠和可擴展的AI技術,這是發(fā)展AI的必經(jīng)之路。
正是在這樣的背景之下,提出了第三代人工智能的概念,通過發(fā)展安全、可信、可靠與可擴展的AI技術,建立一個全面反映人類智能的AI,需要建立魯棒與可解釋的AI理論與方法。
其發(fā)展思路是,把第一代知識驅動和第二代的數(shù)據(jù)驅動結合起來,從原來的三要素升級到同時利用知識、數(shù)據(jù)、算法與算力四個要素,來構建比前代更強大的人工智能。
第三代人工智能,存在雙空間模型與單一空間模型兩個方案。
第一、雙空間模型。
該模型是一種類腦模型,符號空間模擬大腦的認知行為,亞符號(向量)空間模擬大腦的感知行為,人類大腦中的認知行為與感知行為其實是無縫融合的。
如果第三代人工智能能夠實現(xiàn)這種融合,AI就很有希望達到與我們?nèi)祟愊嗨频闹悄堋?/p>
目前,雙模型空間,需要重點攻克三個問題:
1、知識與推理;
知識與推理,是理性智能的基礎,這里面,涉及NLP、知識圖譜技術,尤其是各領域相對成熟的“語料庫”建設,是非常重要的環(huán)節(jié)。
2、感知;
目前的深度學習只能做到 “感覺 (sensation)”, 達不到“感知 (perception)”。
一字之差,天壤之別。
機器識別的是外部標注的 “寄生語義 (parasitic semantics)”,為了達到感知的水平,需要從局部到全局,能夠識別出物體的“內(nèi)在語義(intrinsic semantics)”,這一點上,目前的深度學習技術,還有很長的路要走。
3、強化學習;
強化學習是用來模擬人類的學習行為, 通過 “交互 – 試錯” 機制, 與環(huán)境不斷進行交互,進而學習到有效的策略。
目前已經(jīng)在視頻游戲 、棋牌游戲、機器人導航與控制、人機交互等領域取得了諸多成果, 并在一些任務上接近甚至超越了人類的水平。
但是在不確定性、不完全信息、數(shù)據(jù)或者知識匱乏的場景下, 目前強化學習算法的性能往往會出現(xiàn)大幅度的下降,這也是目前強化學習所面臨的重要挑戰(zhàn)。
第二、單一空間模型。
該模型以深度學習為基礎,將所有的處理都放在亞符號(向量)空間。
模型的優(yōu)勢在于充分利用計算機的計算能力,提高處理的速度。
其難點在于,目前的深度學習模型與我們?nèi)祟惔竽X的學習機制還是存在很大差異,如果要克服深度學習所帶來的缺陷,需要把如下幾個關鍵問題討論清楚:
1、符號表示的向量化;
知識通常以自然語言的離散符號形式表示, 為了實現(xiàn)單一空間模型, 首先要將符號表示的詞、短語、句子和篇章等轉換為向量, 或者將知識圖譜轉換為向量表示.
這里面需要解決的問題有:不可解釋、會發(fā)生重大錯誤、魯棒性差等問題。
2、深度學習方法的改進;
深度學習目前的主要工作只是在做簡單的函數(shù)擬合, 其局限性在于缺乏像人一樣對問題的理解能力。
因此通過理解機器學習模型的內(nèi)部工作機理, 發(fā)展數(shù)據(jù)驅動和知識驅動融合的第三代人工智能理論框架, 將成為提高人工智能算法魯棒性的重要途徑之一。
3、貝葉斯深度學習的突破;
貝葉斯深度學習是將貝葉斯學習的基本原理與深度神經(jīng)網(wǎng)絡的表示學習有機融合的一類方法,將不確定性建模和推斷與深度表示學習有機融合, 其關鍵挑戰(zhàn)在于推斷和學習算法,目前已經(jīng)在多種復雜場景下,取得了價值與突破。
為了實現(xiàn)第三代人工智能的模型,在綜合了上述兩種模型的優(yōu)劣后,就采用了三空間融合的模型,也就是把雙空間模型與單空間模型融合。
這樣做的優(yōu)勢在于,既可以最大限度地借鑒我們?nèi)祟惔竽X的工作機制,又可以充分利用計算機的算力,通過兩者融合后的倍增效應,希望能夠打造更強大、更接近人類大腦的AI模型。
我們期望三空間融合模型,能夠盡快從實驗室階段邁向商業(yè)化階段,實現(xiàn)更大的價值,造福人類。
關注東方林語,一起了解更多AI知識。
附參考閱讀:
《邁向第三代人工智能》全文如下



