小度機器人成新晉最強大腦 計算能力超越AlphaGo
誰是世界上最強的大腦?在最新一期的《最強大腦4》中,百度研發(fā)的“小度機器人”成為公認(rèn)“腦王”,不僅在人臉識別賽題中,僅根據(jù)童年照片比對就發(fā)現(xiàn)了蜜蜂少女隊中隱藏的同卵雙胞胎隊員,依靠萬分之一的區(qū)別概率選出了正確答案,令觀眾和網(wǎng)友嘆服。
在“小度”參與“人機大戰(zhàn)”前,機器與人類的PK多在下棋、答題等領(lǐng)域,從1997年IBM深藍戰(zhàn)勝卡斯帕羅夫起,似乎就意味著人類智力在棋類游戲中不敵人工智能。隨著人工智能的不斷進化,機器還會從程序運算走向抽象思維認(rèn)知全新階段,在更多的領(lǐng)域超越人類。“小度”此次戰(zhàn)勝人類對手正是機器探索抽象思維認(rèn)知的階段性成果。
代表棋類人工智能最高水平的AlphaGo緣何能輕松戰(zhàn)勝人類。曾有人道破天機:“AlphaGo一天對弈的棋局,比人類專業(yè)棋手一輩子下過的都要多得多!”從計算原理上來看,AlphaGo棋力精進主要依靠機器學(xué)習(xí)的一個分支——深度學(xué)習(xí)技術(shù),能基于當(dāng)前局勢,預(yù)測對手下一步落子,并計算棋局的不同走向。更重要的是,AlphaGo在挑戰(zhàn)李世石之前,已經(jīng)在與人類棋手的對弈中學(xué)習(xí)了近萬盤棋局,而與自己“左右互搏”的棋局更是超過3000萬盤!如此龐大的對弈盤數(shù),使得AlphaGo在對戰(zhàn)中妙手頻出讓對方陷入被動。
人臉識別與下棋大有不同。簡單說,人臉識別包含兩種技術(shù):一種是1:1 的人臉比對,比如像銀行的應(yīng)用場景,通過比對希望知道這張人臉是不是身份證上面的那個人;還有一種更通用的 1:N 人臉識別,N 可以是幾千、幾萬或者幾十萬進行比對,這叫 1:N 的比對或者是 1:N 的人臉識別。“小度”在《最強大腦4》中與名人堂輪值主席王峰PK時展現(xiàn)出的人工智能技術(shù),則屬于第二種,而且是其中最復(fù)雜的跨年齡識別。
眾所周知,人類童年時的照片與成年后的臉部相比有明顯區(qū)別。雖然人腦傳承了祖先上百萬年積累的臉部識別天賦,但跨年齡識別仍是很難完成的挑戰(zhàn)。百度深度學(xué)習(xí)實驗室(IDL)科學(xué)家們選擇了用度量學(xué)習(xí)的方法破解這一難題,即通過學(xué)習(xí)非線性投影函數(shù)將圖像空間投影到特征空間中,在大量樣本中,縮小同一個人跨年齡的兩張人臉的距離??紤]到跨年齡人臉的稀缺性,IDL還采用了一個用大規(guī)模人臉數(shù)據(jù)訓(xùn)練好的模型底座,并用跨年齡數(shù)據(jù)對其進行更新,從而大幅提升跨年齡識別的識別率。通俗一點說,“小度”采用的技術(shù)手段是在臉部骨骼上取盡可能多的采樣點,把其與需要篩選的大量人臉逐個比較。當(dāng)然,雙胞胎由于骨骼相似差別細微,所以識別的難度也要比普通人更大。
技術(shù)原理看似輕描淡寫,實際情況是,盡管百度大腦經(jīng)過了兩億多習(xí)題的人臉識別訓(xùn)練,在該領(lǐng)域的能力目前世界領(lǐng)先,但跨年齡識別等技術(shù)對計算能力要求極高,“為了這次比賽,我們也收集了一些跨年齡的數(shù)據(jù),根據(jù)跨年齡這個場景再進一步優(yōu)化模型,跨年齡數(shù)據(jù)大概在幾千張這個級別,并不算特別的多。” 百度深度學(xué)習(xí)實驗室(IDL)主任林元慶表示“小度”獲勝并非易事,而且在現(xiàn)場識別人臉時,光照、人臉姿態(tài)、遮擋程度等因素會對人臉檢測帶來干擾,光照、表情、遮擋、年齡、模糊也會影響到人臉識別的精度,特別是面對年齡跨度較大的情況,由于缺乏兩個年齡中間的足夠數(shù)據(jù),所以“小度”更難學(xué)習(xí)和掌握人臉的變化。
《最強大腦》科學(xué)顧問團首席顧問、北京師范大學(xué)心理學(xué)院院長劉嘉教授在觀看結(jié)果后,不無感慨:“我們《最強大腦》的選手真正是在和世界上最頂級的、甚至在某些程度上超過AlphaGo的人工智能進行對決。”
從AlphaGo到“小度”,人工智能正在從程序化運算走向抽象思維的認(rèn)知的全新階段。“我們參與這次活動很重要的一個目的是希望能讓大眾能深切感覺到人工智能能做什么。” 林元慶表示,機器在一些能力上超過人是很正常的,但人工智想要整體全面地超越人類還有非常長的路要走,“小度”和百度人工智能的工作就是幫助人類完成更多創(chuàng)造性思維的任務(wù)。