百分點劉譯璟:人工智能或許應該這樣看
原創(chuàng)【51CTO.com原創(chuàng)稿件】隨著各行各業(yè)數(shù)據(jù)量的急劇增加,大數(shù)據(jù)技術發(fā)展以及高性能計算硬件的成熟運用,人工智能技術在誕生至今的60年中終于重新吸引了大眾的目光,從今年上半年多場有關人工智能的技術分享、主題論壇活動就能深刻感受到行業(yè)的火熱。
技術關注必然會帶來資本追捧,人工智能也不例外,但客觀地講人工智能距離真正大規(guī)模運用并帶來多種應用的成功落地還需要大量時間,例如人工智能在商業(yè)領域的價值還未得到充分驗證,如此火熱依舊是技術驅(qū)動而不是市場驅(qū)動,客戶需求沒有得到充分滿足,沒有看到新的商業(yè)模式,應用領域比較狹窄集中在精準營銷、個性化推薦等互聯(lián)網(wǎng)場景中,例如自動駕駛和金融等領域……百分點集團技術副總裁兼***架構(gòu)師劉譯璟表示,當前的人工智能技術還只能在較窄的場景下應用,要想更好地解決現(xiàn)實問題,還有很長的路要走。
知識圖譜會成為推動人工智能發(fā)展的利器
業(yè)內(nèi)表示,現(xiàn)在人工智能的發(fā)展并沒有出現(xiàn)算法和模型上得革命性變化,深度學習早在八十年代就已經(jīng)出現(xiàn),如今被廣泛關注大部分的原因還是數(shù)據(jù)量的激增,在繼續(xù)發(fā)展的過程中,AI發(fā)展還有很多理論、技術方面的問題沒有解決,這些問題逐一解決有可能推動AI的發(fā)展。
“照目前的形勢發(fā)展,AI能夠用出效果并產(chǎn)生商業(yè)價值一定是在垂直行業(yè),但是垂直行業(yè)的數(shù)據(jù)量并不算龐大,通過構(gòu)建知識體系把小數(shù)據(jù)好好用起來就很關鍵。知識體系是AI中非常重要的技術領域之一,被稱為知識表示。眾所周知,2012年谷歌的知識圖譜越來越得到行業(yè)的認可,以知識圖譜為代表的知識工程會得到更多關注。”劉譯璟對記者說。
人工智能中的知識表示理論研究的是如何將人類體系中的知識用計算機可以理解的語言表達出來,以及如何讓計算機在基礎上進行推理,典型技術包括本體、語義網(wǎng)以及知識圖譜。建設一個實用的知識圖譜并不是一件簡單的事兒,需要人們將已有的知識進行體系方面的梳理,再用屬性、關系等方式描述,目前像 Google、微軟這樣的巨頭企業(yè)已經(jīng)著手建設自己的知識圖譜,可以預料的是人工智能的進一步發(fā)展定會依賴于各行各業(yè)知識圖譜的建設。
深度學習雖好用,但說***?大錯特錯
長期以來,視覺和自然語言處理原本是兩個獨立的學科,深度學習將兩者有機相連,為彼此帶來了突飛猛進的發(fā)展。對圖像、視頻的理解從簡單的獨立標簽到連貫的自然語言描述,深度學習只用了幾年。
深度學習賦予了單一維度圖片數(shù)據(jù)、以及二維視頻數(shù)據(jù)更強的被理解、被識別的能力。這次人工智能熱潮讓“深度學習”廣泛傳播,有的人認為深度學習是實現(xiàn)人工智能的***武器,***的程度不可想象。對此筆者專門在采訪中向劉譯璟咨詢了深度學習是否真的有那么神奇。
深度學習作為機器學習的一種,可以算作是連接主義的一種方法,但并不是所有的方法,這種方法只能解決的是歸納,完成歸納設計,這也是***的局限。我們知道深度學習需要海量樣本進行訓練,例如AlphaGO的自我對局,如果學習的樣本越多,效果就會越好;而且深度學習的層數(shù)越多、特征越多,需要的數(shù)據(jù)量就越大。但在真實的業(yè)務場景中,真的有這么多數(shù)據(jù)嗎?
例如圍棋、游戲這種不需要多次重復的場景,可以在短時間內(nèi)完成數(shù)據(jù)的積累,但現(xiàn)實中我們面對的是投資理財、災害評估這些場景,數(shù)據(jù)在少得可憐的情況下,又能怎樣做?即使能夠積累足夠的數(shù)據(jù),時間的長短也很難把握,在這些場景下,深度學習是無能為力的。
劉譯璟補充道:“隨著學習的深入,深度學習在技術方面的局限還會有很多,歸根到底深度學習是一個優(yōu)化問題,這個優(yōu)化用怎樣的方法還亟待選擇。例如,隨機梯度下降的方法,訓練時間很長,消耗的資源也很多,很難用到現(xiàn)實中迅速需要做出決策的場景中,是否有一些新的優(yōu)化技術?有沒有一些像量子力學的計算方法可以讓這件事情做得更快,這也是目前很大的局限之一。”
此外,深度學習是一種端到端的學習方式,以神經(jīng)網(wǎng)絡著稱,從輸入到輸出是一個完全自動的過程,不可解釋和缺乏反饋機制又成了局限。簡單來說,我們既不知道模型學到了什么,也不知道它歸納出了什么,更無法將得到的結(jié)果舉一反三,我們還無法對學習到的知識進行評估并優(yōu)化……“深度學習是一個很好的工具,至少在某些領域里很好,但深度學習只是很小的一個技術點,離實現(xiàn)人工智能還很遙遠。”劉譯璟總結(jié)道。
邊緣計算或成為人工智能落地的技術支持
如今,“萬物上云”已經(jīng)成為企業(yè)競相追逐的焦點。將各個終端數(shù)據(jù)匯總在云端進行集中建模來實現(xiàn)人工智能的部分技術,事實證明確實不靠譜。簡單來說,數(shù)據(jù)匯總到云端還是存在隱私泄露危險的,無疑帶來了數(shù)據(jù)安全以及法律道德等諸多問題,增加了行業(yè)風險;像自動駕駛以及智能語音等應用的落地,存在快速的響應的問題,云端這種部署確實很難達到;此外,云端建模的方式也會極大影響效率,根本在于應對個性化的終端以及數(shù)據(jù),這種方式很難Hold,分分鐘bug叢生。
如何解決人工智能云端部署,劉譯璟表示可以采用集中式建模(云計算)+ 微建模(邊緣計算)結(jié)合的方式進行歷史和現(xiàn)場建模的同步實現(xiàn)。邊緣計算可以對一些簡單問題進行自處理并將結(jié)果上傳云端,也就是說邊緣計算是云計算的“縮小+加持”版本,可理解為是靠近設備的小型數(shù)據(jù)中心,這或許會成為人工智能在商業(yè)應用落地重要的技術支持。
談及百分點對人工智能的布局,劉譯璟表示,百分點從2009年就已經(jīng)在利用人工智能技術,致力于自然語言處理、知識圖譜方面的推進。如今會更多強調(diào)自然交互,完成產(chǎn)品在各種場景使用的需求,例如新發(fā)布的智能交互分析引擎,現(xiàn)在的數(shù)據(jù)分析技術確實還需要更多的專業(yè)性要求,百分點希望解決的是從非常模糊的語義到精確的計算機操作,這種過程的轉(zhuǎn)變,為此會在自然交互領域的研發(fā)投入更大的精力。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】