算法的智能化升級讓我們的未來數(shù)字化生活充滿光明
譯文
研究人員當前正在致力于打造一套新的算法版本,旨在為搜索效果提升、自動駕駛汽車、手機智能化升級以及物聯(lián)網(wǎng)發(fā)展提供助力。
作為基于人腦結(jié)構(gòu)的松散化模擬機制,深入學(xué)習(xí)算法已經(jīng)被應(yīng)用在眾多先進技術(shù)當中,包括語音識別、自然語言處理以及機器人自主性運作等等。
現(xiàn)在,研究人員正在對這些算法進行換代研發(fā),希望將其大規(guī)模應(yīng)用于機器學(xué)習(xí)與人工智能領(lǐng)域、甚至可能將其作為此類關(guān)鍵性技術(shù)進步的實現(xiàn)基礎(chǔ)。
Gabriel咨詢公司分析師Dan Olds指出,如果我們將目光投向更為“深刻”的技術(shù)進步——例如能夠自行駕駛、允許乘客省下時間進行休憩或者閱讀的智能汽車,或者可以自主啟動并將我們直接帶至目的地的其它載具——那么深度學(xué)習(xí)算法將是其中必不可少的前提條件與組成部分。
“這些自動駕駛汽車領(lǐng)先‘觀察’到的周邊路況信息及機動性障礙實現(xiàn)安全先進。而更為出色的汽車能夠區(qū)分行人及標志牌內(nèi)容,從而更好地預(yù)測可能出現(xiàn)的突發(fā)性狀況,”Olds解釋道。“此外,智能化升級不僅將影響到我們未來的數(shù)字化生活,同時也會給現(xiàn)實生活帶來重大影響。如果我們能夠利用可信系統(tǒng)處理航班飛行或者駕駛?cè)蝿?wù),從而完成覆蓋全國乃至全世界的貨運任務(wù),結(jié)果會怎樣?如果我們可以在寬大的后座上睡覺,而讓汽車自動完成駕駛?cè)蝿?wù),結(jié)果又會怎樣?”
基本上講,雖然大多數(shù)人甚至根本沒聽說過深度學(xué)習(xí)算法這一概念,但更卓越的算法確實能夠為我們帶來愈加光明的數(shù)字化前景——其中包括更具智能特性的家居環(huán)境、甚至是能夠照顧病人并幫用戶遛狗的機器人產(chǎn)品。
“這類研究成果可以說意義非凡,甚至有可能通過物聯(lián)網(wǎng)及移動技術(shù)等途徑將數(shù)據(jù)驅(qū)動機制拓展至無窮無盡的資源池范疇,”Moor Insights & Strategy公司分析師Patrick Moorhead指出。“盡管大多數(shù)人對此根本聞所未聞,但深度學(xué)習(xí)確實可算是數(shù)字化世界發(fā)展前景當中的核心組成部分。”
Andrew Ng在斯坦福大學(xué)計算機科學(xué)系擔任副教授,同時也是百度公司的***科學(xué)家——這里向外國的讀者朋友解釋一句,百度是中國的一家網(wǎng)絡(luò)服務(wù)企業(yè)、同時也是份額***的中文搜索引擎供應(yīng)商。通過與來自斯坦福大學(xué)及百度公司的其他科學(xué)家進行協(xié)作,Ng目前正潛心打造下一代深度學(xué)習(xí)算法。他在于本周在美國坎布里奇市舉辦的麻省理工學(xué)院技術(shù)回顧EmTech會議上進行了主題演講,透徹解讀了深度學(xué)習(xí)技術(shù)在搜索及未來技術(shù)領(lǐng)域的實際應(yīng)用。
斯坦福大學(xué)計算機科學(xué)系副教授Andrew Ng
他擁有豐富的背景積累,足以支撐起與深度算法相關(guān)的各項工作。Ng曾經(jīng)在谷歌公司效力過一年半,并屬于該公司Google Brain深度學(xué)習(xí)項目的發(fā)起者。
除了谷歌之外,微軟、Facebook以及百度等多家企業(yè)也正在著手開發(fā)更為理想的深度學(xué)習(xí)算法,旨在滿足自身對于大規(guī)模數(shù)據(jù)處理的實際需求。
Ng在接受采訪時指出,此類算法的美妙之處在于當我們將規(guī)模愈發(fā)龐大的數(shù)據(jù)提交給傳統(tǒng)算法時,這些陳舊方案往往開始變得遲鈍、緩慢并最終無法繼續(xù)消化。但深度學(xué)習(xí)算法卻能夠帶來完全不同的使用效果。我們向其提交的數(shù)據(jù)總量越大,得出的分析結(jié)論也就越好。
人類大腦的運作效果之所以如此卓越,是因為其中充斥著大量彼此連通且利用電脈沖實現(xiàn)交流的神經(jīng)元。深度學(xué)習(xí)算法的模仿對象正是人類大腦,旨在建立起一套基于模擬神經(jīng)元的網(wǎng)絡(luò)體系。
“當我們建立起規(guī)模愈發(fā)龐大的人腦模擬體系后,這些模型在吸納大規(guī)模數(shù)據(jù)之后開始表現(xiàn)出相對更高效的處理成果,”Ng解釋道。“這些屬于容量極高的學(xué)習(xí)算法。”
目前工作進展可謂相當迅速。
大約四年之前,規(guī)模***的神經(jīng)網(wǎng)絡(luò)或者深度學(xué)習(xí)算法集合大約擁有1000萬個連接節(jié)點。Ng指的是2011年年初,當時他剛剛開始推進谷歌的Google Brain項目,但如今整套模型當中的連接節(jié)點已經(jīng)激增至10億級別。去年,他與斯坦福大學(xué)的技術(shù)團隊共同構(gòu)建出一套擁有100億個連接節(jié)點的神經(jīng)網(wǎng)絡(luò)模型。
Ng的一部分工作在于提升該算法,但他和他的同事們同時也在積極利用GPU或者叫圖形處理單元來取代傳統(tǒng)CPU或者叫中央處理單元在神經(jīng)網(wǎng)絡(luò)中的核心地位。這些專門針對計算機圖形處理任務(wù)設(shè)計的芯片在實踐活動中顯示出強大的實力,被證明能夠很好地完成大規(guī)模神經(jīng)網(wǎng)絡(luò)的構(gòu)建任務(wù)——這是因為它們更善于處理此類計算工作。
“我們正在利用GPU硬件構(gòu)建起新型深度學(xué)習(xí)平臺,旨在幫助自身更出色地完成規(guī)模擴展工作,”Ng表示。“我們的協(xié)作伙伴包括我自己都是***次接觸到如此規(guī)模的網(wǎng)絡(luò)體系。其它企業(yè)也開始緊跟我們的腳步,但據(jù)我個人了解,目前百度仍然是***家針對深度學(xué)習(xí)構(gòu)建起超大規(guī)模GPU集群的公司。”
如果能讓這些算法迎來更為龐大的容量規(guī)模,應(yīng)該意味著用戶將在語音識別效果以及可視化搜索領(lǐng)域獲得顯著改進。根據(jù)Ng的觀點,這些在技術(shù)領(lǐng)域絕對堪稱歷史性壯舉。
隨著越來越多貧困人口以及低文化群體開始接觸網(wǎng)絡(luò)體系,利用口頭表達而非手動輸入進行搜索查詢工作的用戶群體也將進一步膨脹。除此之外,相對于輸入描述詞匯,直接利用圖片作為搜索目標的用戶也會變得越來越多。
“在未來五年之內(nèi),將有大約半數(shù)查詢請求將通過語音及圖片的形式進行,因此這項技術(shù)也成為我們的主要資源投入對象,”Ng指出。
經(jīng)過改進的語音識別技術(shù)允許司機在駕駛過程中大聲發(fā)出口頭指令,也允許乘客在自己的座位上直接向手機表達自己的需要,而這些內(nèi)容將被準確發(fā)送到對應(yīng)的接收方——例如向朋友匯報稱自己無法按時抵達會合地點。
“盡管整個世界都開始向移動技術(shù)傾斜,我認為仍然沒有哪家廠商能拿出一套真正適合移動設(shè)備的***用戶界面,而其中的核心矛盾在于我們很難在智能手機上利用細小的軟鍵盤方案快速完成輸入,”Ng表示。“語音識別的效果已經(jīng)變得越來越好,但平心而論尚無法達到我們的預(yù)期要求。當其水平改進到足夠程度時,我非常樂意將語音識別作為智能手機設(shè)備上新型用戶界面方案的設(shè)計核心。”
深度泥塑算法還將被用在我們的智能設(shè)備當中,包括智能汽車與可穿戴式技術(shù)——而這一切結(jié)合起來,也就構(gòu)成了物聯(lián)網(wǎng)時代的絕對主體。
“我認為遠程控制方案將在我們的家庭環(huán)境中無處不在,”Ng指出。“如果大家身處家中并打算聽點音樂來放松身心,比起現(xiàn)在掏出手機、解鎖屏幕并按下一大堆虛擬按鈕完成播放的操作,未來我們完全可以躺在沙發(fā)里、用口頭方式讓自己的百度設(shè)備直接播放來自Justin Timberlake的作品。我希望未來自己的孫兒們能夠問我,‘很久以前,大家的家庭設(shè)備真的聽不懂我們的口頭命令嗎?’相信到那個時候,他們肯定不敢相信原先家中需要準備一大堆不同類型的遙控器來操作各種設(shè)備。”















 
 
 






 
 
 
 