偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

圖靈獎(jiǎng)得主Judea Pearl談:不能只靠數(shù)據(jù)

人工智能 機(jī)器學(xué)習(xí)
近日,圖靈獎(jiǎng)獲得者、著名計(jì)算機(jī)科學(xué)家和哲學(xué)家 Judea Pearl 發(fā)布了一篇短論文,從便利性、透明度、可解釋性三個(gè)角度談了他對(duì)激進(jìn)經(jīng)驗(yàn)主義和機(jī)器學(xué)習(xí)研究的思考。

 [[412443]]

在當(dāng)前的人工智能研究社區(qū),以數(shù)據(jù)為中心的方法占據(jù)了絕對(duì)的主導(dǎo)地位,并且這類(lèi)方法也確實(shí)成就非凡,為語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等重要任務(wù)都帶來(lái)了突破性的進(jìn)展。即便如此,也一直有研究者在思考這類(lèi)方法的不足之處以及其它方法的重要價(jià)值。近日,圖靈獎(jiǎng)獲得者、著名計(jì)算機(jī)科學(xué)家和哲學(xué)家 Judea Pearl 發(fā)布了一篇短論文,從便利性、透明度、可解釋性三個(gè)角度談了他對(duì)激進(jìn)經(jīng)驗(yàn)主義和機(jī)器學(xué)習(xí)研究的思考。

論文鏈接:https://ftp.cs.ucla.edu/pub/stat_ser/r502.pdf

在這篇論文中,Judea Pearl 將沿便利性、透明度和可解釋性三個(gè)維度對(duì)比用于數(shù)據(jù)科學(xué)的「數(shù)據(jù)擬合(data fitting)」與「數(shù)據(jù)解釋?zhuān)╠ata interpreting)」方法?!笖?shù)據(jù)擬合」方法的信念源自研究者相信理性決策就隱藏在數(shù)據(jù)本身之中。相較而言,數(shù)據(jù)解釋學(xué)派卻并不將數(shù)據(jù)視為唯一的知識(shí)來(lái)源,而是一種用于解讀現(xiàn)實(shí)的輔助手段——這里的「現(xiàn)實(shí)」是指生成數(shù)據(jù)的過(guò)程。文章將在因果邏輯的指引下,探討擬合與解釋在任務(wù)方面的共生關(guān)系,以此讓數(shù)據(jù)科學(xué)恢復(fù)平衡。

模擬進(jìn)化與數(shù)據(jù)科學(xué)

我最近參加了一個(gè)講座,演講者這樣總結(jié)了機(jī)器學(xué)習(xí)的哲學(xué)思想:「所有知識(shí)均源自所觀察到的數(shù)據(jù),有些直接來(lái)自感官經(jīng)驗(yàn),有些則來(lái)自通過(guò)文化或基因方式傳遞給我們的非直接經(jīng)驗(yàn)?!?/p>

觀眾會(huì)覺(jué)得這樣的稱(chēng)述是不證自明的,其也為該演講奠定了基調(diào),即可以如何通過(guò)檢查數(shù)據(jù)中條件概率的模式來(lái)分析「知識(shí)」的本質(zhì)。很自然,它沒(méi)有涉及到「外部世界」、「理論」、「數(shù)據(jù)生成過(guò)程」、「因果」、「能動(dòng)性」和「心智構(gòu)造」等概念,因?yàn)閺谋砻嫔峡?,如有需要,這些概念也能在數(shù)據(jù)中找到。換句話(huà)說(shuō),不管人類(lèi)在解釋數(shù)據(jù)時(shí)會(huì)用到什么概念,比如有關(guān)來(lái)源的文化、科學(xué)或基因上的概念,都可以追溯到讓這些概念有存在價(jià)值的初始感覺(jué)經(jīng)驗(yàn)并且還能從這些感官經(jīng)驗(yàn)重新推衍出來(lái)。

從人工智能的角度看,這種以數(shù)據(jù)為中心的哲學(xué)為機(jī)器學(xué)習(xí)研究提供了一種有吸引力的乃至極具誘惑力的研究前景:為了開(kāi)發(fā)人類(lèi)水平的智能機(jī)器,我們應(yīng)該僅遵循我們祖先獲得智能的方式,將我們可能收集到的所有數(shù)據(jù)用作輸入,在數(shù)字機(jī)器上同時(shí)模擬基因進(jìn)化和文化進(jìn)化。在極端情況下,這樣的前景可能激發(fā)出相當(dāng)未來(lái)主義和雄心勃勃的情形:從一個(gè)類(lèi)似原始生物(比如變形蟲(chóng))的簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)開(kāi)始,讓它與環(huán)境交互,變異并產(chǎn)生后代,給予其足夠的時(shí)間,它最終就能獲得愛(ài)因斯坦水平的智能。事實(shí)上,除了神圣的經(jīng)文和神明的啟示,如果沒(méi)有自古以來(lái)一直沖擊著人類(lèi)種族的原始數(shù)據(jù)流(當(dāng)然也包括人類(lèi)之前那些更原始的生物獲得的感官輸入),愛(ài)因斯坦又能從其它什么地方獲得他的知識(shí)、才能和智慧呢?

在問(wèn)這樣的前景有多現(xiàn)實(shí)之前,我們先在討論之前看兩個(gè)觀察所知的情況:

1. 模擬進(jìn)化,不管是哪種具體形式,事實(shí)上都引領(lǐng)著當(dāng)前大多數(shù)機(jī)器學(xué)習(xí)研究的主要范式,尤其是那些涉及到連接主義、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的范式。這些技術(shù)可以部署無(wú)模型的、基于統(tǒng)計(jì)學(xué)的學(xué)習(xí)策略。這些策略在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自動(dòng)駕駛汽車(chē)等應(yīng)用中已經(jīng)取得了亮眼的成功。這樣的成功激發(fā)了對(duì)這些策略的充分性和無(wú)限潛力的希望,同時(shí)也削弱了人們對(duì)基于模型的方法的興趣。

2. 以數(shù)據(jù)為中心的發(fā)展方向的思想根基深深根植于西方哲學(xué)的經(jīng)驗(yàn)主義分支。該哲學(xué)分支認(rèn)為:感官體驗(yàn)是我們所有概念和知識(shí)的最終來(lái)源,而「先天觀念」和「理性」在作為知識(shí)來(lái)源方面僅能發(fā)揮少許作用,乃至毫無(wú)作用。經(jīng)驗(yàn)主義思想可以追溯到古代亞里士多德的著作,但將經(jīng)驗(yàn)主義發(fā)揚(yáng)光大的則是英國(guó)經(jīng)驗(yàn)主義哲學(xué)家弗朗西斯 · 培根、約翰 · 洛克、喬治 · 貝克萊和大衛(wèi) · 休謨以及更近期的哲學(xué)家查爾斯 · 桑德斯 · 皮爾士(Charles Sanders Peirce)和威廉 · 詹姆斯(William James)。事實(shí)上,現(xiàn)代連接主義已被視為激進(jìn)經(jīng)驗(yàn)主義相對(duì)于理性主義的一大勝利。實(shí)際上,在數(shù)字機(jī)器上模擬知識(shí)習(xí)得過(guò)程的能力提供了非常靈活的測(cè)試平臺(tái),可讓人通過(guò)在數(shù)字機(jī)器上執(zhí)行實(shí)驗(yàn)來(lái)評(píng)估有關(guān)經(jīng)驗(yàn)主義和天賦能力(innateness)之間平衡的理論。

盡管測(cè)試哲學(xué)理論有其好處,但對(duì)于為機(jī)器學(xué)習(xí)研究遵循激進(jìn)經(jīng)驗(yàn)主義議程的思想,我有三個(gè)主要的保留意見(jiàn)。我將通過(guò)三個(gè)論點(diǎn)來(lái)說(shuō)明為什么經(jīng)驗(yàn)主義應(yīng)該與基于模型的科學(xué)的原理保持平衡。而對(duì)于基于模型的科學(xué),學(xué)習(xí)過(guò)程受兩大信息來(lái)源指引:(a) 數(shù)據(jù),(b) 人工設(shè)計(jì)的有關(guān)數(shù)據(jù)生成方式的模型。

我將這三個(gè)論點(diǎn)標(biāo)記為:(1) 便利性、(2)透明度、(3)可解釋性。將在下文逐一討論它們:

便利性

進(jìn)化是一個(gè)過(guò)于緩慢的過(guò)程,因?yàn)榇蠖鄶?shù)突變都是無(wú)用乃至有害的,并且等待自然選擇區(qū)分并從無(wú)用突變中過(guò)濾出有用突變往往也具有難以承受的成本。大量機(jī)器學(xué)習(xí)任務(wù)都需要對(duì)稀疏的新數(shù)據(jù)進(jìn)行快速解讀并快速響應(yīng),而這些新數(shù)據(jù)又實(shí)在過(guò)于稀疏,以至于無(wú)法通過(guò)隨機(jī)突變來(lái)過(guò)濾。新冠疫情的爆發(fā)就是這一情況的完美例證:來(lái)自不可靠和各式各樣來(lái)源的稀疏數(shù)據(jù)需要快速解讀和快速行動(dòng),它們主要基于之前的流行病傳播和數(shù)據(jù)生成模型??傮w而言,機(jī)器學(xué)習(xí)技術(shù)有望利用大量已經(jīng)存在的科學(xué)知識(shí),結(jié)合可以收集到的數(shù)據(jù),從而解決健康、教育、生態(tài)和經(jīng)濟(jì)等領(lǐng)域的關(guān)鍵社會(huì)問(wèn)題。

更重要的是,科學(xué)知識(shí)可通過(guò)主動(dòng)引導(dǎo)數(shù)據(jù)和數(shù)據(jù)源的選擇或過(guò)濾過(guò)程來(lái)加快進(jìn)化速度。選擇使用哪些數(shù)據(jù)或運(yùn)行哪些實(shí)驗(yàn)前,需要從理論上假設(shè)性地考慮每種選擇會(huì)得到怎樣的結(jié)果以及它們?cè)谖磥?lái)提升性能的可能性。舉個(gè)例子,為了提供這樣的預(yù)期,可使用因果模型,其既能預(yù)測(cè)假設(shè)性操作的結(jié)果,也能預(yù)測(cè)違反事實(shí)情況地撤銷(xiāo)過(guò)去事件的后果。

透明度

為了最終能使用世界知識(shí)(即便是自原始數(shù)據(jù)自發(fā)演化而來(lái)的世界知識(shí)),我們必須以某種機(jī)器形式對(duì)其進(jìn)行編譯和表征。編譯知識(shí)的目的是將發(fā)現(xiàn)過(guò)程分?jǐn)偟皆S多推理任務(wù)上,從而無(wú)需重復(fù)這個(gè)過(guò)程。然后,編譯后的表征有助于高效地得到許多選擇性決策問(wèn)題的答案,包括有關(guān)如何收集額外數(shù)據(jù)的方式的問(wèn)題。某些表征允許這樣的推理,另一些則不允許。《為什么:關(guān)于因果關(guān)系的新科學(xué)》一書(shū)中提出的因果關(guān)系層級(jí)(adder of Causation)形式化地定義了用于回答有關(guān)假設(shè)性干預(yù)和 / 或解釋以及反事實(shí)的問(wèn)題所需的知識(shí)內(nèi)容的類(lèi)型。

知識(shí)編譯涉及到抽象和重新格式化。前者允許損失信息(正如圖像模型歸納為數(shù)值方程的情況),而后者會(huì)保留信息內(nèi)容,只是會(huì)將一些信息從隱式轉(zhuǎn)變成顯式的表征。舉一個(gè)經(jīng)典的例子:信號(hào)波形的頻譜表示。從信息角度看,前者等價(jià)于后者,但頻譜明確表示了信號(hào)的特定方面。

這些需要考慮之處要求我們研究所編譯的表征的數(shù)學(xué)性質(zhì)、它們的內(nèi)在局限性、它們支持的推理類(lèi)型以及它們?cè)诘玫剿鼈兤谕玫降拇鸢干系男Ч?。用更具體的術(shù)語(yǔ)說(shuō),機(jī)器學(xué)習(xí)研究者也應(yīng)該參與現(xiàn)在被稱(chēng)為「因果建模(causal modelling)」的研究,并使用因果科學(xué)的工具和原則來(lái)指導(dǎo)數(shù)據(jù)探索和數(shù)據(jù)解釋過(guò)程。

可解釋性

不管積累、發(fā)現(xiàn)或存儲(chǔ)因果知識(shí)的方式如何,由知識(shí)推動(dòng)實(shí)現(xiàn)的推理都要交付給人類(lèi)用戶(hù)并讓其獲益?,F(xiàn)如今,這些用途包括政策評(píng)估、個(gè)人決策、生成解釋、分配功勞和責(zé)罰或廣義地認(rèn)知我們周?chē)氖澜?。因此,所有推理都必須用一種與人們自身組織世界知識(shí)的方式相匹配的語(yǔ)言進(jìn)行描述,也即因果的語(yǔ)言。因此,不管機(jī)器學(xué)習(xí)研究者為數(shù)據(jù)擬合采用了怎樣的方法,他們都必須熟練掌握這種對(duì)用戶(hù)友好的語(yǔ)言、其語(yǔ)法、其普遍規(guī)則以及人們解讀或誤讀機(jī)器學(xué)習(xí)算法發(fā)現(xiàn)的功能的方式。

結(jié)論

將人類(lèi)知識(shí)的內(nèi)容與其感官數(shù)據(jù)來(lái)源等同起來(lái)是錯(cuò)誤的。對(duì)于知識(shí)的特征描述而言,知識(shí)存儲(chǔ)于心智(或計(jì)算機(jī))中的格式及(尤其是)其隱式與顯式組分的平衡是與其內(nèi)容或來(lái)源一樣重要的。

盡管激進(jìn)經(jīng)驗(yàn)主義可能是進(jìn)化過(guò)程的一個(gè)有效模型,但它對(duì)機(jī)器學(xué)習(xí)研究而言卻是一個(gè)糟糕的策略。它讓以數(shù)據(jù)為中心的思潮大行其道,而這一思潮當(dāng)前主導(dǎo)了統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)文化。這一思潮認(rèn)為:理性決策的秘訣僅在于數(shù)據(jù)。

「數(shù)據(jù)擬合」和「數(shù)據(jù)解釋」平衡的混合策略能更好地讓我們把握進(jìn)化過(guò)程所需的知識(shí)編譯的各個(gè)階段。 

 

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2021-01-04 15:17:17

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2010-01-11 10:36:15

2021-09-23 09:35:00

編程技能開(kāi)發(fā)

2024-10-14 13:45:00

AI模型

2022-10-17 15:04:40

量子計(jì)算

2021-09-02 16:10:21

人工智能機(jī)器學(xué)習(xí)技術(shù)

2020-07-31 09:42:18

AI 數(shù)據(jù)人工智能

2021-11-23 09:34:50

深度學(xué)習(xí)編程人工智能

2025-04-17 09:10:00

人工智能智能體數(shù)據(jù)

2011-03-03 21:12:47

圖靈獎(jiǎng)人才

2021-06-04 15:39:03

深度學(xué)習(xí)編程人工智能

2012-11-23 09:42:11

2019-10-15 05:15:00

深度學(xué)習(xí)人工智能AI

2021-02-25 15:40:21

深度學(xué)習(xí)編程人工智能

2020-12-24 13:08:33

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2023-04-25 13:46:42

AI開(kāi)源

2023-05-08 15:22:00

AI研究

2023-12-27 13:46:00

2023-05-04 10:05:30

離職谷歌

2023-04-04 14:24:25

深度學(xué)習(xí)技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)