AI也有健忘癥?英國(guó)41歲教授專訪:解決災(zāi)難性遺忘
?如何實(shí)現(xiàn)持續(xù)學(xué)習(xí),讓AI不斷片?
近日,來(lái)自羅切斯特大學(xué)的41歲計(jì)算機(jī)科學(xué)家Christopher Kanan在專訪中表示,自己正在構(gòu)建可以讓AI隨著時(shí)間的推移而不斷學(xué)習(xí)的算法——就像我們?nèi)祟愐粯印?/p>

災(zāi)難性遺忘
眾所周知,AI在經(jīng)過(guò)訓(xùn)練之后可以很好地完成「考試范圍內(nèi)」的任務(wù),但是這些算法卻不能像人類那樣不斷用新信息更新知識(shí)庫(kù)。
為了學(xué)習(xí)哪怕是一個(gè)新的東西,算法也必須從頭開(kāi)始訓(xùn)練,而代價(jià)就是忘記它之前已經(jīng)學(xué)習(xí)過(guò)的幾乎所有內(nèi)容。如此帶來(lái)的問(wèn)題就是——「災(zāi)難性遺忘」(Catastrophic Forgetting)。就像你遇到一個(gè)新朋友,你唯一能知道她名字的方法就是重啟你的大腦。
之所以會(huì)出現(xiàn)這種情況,要?dú)w咎于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)新事物的方式。這些算法的學(xué)習(xí)需要改變神經(jīng)元之間的連接強(qiáng)度,然而這同時(shí)也代表了過(guò)去的知識(shí),因此過(guò)多地改變連接就會(huì)導(dǎo)致遺忘。
生物神經(jīng)網(wǎng)絡(luò)已經(jīng)進(jìn)化了數(shù)億年的策略,以確保重要信息保持穩(wěn)定。但是今天的人工神經(jīng)網(wǎng)絡(luò)很難在新舊知識(shí)之間取得良好的平衡。當(dāng)網(wǎng)絡(luò)看到新數(shù)據(jù)時(shí),它們的連接很容易被覆蓋,這可能導(dǎo)致突然而嚴(yán)重的無(wú)法識(shí)別過(guò)去的信息。
1. 您在哲學(xué)方面的學(xué)習(xí)對(duì)你思考研究的方式產(chǎn)生了哪些影響呢?
哲學(xué)教會(huì)你的是,「如何提出合理的論點(diǎn)」和「如何分析他人的論點(diǎn)?」
我的實(shí)驗(yàn)室受到這個(gè)問(wèn)題的啟發(fā):如果我們不能做 X,我們?cè)趺茨茏?Y?
我們會(huì)隨著時(shí)間的推移而學(xué)習(xí),但神經(jīng)網(wǎng)絡(luò)不會(huì),他的知識(shí)量是固定的。那么如果人類未來(lái)要想制造通用人工智能,這是必須解決的基本問(wèn)題。

Kanan的研究筆記
2. 學(xué)術(shù)界目前對(duì)災(zāi)難性遺忘的解決進(jìn)展如何?
目前最成功的方法叫做重放(Replay),這樣可以存儲(chǔ)過(guò)去的知識(shí),然后在訓(xùn)練過(guò)程中用新的數(shù)據(jù)集重放,這樣原始信息就不會(huì)丟失。
這個(gè)方法的靈感來(lái)自我們大腦中的記憶鞏固過(guò)程(Memory Consolidation),睡眠過(guò)程中一天的學(xué)習(xí)的內(nèi)容被重新編碼,并隨著神經(jīng)元激活而被重放。

換句話說(shuō),新的學(xué)習(xí)并不能完全根除算法過(guò)去的知識(shí)。
有三種方法可以實(shí)現(xiàn)這一點(diǎn)。
- 最常見(jiàn)的方法是「真實(shí)回放」,研究人員存儲(chǔ)原始輸入的子集——例如,用于對(duì)象識(shí)別任務(wù)的原始圖像——然后將這些存儲(chǔ)的過(guò)去圖像與學(xué)習(xí)的新圖像混合。
- 第二種方法是重放圖像的壓縮表示。
- 第三種不太常見(jiàn)的方法是「生成回放」。
在這里,人工神經(jīng)網(wǎng)絡(luò)實(shí)際上生成了過(guò)去經(jīng)驗(yàn)的合成版本,然后將該合成示例與新示例混合。我的實(shí)驗(yàn)室專注于后兩種方法。
3. 如果我們能夠徹底解決災(zāi)難性遺忘,這是否意味著人工智能可以隨著時(shí)間的推移不斷學(xué)習(xí)新事物?
不完全是。我認(rèn)為持續(xù)學(xué)習(xí)領(lǐng)域的開(kāi)放性問(wèn)題并不是災(zāi)難性遺忘。
我真正感興趣的是:
過(guò)去的學(xué)習(xí)如何讓未來(lái)的學(xué)習(xí)更有效率?未來(lái)的學(xué)習(xí)如何糾正過(guò)去的學(xué)習(xí)?這些是很少人衡量的東西,我認(rèn)為這樣做是推動(dòng)該領(lǐng)域向前發(fā)展的關(guān)鍵部分,因?yàn)閷?shí)際上,這不僅僅是忘記一些東西,而是關(guān)于如何成為一個(gè)更好的學(xué)習(xí)者。
Christopher Kanan表示:
與現(xiàn)代神經(jīng)網(wǎng)絡(luò)相比,我們的頭腦中發(fā)生的事情肯定要多得多。我們需要建立正確的實(shí)驗(yàn)和算法設(shè)置來(lái)衡量過(guò)去的學(xué)習(xí)是否有助于未來(lái)的學(xué)習(xí)。而目前最大的問(wèn)題是我們沒(méi)有很好的數(shù)據(jù)集來(lái)研究持續(xù)學(xué)習(xí),我們基本上是在使用傳統(tǒng)機(jī)器學(xué)習(xí)中使用的現(xiàn)有數(shù)據(jù)集并將其重新開(kāi)發(fā)。
一般來(lái)說(shuō),機(jī)器學(xué)習(xí)的常規(guī)操作是我們有一個(gè)訓(xùn)練集和一個(gè)測(cè)試集——我們?cè)谟?xùn)練集上訓(xùn)練,在測(cè)試集上進(jìn)行測(cè)試。
但持續(xù)學(xué)習(xí)打破了這些規(guī)則,它讓訓(xùn)練集會(huì)隨著訓(xùn)練者的學(xué)習(xí)而發(fā)展,因此我們需要一個(gè)非常好的持續(xù)學(xué)習(xí)環(huán)境。
4. 理想的持續(xù)學(xué)習(xí)環(huán)境應(yīng)該是什么樣的?
告訴你它不是什么比告訴你是什么更容易。
我可以告訴你它可能具有的屬性。所以現(xiàn)在,讓我們假設(shè)人工智能算法不是模擬中的具身智能。然后至少,理想情況下,我們正在從視頻中學(xué)習(xí),或者類似的東西,比如多模態(tài)視頻流,并希望做的不僅僅是靜態(tài)圖像的分類。
有很多關(guān)于這方面的開(kāi)放性問(wèn)題。幾年前我參加了一個(gè)持續(xù)學(xué)習(xí)研討會(huì),一些像我這樣的人說(shuō),「我們必須停止使用一個(gè)叫做MNIST的數(shù)據(jù)集,它太簡(jiǎn)單了?!谷缓笥腥苏f(shuō),「好吧,那我們就對(duì)星際爭(zhēng)霸進(jìn)行增量學(xué)習(xí)?!?/p>
出于各種原因,我現(xiàn)在也在這樣做,但我認(rèn)為還不足以真正地解決這個(gè)問(wèn)題。畢竟,生活比學(xué)習(xí)玩星際爭(zhēng)霸要豐富得多。
5. 您的實(shí)驗(yàn)室如何嘗試設(shè)計(jì)可隨時(shí)間推移不斷學(xué)習(xí)的算法?
我和我以前的學(xué)生Tyler Hayes一起開(kāi)創(chuàng)了一項(xiàng)有關(guān)類比推理的持續(xù)學(xué)習(xí)研究,這篇文章也同時(shí)發(fā)表在CVPR 2021上。

論文鏈接:https://openaccess.thecvf.com/content/CVPR2021W/CLVision/html/Hayes_Selective_Replay_Enhances_Learning_in_Online_Continual_Analogical_Reasoning_CVPRW_2021_paper.html
我們認(rèn)為這將是研究遷移學(xué)習(xí)(Transfer Learning)理念的好領(lǐng)域,因?yàn)槲覀儸F(xiàn)在需要使用更復(fù)雜的技能來(lái)解決更復(fù)雜的問(wèn)題。
具體來(lái)說(shuō),我們對(duì)后向遷移(Backward Transfer)的數(shù)據(jù)進(jìn)行了測(cè)量,即過(guò)去學(xué)習(xí)的東西在未來(lái)對(duì)你有多大幫助,反之亦然。
我們發(fā)現(xiàn)了很好的遷移證據(jù),比對(duì)象識(shí)別這樣的簡(jiǎn)單任務(wù)重要得多。
6. 你認(rèn)為人工智能真的會(huì)像人類一樣學(xué)習(xí)嗎?
我想他們會(huì)的。許多極具天賦的人在這個(gè)領(lǐng)域朝著這個(gè)目標(biāo)邁進(jìn)。
但我們需要的是創(chuàng)造力。機(jī)器學(xué)習(xí)社區(qū)的很多研究都是在前人研究的基礎(chǔ)上做一些小改進(jìn),真正變革性的研究不多。
但是這一天一定會(huì)到來(lái)的,只是時(shí)間早晚問(wèn)題。
Christopher Kanan
Christopher Kanan是羅切斯特大學(xué)計(jì)算機(jī)科學(xué)的終身副教授。主要的工作方向是深度學(xué)習(xí)的基礎(chǔ)研究,包括持續(xù)學(xué)習(xí),人工智能的偏見(jiàn),醫(yī)學(xué)計(jì)算機(jī)視覺(jué),以及語(yǔ)言引導(dǎo)的場(chǎng)景理解。

Kanan曾從事在線持續(xù)學(xué)習(xí)、視覺(jué)問(wèn)題回答、計(jì)算病理學(xué)、語(yǔ)義分割、物體識(shí)別、物體檢測(cè)、主動(dòng)視覺(jué)、物體跟蹤等工作。除了機(jī)器學(xué)習(xí),他在眼球追蹤、靈長(zhǎng)類動(dòng)物視覺(jué)和理論神經(jīng)科學(xué)方面也有深厚的背景。
在此之前,他是羅切斯特理工學(xué)院(RIT)卡爾森影像科學(xué)中心的一名終身副教授。在職期間,他和同事共同創(chuàng)建了人類意識(shí)人工智能中心(CHAI),并擔(dān)任了四年的副主任。此外,Kanan還曾是康奈爾科技大學(xué)的客座副教授,為每年約100名研究生教授了4年的深度學(xué)習(xí)課程。

Christopher Kanan在俄克拉荷馬州農(nóng)村的一個(gè)小鎮(zhèn)上長(zhǎng)大。
1996年的時(shí)候,他就開(kāi)始探索人工智能了,還在讀高中的Kanan自制了很多「bot」來(lái)玩在線多人計(jì)算機(jī)游戲。
2002年,Kanan考入俄克拉荷馬州立大學(xué)(OSU)主修哲學(xué)和計(jì)算機(jī)科學(xué)雙學(xué)位,并于2004年獲得學(xué)士學(xué)位。
2006年,在南加州大學(xué)(USC)獲得了計(jì)算機(jī)科學(xué)獲得碩士學(xué)位,主要研究人工智能和神經(jīng)科學(xué),并與計(jì)算神經(jīng)科學(xué)和神經(jīng)網(wǎng)絡(luò)的先驅(qū)Michael Arbib一起工作。2013年,在加州大學(xué)圣地亞哥分校(UCSD)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。畢業(yè)后,Kanan又到加州理工學(xué)院從事博士后研究。

參考資料:https://www.quantamagazine.org/the-computer-scientist-trying-to-teach-ai-to-learn-like-we-do-20220802/?






























