單個神經(jīng)元通過預(yù)測未來活動來學(xué)習(xí),有助于解釋大腦是如何工作的
幾個世紀(jì)以來,人類一直在試圖了解大腦是如何工作的,以及它是如何獲取信息的。雖然神經(jīng)科學(xué)家現(xiàn)在已經(jīng)很好地了解了大腦的不同部分是如何工作的以及它們的功能是什么,但仍有許多問題沒有得到解答。因此,仍然缺乏統(tǒng)一的神經(jīng)科學(xué)理論。
近年來,計算機(jī)科學(xué)家一直在嘗試創(chuàng)建出能夠人工重建人腦功能和過程的計算工具。
加拿大萊斯布里奇大學(xué)(University of Lethbridge)的研究人員最近進(jìn)行了一項研究,調(diào)查單個神經(jīng)元如何學(xué)習(xí)和預(yù)測未來。表明單個神經(jīng)元預(yù)測其未來活動的能力可以提供一種新的學(xué)習(xí)機(jī)制。
該研究結(jié)果以「Neurons learn by predicting future activity」為題,于 2 月 25 日發(fā)表在《Nature Machine Intelligence》上。
「神經(jīng)科學(xué)現(xiàn)在所處的階段和生物學(xué)在達(dá)爾文之前所處的階段一樣,」該研究的研究人員之一 Artur Luczak說。「它有無數(shù)詳細(xì)的觀察結(jié)果,但沒有一個理論可以解釋它們之間的聯(lián)系。因此,神經(jīng)科學(xué)的一大任務(wù)是找到統(tǒng)一的原則來解釋大腦是如何工作的。我們的工作旨在為這一探索做出貢獻(xiàn)?!?/p>
更好地理解大腦使用的學(xué)習(xí)算法可能是發(fā)展統(tǒng)一的大腦功能理論的核心。研究大腦學(xué)習(xí)機(jī)制的主要方法有兩種:(1)實驗性的,神經(jīng)元活動的持續(xù)變化是由特定干預(yù)引起的;(2)計算性的,開發(fā)算法以實現(xiàn)特定的計算目標(biāo),同時仍然滿足選定的目標(biāo)生物限制。
在這篇文章中,研究人員探索了一個額外的選項(3)理論推導(dǎo),其中學(xué)習(xí)規(guī)則來自基本的細(xì)胞原理,即來自最大化細(xì)胞的代謝能量。
有多種證據(jù)表明大腦是作為一個預(yù)測系統(tǒng)運(yùn)作的。然而,關(guān)于如何在大腦中實現(xiàn)精確的預(yù)測編碼仍然存在爭議。大多數(shù)提出的模型假設(shè)一個預(yù)測電路,但研究人員提出了一個替代方案,其中神經(jīng)元中有一個內(nèi)部預(yù)測模型。建議使用預(yù)測學(xué)習(xí)規(guī)則的單個神經(jīng)元可以提供一個基本單元,從中可以構(gòu)建各種預(yù)測性大腦。
有趣的是,研究人員提出的預(yù)測學(xué)習(xí)規(guī)則也可以通過修改時間差異學(xué)習(xí)算法來獲得,使其在生物學(xué)上更合理。時間差異學(xué)習(xí)是關(guān)于如何在大腦中實現(xiàn)類似反向傳播的算法的最有希望的想法之一。它基于使用神經(jīng)元活動的差異來近似自上而下的誤差信號。這種算法的一個典型例子是對比赫布(Hebbian)學(xué)習(xí),它被證明在某些假設(shè)下等同于反向傳播。
圖示:算法的基礎(chǔ)。(來源:論文)
預(yù)測學(xué)習(xí)規(guī)則和對比赫比學(xué)習(xí)對比 Hebbian 學(xué)習(xí)算法要求網(wǎng)絡(luò)在兩個獨(dú)立的學(xué)習(xí)階段收斂到穩(wěn)態(tài)平衡,因此必須呈現(xiàn)兩次完全相同的刺激。然而,在實際大腦中不太可能出現(xiàn)這種情況。在這里,研究人員建議通過將兩個活動階段合二為一來解決這個問題,這是受到皮層感覺處理的啟發(fā)。
這里的新見解是,最初的自下而上活動足以讓神經(jīng)元預(yù)測自由相活動的穩(wěn)態(tài)部分,然后可以將預(yù)測的自由相和鉗制相(clamped phase)之間的不匹配用作教學(xué)信號。
為了驗證神經(jīng)元能否正確預(yù)測未來的自由相活動,研究人員仔細(xì)研究了樣本神經(jīng)元。研究表明預(yù)測學(xué)習(xí)規(guī)則運(yùn)作良好,每個神經(jīng)元準(zhǔn)確地預(yù)測了其未來的活動。
圖示:預(yù)期活動的神經(jīng)元預(yù)測。(來源:論文)
此外,還在多個其他網(wǎng)絡(luò)架構(gòu)中測試了預(yù)測學(xué)習(xí)規(guī)則,這些架構(gòu)旨在反映生物神經(jīng)元網(wǎng)絡(luò)的其他方面。研究表明所提預(yù)測學(xué)習(xí)規(guī)則在各種生物驅(qū)動的網(wǎng)絡(luò)架構(gòu)中表現(xiàn)良好。
圖示:在多層卷積神經(jīng)網(wǎng)絡(luò)中實現(xiàn)預(yù)測學(xué)習(xí)規(guī)則。(來源:論文)
清醒動物的預(yù)測學(xué)習(xí)規(guī)則驗證為了測試真正的神經(jīng)元是否也可以預(yù)測它們未來的活動,研究人員分析了來自清醒大鼠聽覺皮層的神經(jīng)元記錄。作為刺激,呈現(xiàn)了六個音調(diào),每個音調(diào)長 1 秒,并穿插 1 秒的靜默,連續(xù)重復(fù)超過 20 分鐘。對于六種音調(diào)中的每一種,分別計算了平均起始和偏移響應(yīng),為每個神經(jīng)元提供了 12 種不同的活動曲線。對于每個刺激,15-25 ms 時間窗口中的活動用于預(yù)測 30-40 ms 窗口內(nèi)的平均未來活動。
圖示:預(yù)測皮層神經(jīng)元的未來活動。(來源:論文)
研究表明神經(jīng)元具有可預(yù)測的動態(tài),并且從最初的神經(jīng)元反應(yīng),可以估計它們未來的活動。然而,通過預(yù)測皮質(zhì)活動的長期變化提供了支持學(xué)習(xí)規(guī)則的更有力的證據(jù)。重要的是,根據(jù)所提模型,可以推斷出哪些單個神經(jīng)元會增加,哪些神經(jīng)元會降低其放電率。
圖示:模型和皮質(zhì)神經(jīng)元中神經(jīng)元活動的長期變化。(來源:論文)
該研究可能對神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域產(chǎn)生許多有趣的影響??傮w而言,他們的研究結(jié)果表明,支持單個神經(jīng)元功能的預(yù)測機(jī)制可能在學(xué)習(xí)中發(fā)揮關(guān)鍵作用。
「在未來,這個想法還可能有助于創(chuàng)建更強(qiáng)大的人工神經(jīng)網(wǎng)絡(luò)來解決具有挑戰(zhàn)性的現(xiàn)實生活問題,」Luczak 說?!肝蚁嘈盼覀児嫉念A(yù)測學(xué)習(xí)規(guī)則是朝著找到統(tǒng)一的大腦理論邁出的重要一步。然而,實現(xiàn)這一目標(biāo)還需要更多的步驟,我們很高興能繼續(xù)這一旅程?!?/p>
論文鏈接:https://www.nature.com/articles/s42256-021-00430-y