百年微分方程難題被解決!神經(jīng)元相互作用方式有了解析解描述,作者:可以模擬大腦動力學了 | MIT
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
困擾數(shù)學家百年的微分方程難題,被MIT解決了!
這個微分方程可以用來模擬神經(jīng)元間通過突觸的相互作用方式,換言之就是大腦傳遞信息的過程?,F(xiàn)實生活中有諸多應用場景,比如自動駕駛、大腦和心臟的監(jiān)測等。
然而,以前求解這個微分方程的過程比較復雜,計算量還會隨著數(shù)據(jù)的增加而暴增——
模擬幾個神經(jīng)元之間的信息傳遞還好。但如果像人腦一樣,有幾百億個神經(jīng)元、幾百萬億個突觸呢?
現(xiàn)在,研究人員終于找到了這個微分方程的近似解析解,一下子將計算速度提升了好幾倍。
要知道,論文第一作者表示,從1907年以來,就一直沒有人能找到這個微分方程的解析解。
牽一發(fā)而動全身,論文第一作者還放話稱:
由數(shù)十億個神經(jīng)元和數(shù)萬億個突觸組成的大腦動力學,我們現(xiàn)在也可以模擬了!
還有網(wǎng)友表示:
這將會改善神經(jīng)網(wǎng)絡對大規(guī)模數(shù)據(jù)計算的適應能力。點個贊!
相關論文已發(fā)表在最新一期的Nature MI上,立刻引發(fā)了不少關注:
到底是什么樣的一個數(shù)學難題,能夠讓網(wǎng)友產(chǎn)生這樣大的反應,一起來看看~
解決了一個什么樣的難題?
這次MIT的突破,在于找到了兩個神經(jīng)元之間通過突觸相互作用微分方程的近似解析解。
突觸,即一個神經(jīng)元的沖動傳到另一個神經(jīng)元或另一細胞間的相互接觸的結(jié)構(gòu)。兩個神經(jīng)元之間神經(jīng)沖動,則是由突觸前末梢,傳遞給突觸后神經(jīng)元的。
要模擬神經(jīng)元間通過突觸相互作用的過程,就需要模擬傳導的動作電位。
MIT研究人員先是用去年做出來的“液體”神經(jīng)網(wǎng)絡 (Liquid Time-constant Networks,簡稱LTC)模擬了這一現(xiàn)象。
如下圖,x(t)就是研究希望求解的突觸后神經(jīng)元電位,但之前它需要通過直接求解微分方程來計算,也就是圖中左邊的一大堆方程:
BUT,他們很快發(fā)現(xiàn),LTC神經(jīng)網(wǎng)絡模型雖然模擬得好,但常微分方程(ODE)計算還是不夠快,通常需要結(jié)合ODE求解器來搞定。
即通過左邊的一堆公式,雖然在給定時間t的情況下也能算出x(t)來,但它不僅算得慢,而且誤差還會隨著求解過程中的迭代計算一步步被放大。
但如果能求出x(t)的解析解,也就是求出等式右邊不包含x(t)這個變量的公式,那么計算效率就能得到成倍的提升。
然而,求解這個常微分方程dv/dt=?glv(t)+S(t)的方法,從1907年提出以來還沒有人求出過它的解析解。
在通過一番計算后,研究人員終于得出了這個微分方程的近似解析解,能很好地近似出x(t)的數(shù)值:
最關鍵的是解析解能“一步到位”地求出結(jié)果,研究人員表示這比正常求微分方程模型快上1~5倍。
依靠這個新的近似解析解,研究人員提出了一種名叫CfC (closed-form continuous-depth networks,閉式連續(xù)深度神經(jīng)網(wǎng)絡)的模型,進一步提升了計算效率、降低了微分方程求解帶來的近似誤差(approximation error)。
求解出來與原微分方程的相似度也極高:
所以CfC的提出,究竟解決了什么問題?
作者:下一步建立大腦計算模型
提到CfC的作用,還得先說回它的基礎,也就是MIT去年建立的“液體”神經(jīng)網(wǎng)絡(LTC)。
△圖源:MIT
當時“液體”神經(jīng)網(wǎng)絡的提出,是用于簡化如視頻處理、金融數(shù)據(jù)和醫(yī)療診斷這類與連續(xù)時間強相關的問題計算。
這類問題往往與時間的相關度很高,這也導致它們的變化情況難以預測,往往需要求解非常復雜的偏微分方程。
“液體”神經(jīng)網(wǎng)絡就是為了解決這一點出現(xiàn)的,確實也提升了這類場景的計算效率。
然而,建立“液體”神經(jīng)網(wǎng)絡的靈感雖然來自小物種的大腦,具有很強的靈活性和適應能力,不過計算量仍然不算低——
一旦增加神經(jīng)元和突觸的數(shù)量,計算機可能就因為數(shù)據(jù)計算量過大“撐不住”了。
這不,今年MIT就帶著CfC神經(jīng)網(wǎng)絡來了!
與“Liquid”神經(jīng)網(wǎng)絡相比,CfC可謂去粗取精,它既保留了“Liquid”網(wǎng)絡的靈活、因果、穩(wěn)定和可解釋性,同時數(shù)量級更快、可擴展性更高。
換句話說,就是CfC更快更強了,而這也意味著它能夠適用于更多任務。
論文中的測試結(jié)果顯示,CfC在一系列任務中表現(xiàn)都要優(yōu)于SOTA神經(jīng)網(wǎng)絡。
比如說在一項醫(yī)學預測任務中,對8000名患者進行抽樣調(diào)查,新模型的速度要比連續(xù)潛伏模型快220倍。
其中,CfC在從運動傳感器識別人類活動、建立模擬步行機器人的物理動力學模型以及基于事件的連續(xù)圖像處理方面具有相當高的加速度和性能。
而這對應到現(xiàn)實的實際應用,就是無人駕駛、無人機導航或者各類預測任務。
值得一提的是,據(jù)MIT消息,此前也已有證據(jù)證明,CfC神經(jīng)網(wǎng)絡能夠在沒有額外學習的情況下將所學技能遷移到一個全新的環(huán)境中,這恰恰是人工智能研究最基本的挑戰(zhàn)之一。
(沒錯,CfC也是不容小覷的)
這一步研究團隊解決了神經(jīng)元之間如何相互作用的描述,那下一步準備干啥?他們立了個flag:
希望通過測量數(shù)百萬個神經(jīng)元連接,建立大腦動力學模型。
論文的第一作者,同時也是MIT CSAIL研究所附屬機構(gòu)的Ramin Hasani也表示:
一旦我們對神經(jīng)元和突觸的聯(lián)系有了一個解析解描述,我們就可以用數(shù)十億個細胞建立大腦的計算模型了。
據(jù)神經(jīng)學家估計,人腦神經(jīng)元數(shù)量在1000億個左右,不知道團隊是否會挑戰(zhàn)“模擬人類大腦”這一難題(手動狗頭)。
目前CfC模型已經(jīng)開源,想要拿它用來模擬一些問題計算的小伙伴,可以去看看了~
CfC項目地址:?https://github.com/raminmh/CfC?
論文地址:
?https://www.nature.com/articles/s42256-022-00556-7