這只線蟲(chóng)不簡(jiǎn)單!大腦被高精度還原,可動(dòng)態(tài)蠕動(dòng)前行
最高精度“線蟲(chóng)大腦”,它來(lái)了。
這顆“大腦”所模擬的是一只秀麗隱桿線蟲(chóng)的全生物神經(jīng)系統(tǒng)。
(注:秀麗隱桿線蟲(chóng)是“最簡(jiǎn)單的生命智能體”,擁有302個(gè)神經(jīng)元)
這一次,國(guó)內(nèi)的學(xué)者不僅把秀麗線蟲(chóng)全部的神經(jīng)元網(wǎng)絡(luò)還原了出來(lái),更是細(xì)到了它們的亞細(xì)胞級(jí)連接關(guān)系。
據(jù)了解,它的精細(xì)程度已經(jīng)達(dá)到了當(dāng)前已知的最高水平:
此前,一項(xiàng)研究對(duì)單個(gè)生物神經(jīng)元的計(jì)算復(fù)雜度進(jìn)行了研究,文章指出,一個(gè)深度神經(jīng)網(wǎng)絡(luò)需要 5 到 8 層互聯(lián)神經(jīng)元才能表征單個(gè)生物神經(jīng)元的復(fù)雜度。
而通過(guò)這樣的精細(xì)構(gòu)建的“大腦”,已可以讓這只“智能線蟲(chóng)”完成動(dòng)態(tài)蠕動(dòng)前行。
這,便是來(lái)自北京智源人工智能研究院的最新研究成果,背后的“利器”則是天演項(xiàng)目。
而且這只“智能線蟲(chóng)”——天寶(MetaWorm)1.0的誕生,不僅僅是生命模擬精度上的一次突破,根據(jù)研究團(tuán)隊(duì)的介紹:
這是邁出人造智能生命關(guān)鍵一步。
最高精度大腦,是怎么煉成的?
這次大腦選擇的秀麗隱桿線蟲(chóng),可以說(shuō)是“擁有神經(jīng)系統(tǒng)的最簡(jiǎn)單生物之一”——
它既具有完整的神經(jīng)系統(tǒng),感知逃逸覓食交配都能完成,整體結(jié)構(gòu)又非常簡(jiǎn)單,成蟲(chóng)只有大約1000多個(gè)體細(xì)胞。
就是這只長(zhǎng)約1mm的透明小生物,已經(jīng)是科學(xué)研究界的“??汀?,近20年來(lái)有三次諾貝爾獎(jiǎng)都與它有關(guān)。
對(duì)于神經(jīng)科學(xué)家們來(lái)說(shuō),秀麗隱桿線蟲(chóng)的神經(jīng)系統(tǒng)已經(jīng)被完整破解,實(shí)時(shí)圖譜還登上了當(dāng)年的Nature封面,非常適合用來(lái)研究并模擬“腦回路”。
△雌雄同體,共有302個(gè)神經(jīng)細(xì)胞
更重要的是,線蟲(chóng)體內(nèi)存在的乙酰膽堿、多巴胺等神經(jīng)遞質(zhì),在哺乳動(dòng)物體內(nèi)也同樣存在。
研究它的神經(jīng)系統(tǒng),對(duì)于研究人類神經(jīng)系統(tǒng)的調(diào)控機(jī)制也有重要作用。
但研究結(jié)構(gòu)是一回事,用計(jì)算機(jī)建模又是另一回事了。
要知道,模擬一個(gè)生物的神經(jīng)元可不是簡(jiǎn)單地像卷積那樣,做個(gè)線性變換就完事,它所模擬的(如細(xì)胞間)物質(zhì)交換、神經(jīng)元間動(dòng)作電位的產(chǎn)生和傳導(dǎo)等行為非常復(fù)雜。
例如,僅僅是突觸之間遞質(zhì)的傳遞,就涉及數(shù)量、速度、濃度、反流、方向等多個(gè)參數(shù),用數(shù)學(xué)模型來(lái)計(jì)算模擬還會(huì)更加復(fù)雜。
即便模擬出了完整的神經(jīng)系統(tǒng),如何用計(jì)算機(jī)模擬出接近真實(shí)環(huán)境的“賽博空間”,并在其中訓(xùn)練“智能線蟲(chóng)”模型,又是另一大研究難點(diǎn)。
此前,雖然已經(jīng)有不少團(tuán)隊(duì)在進(jìn)行線蟲(chóng)仿真方面的研究,但無(wú)論是精度、還是仿真環(huán)境都與現(xiàn)實(shí)有一定差距,就像我們常見(jiàn)的仿生機(jī)器魚(yú)遠(yuǎn)達(dá)不到魚(yú)的精度一樣。
這次,天演團(tuán)隊(duì)成功建模出了最高精度的智能“賽博線蟲(chóng)”,實(shí)現(xiàn)了讓它在3D流體仿真環(huán)境下動(dòng)態(tài)蠕動(dòng)前行、并具備簡(jiǎn)單趨利避害的能力。
那么,這只“智能線蟲(chóng)”究竟長(zhǎng)啥樣?
首先,團(tuán)隊(duì)利用大量公式和模型,建模出線蟲(chóng)的“電子神經(jīng)元”。
用到的模型主要有三種:多種離子通道模型、Hodgkin-Huxley模型和多艙室(多房室)模型(Multi-compartment Model)。
其中,多種離子通道模型顧名思義,用于模擬細(xì)胞膜上的各種離子通道,天寶 1.0模型使用了14種離子通道;
Hodgkin-Huxley模型 (HH模型),能將神經(jīng)元的每個(gè)部分都模擬成不同的電路元件;
△HH模型示例,圖片來(lái)源于維基百科—真·生物是一臺(tái)精密的電子儀器
多艙室模型,將神經(jīng)元視為一個(gè)系統(tǒng),按動(dòng)力學(xué)特點(diǎn)分為若干個(gè)艙室,每個(gè)艙室所包含的離子通道數(shù)目也各不相同。
△圖片來(lái)源于江小芳, 劉深泉, 張煦晨著論文《中等多棘神經(jīng)元的多房室模型分析》
這三種模型組合起來(lái),就能將神經(jīng)元的構(gòu)造、神經(jīng)元細(xì)胞膜上動(dòng)作電位和梯度電位的形成與傳導(dǎo)、以及物質(zhì)在各機(jī)體部分間傳導(dǎo)的速率模擬出來(lái)。
施工完成后的這只“智能線蟲(chóng)”,精細(xì)建模了秀麗隱桿線蟲(chóng)(雌雄同體)的302個(gè)神經(jīng)元、以及這些神經(jīng)元之間的數(shù)千個(gè)連接,使用了14種離子通道,細(xì)節(jié)達(dá)到了亞細(xì)胞級(jí)別。
線蟲(chóng)的302個(gè)神經(jīng)元分為感官神經(jīng)元、中間神經(jīng)元和運(yùn)動(dòng)神經(jīng)元等,在這其中,團(tuán)隊(duì)又針對(duì)106個(gè)感知和運(yùn)動(dòng)神經(jīng)元進(jìn)行了高精度建模,高度擬合了它們的電生理動(dòng)力學(xué)。
統(tǒng)計(jì)下來(lái),單個(gè)神經(jīng)元最多艙室(compartment)數(shù)2313個(gè),最少10個(gè)。302個(gè)神經(jīng)元平均每個(gè)52個(gè)艙室。神經(jīng)元之間的突觸連接精細(xì)到神經(jīng)突(樹(shù)突、軸突)的水平:
然后,團(tuán)隊(duì)構(gòu)造了一個(gè)3D流體動(dòng)態(tài)仿真環(huán)境,讓線蟲(chóng)在接近真實(shí)的場(chǎng)景下運(yùn)動(dòng)起來(lái)。
注意,模擬環(huán)境這一步尤為重要,它是研究線蟲(chóng)如何自適應(yīng)微觀環(huán)境運(yùn)動(dòng)方式的關(guān)鍵步驟。
線蟲(chóng)建模精細(xì)到亞細(xì)胞(微米級(jí)別)后,物理定律的尺度都縮小了,摩擦力與粘滯力的作用要比重力大上幾個(gè)數(shù)量級(jí)。
在這種情況下,線蟲(chóng)還能自如地吃飯喝水供能,與其和環(huán)境交互的巧妙方式密不可分。
因此,天演團(tuán)隊(duì)結(jié)合計(jì)算神經(jīng)學(xué)、運(yùn)動(dòng)力學(xué)、圖形學(xué)等多學(xué)科交叉,為智能線蟲(chóng)“天寶”構(gòu)造了逼真的線蟲(chóng)肌肉和身體軟體模型,建立了更適合人工智能體訓(xùn)練的流體仿真環(huán)境。
具體來(lái)說(shuō),這個(gè)環(huán)境框架由包含三維建模、有限元求解、簡(jiǎn)化流體模型、強(qiáng)化學(xué)習(xí)、可視化等多個(gè)模塊,能最大程度上模擬線蟲(chóng)與環(huán)境的交互方式。
相比目前國(guó)際領(lǐng)先的OpenWorm線蟲(chóng)仿真項(xiàng)目,天演團(tuán)隊(duì)的流體仿真環(huán)境規(guī)模更大,也更適合作為生命體的多體/群體智能行為仿真環(huán)境、完成智各種能體學(xué)習(xí)訓(xùn)練復(fù)雜任務(wù)等。
最后,團(tuán)隊(duì)將線蟲(chóng)模型放到仿真環(huán)境中,完成了初步訓(xùn)練。
這些都是未來(lái)天演平臺(tái)的組成部分。具體來(lái)說(shuō),這是一個(gè)還在建造中的多GPU集群平臺(tái),可用于高精度、大規(guī)模生物神經(jīng)元的模擬。
在場(chǎng)景尺度超過(guò)1300個(gè)線蟲(chóng)身長(zhǎng)的仿真環(huán)境下,團(tuán)隊(duì)現(xiàn)在已經(jīng)初步訓(xùn)練出了能夠根據(jù)環(huán)境化學(xué)信號(hào)分布自主行動(dòng)的“智能線蟲(chóng)”,而這一場(chǎng)景也能支持更大空間和多線蟲(chóng)群體仿真。
據(jù)團(tuán)隊(duì)表示,“智能線蟲(chóng)”模型能夠高效、精準(zhǔn)地計(jì)算與流體環(huán)境相互作用的規(guī)律,在相同計(jì)算資源下,單線蟲(chóng)單次仿真時(shí)間小于0.1秒。
下一階段,天演團(tuán)隊(duì)計(jì)劃讓這只“賽博線蟲(chóng)”實(shí)現(xiàn)避障、覓食等更復(fù)雜的智能任務(wù)。
事實(shí)上,類腦智能研究一直是個(gè)全球性課題。
國(guó)際上,包括歐盟腦計(jì)劃支持的Blue Brain項(xiàng)目、美國(guó)腦計(jì)劃等都在進(jìn)行類腦研究;科技巨頭如谷歌,近5年一直在發(fā)布腦圖譜、腦工具;高校研究機(jī)構(gòu)如MIT,用19個(gè)線蟲(chóng)模擬神經(jīng)元實(shí)現(xiàn)了自動(dòng)駕駛控制……
然而,單從類腦研究來(lái)看,各團(tuán)隊(duì)的研究方向卻有很大不同,甚至有相當(dāng)一部分團(tuán)隊(duì)藉由先設(shè)計(jì)芯片、再設(shè)計(jì)算法的方式來(lái)實(shí)現(xiàn)類腦計(jì)算。
但這樣的研究,反而會(huì)被芯片等硬件約束了算法的設(shè)計(jì)與實(shí)現(xiàn),最終與實(shí)現(xiàn)類腦智能的目標(biāo)相距甚遠(yuǎn)。
相較之,天演團(tuán)隊(duì)選擇從實(shí)現(xiàn)AI的角度,去研究并實(shí)現(xiàn)類腦智能。
但即便如此,費(fèi)盡心力建模一個(gè)線蟲(chóng)大腦,真的有意義嗎?
線蟲(chóng)“大腦”,有什么用?
若是用一句話來(lái)概括這個(gè)問(wèn)題,那便是:
這是邁出人造智能生命的關(guān)鍵一步。
自人工智能誕生以來(lái),把“機(jī)器打造得像人一樣”,便成為了研究人員一直努力研發(fā)的方向。
然而隨著時(shí)間的推移,哪怕到了現(xiàn)今以深度學(xué)習(xí)為主的發(fā)展階段,人工智能還是沒(méi)有達(dá)到真正意義上的智能程度。
即便是像2016年AlphaGo轟動(dòng)世界的那場(chǎng)圍棋比賽,也只是刷新了人們對(duì)于人工智能的認(rèn)知。
但也正如CMU教授Hans Moravec所述:
要讓電腦像成年人一樣下棋是相對(duì)容易的;但是要讓電腦擁有一歲小孩水平的感知和行動(dòng)能力,卻是相當(dāng)困難,甚至是不可能的。
那么,問(wèn)題到底出在了哪里?
在2016年的時(shí)候,智源研究院院長(zhǎng)黃鐵軍就給出過(guò)答案。
他認(rèn)為,深度學(xué)習(xí)本質(zhì)上依賴于人工神經(jīng)網(wǎng)絡(luò),而生物的智能所依靠的是生物神經(jīng)網(wǎng)絡(luò)。
其中,人工神經(jīng)網(wǎng)絡(luò)更接近于“實(shí)現(xiàn)功能”,而生物神經(jīng)網(wǎng)絡(luò)模擬的則是“實(shí)現(xiàn)功能的結(jié)構(gòu)”,二者在“體量”上便不是一個(gè)級(jí)別的,后者明顯要龐大得多,也更重要——
因?yàn)榻Y(jié)構(gòu)決定功能,而生物神經(jīng)網(wǎng)絡(luò)才是智能的載體。
因此,黃鐵軍基于這種情況下所提出的“解法”是:
從腦機(jī)理模擬的角度出發(fā)。
簡(jiǎn)單來(lái)說(shuō),就是要去探索生腦大腦內(nèi)部的“運(yùn)作模式”,這才是通向通用人工智能的途徑之一。
無(wú)獨(dú)有偶,在更早的2009年,瑞士洛桑聯(lián)邦理工學(xué)院的Henry Markram教授也提出過(guò)類似的觀點(diǎn)。
當(dāng)時(shí)他宣布了一個(gè)計(jì)劃——將在理解大腦結(jié)構(gòu)的基礎(chǔ)之上,用超級(jí)計(jì)算機(jī)建立大腦模型。
這項(xiàng)計(jì)劃后來(lái)得到了歐盟的大力支持和關(guān)注,因?yàn)檫@種方式的意義不僅僅是理解人類大腦智能的本身,甚至還可能為腦疾病找到別樣的治療方法。
但問(wèn)題也接踵而至,要想模擬人類整個(gè)大腦神經(jīng)網(wǎng)絡(luò),靠計(jì)算機(jī)是相當(dāng)困難的。
這不僅僅是因?yàn)橛?jì)算模擬的復(fù)雜度,更是因?yàn)樯锎竽X本身的復(fù)雜度。
畢竟人類大腦的含有神經(jīng)元數(shù)量高達(dá)1011,其所需的計(jì)算量和成本可見(jiàn)一斑。
而人類實(shí)際上通過(guò)大腦去做推理、創(chuàng)作等一系列行為時(shí),所消耗的功耗僅為20-25瓦。
也就是說(shuō)生物大腦具備了“高智能”、“低功耗”的特性。
這也就是為什么說(shuō)研究生物大腦,是通向通用人工智能最佳藍(lán)本的原因所在了。
而且這種信號(hào)也已經(jīng)開(kāi)始浮現(xiàn)。
例如2021年發(fā)表于頂刊NEURON上的Single Cortical Neurons as Deep Artificial Neural
Networks研究表明——
一個(gè)深度神經(jīng)網(wǎng)絡(luò)需要5到8層互聯(lián)神經(jīng)元才能表征單個(gè)生物神經(jīng)元的復(fù)雜度。
這也就證明了單個(gè)神經(jīng)元所具備的計(jì)算力之強(qiáng),所以若是能夠?qū)蝹€(gè)神經(jīng)元做非常精細(xì)化的刻畫,便可更加逼近生物處理信息的復(fù)雜過(guò)程。
但更精細(xì)化地模擬生物大腦的意義還遠(yuǎn)不止于此。
目前人類在大腦方面仍然存在許多較為棘手的疾病,例如阿爾茲海默癥、抑郁癥和腦損傷等。
研究各種腦疾病的過(guò)程更是消耗巨大人力和物力的過(guò)程,若是能夠精細(xì)地模擬具備生物性質(zhì)的大腦,那么或許會(huì)在解決方案上提供另一種可能性。
……
總而言之,更好地模擬和認(rèn)識(shí)大腦,是在認(rèn)識(shí)大腦本身的同時(shí),也是在重視人類自己。