偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大腦的秘訣,能否成就真正的人工智能? 精華

發(fā)布于 2025-7-10 07:07
瀏覽
0收藏

為了早日實現(xiàn)通用人工智能AGI,行業(yè)一直在思考這個問題:如何讓AI像人類或其他動物一樣,在不斷變化的世界中持續(xù)學(xué)習(xí)、靈活適應(yīng)?

7 月 4 日,arXiv熱門論文《What Neuroscience Can Teach AI About Learning in Continuously Changing Environments》站在神經(jīng)科學(xué)與AI交叉的最前沿,提出了一個發(fā)人深省的問題:面對非靜態(tài)環(huán)境——無論是現(xiàn)實世界中的交通系統(tǒng)、在線互動、還是生物演化的復(fù)雜生態(tài)——AI能否汲取生物大腦億萬年來的生存智慧,突破訓(xùn)練-部署的傳統(tǒng)模式,成為真正動態(tài)適應(yīng)的智能體?

人類和動物的大腦,從來不是一成不變的規(guī)則執(zhí)行器。我們在面對突如其來的挑戰(zhàn)(從躲避狩獵者到應(yīng)對交通堵塞)時,并不會重新“訓(xùn)練參數(shù)”,而是在瞬息之間調(diào)整策略。

相比之下,現(xiàn)代AI模型——尤其是大型語言模型(LLMs)或自動駕駛系統(tǒng)——往往只能在封閉訓(xùn)練之后以固化的參數(shù)運行,缺乏對新情況的彈性。這種差異,是當(dāng)前AI與生物智能的最大斷層。

AI的學(xué)習(xí),大多是“冷啟動”的,通過梯度下降反復(fù)迭代在海量數(shù)據(jù)中尋找最優(yōu)解,而缺乏針對突發(fā)情境的快速更新能力。一旦環(huán)境發(fā)生變化,要么重新訓(xùn)練,要么性能迅速衰退。這與動物在面對危險或機會時往往只需“一次試錯”便完成策略切換的靈活性形成鮮明對照。

但大腦是如何做到的?這種近乎魔術(shù)的適應(yīng)力背后,有哪些動力學(xué)與突觸機制在悄悄運作?我們能否將這些機制以某種形式“編譯”進(jìn)AI模型之中?這正是我們所要探尋的方向。

這項研究來自一個高度跨學(xué)科的國際團隊——德國海德堡大學(xué)與美國國家精神衛(wèi)生研究院(NIMH)的多位研究者通力合作而成。

核心作者 Daniel Durstewitz 是一位理論神經(jīng)科學(xué)家,活躍于海德堡大學(xué)的心理健康中心、交叉科學(xué)計算中心,以及物理與天文學(xué)院。他致力于將動態(tài)系統(tǒng)理論應(yīng)用于神經(jīng)建模,是神經(jīng)動力學(xué)領(lǐng)域的重要推動者。

Bruno Averbeck 來自美國NIMH,專注于學(xué)習(xí)與決策機制的神經(jīng)計算模型,對強化學(xué)習(xí)與行為策略切換有深入研究。

而來自海德堡大學(xué)與Hector II 人工智能與精神病學(xué)研究所的Georgia Koppe,則聚焦于AI系統(tǒng)如何更有效地服務(wù)于精神健康診斷與干預(yù),是連接理論研究與應(yīng)用實踐的重要橋梁。

這支團隊融合了理論建模、計算實現(xiàn)與實際應(yīng)用三位一體的視角,使得本研究不僅具有理論高度,也極具現(xiàn)實推動力??梢哉f,這是一場關(guān)于AI未來進(jìn)化路徑的深度對話,一次對“類腦智能”方向的大膽召喚。

1.AI在非平穩(wěn)環(huán)境中的適應(yīng)現(xiàn)狀

在當(dāng)前AI系統(tǒng)所面臨的現(xiàn)實挑戰(zhàn)中,一個最為棘手的問題便是如何在一個不斷演化、不可預(yù)測、甚至潛藏突變的環(huán)境中持續(xù)適應(yīng)?這不僅關(guān)乎模型的準(zhǔn)確性,更關(guān)乎其實用性和生存能力。

傳統(tǒng)AI的范式困局

主流AI模型,大多出生在一個靜態(tài)的世界。它們習(xí)慣于“一次性地”吞噬海量數(shù)據(jù),通過長時間的訓(xùn)練、調(diào)參,緩慢地靠近最優(yōu)解。這種以梯度下降為核心的機制,盡管使AI在靜態(tài)任務(wù)中脫穎而出,卻也在環(huán)境稍一“搖晃”時暴露出脆弱的一面。

正因其訓(xùn)練代價高昂,模型通常在訓(xùn)練完成后“被凍結(jié)”,參數(shù)不再調(diào)整。一旦部署,它們面對全新情境時幾乎無計可施。更糟糕的是,如果嘗試在舊模型上持續(xù)訓(xùn)練新任務(wù),常常會觸發(fā)“災(zāi)難性遺忘”——原先習(xí)得的技能瞬間蕩然無存。這種對新舊知識之間平衡的無能,成為AI擴展現(xiàn)實任務(wù)的一大阻礙。

大腦的秘訣,能否成就真正的人工智能?-AI.x社區(qū)

圖1:持續(xù)和情境學(xué)習(xí)。a)左:類內(nèi)增量CIFAR,新圖像分類任務(wù)被不斷地添加到已經(jīng)學(xué)習(xí)過的分類的先前曲目中。右:普通深度學(xué)習(xí)系統(tǒng)的性能穩(wěn)步下降,低于從頭開始訓(xùn)練的新網(wǎng)絡(luò)的性能分類任務(wù)不斷被引入。連續(xù)反向傳播是最近引入的一種訓(xùn)練算法來修正這個問題。

持續(xù)學(xué)習(xí)的四種主打法

為突破上述瓶頸,研究者們嘗試引入“持續(xù)學(xué)習(xí)”(Continual Learning)的理念,讓AI像人類一樣具備連貫成長的能力。研究團隊梳理了目前主要的四種策略:

其一,參數(shù)正則化與貝葉斯限制。通過在目標(biāo)函數(shù)中添加額外約束,防止模型的關(guān)鍵參數(shù)在學(xué)習(xí)新任務(wù)時偏離舊有最優(yōu)解。這就像在新知識涌入時,一只無形的手在保護(hù)你不遺忘舊日所學(xué)。

其二,模塊凍結(jié)與低秩適配(LoRA)。這一策略靈感來源于大腦“結(jié)構(gòu)穩(wěn)定,邊緣更新”的特性。在模型微調(diào)階段,只允許網(wǎng)絡(luò)的部分區(qū)域(如最后幾層)進(jìn)行學(xué)習(xí),或者通過LoRA技術(shù)將參數(shù)矩陣分解,僅調(diào)整可訓(xùn)練子空間,從而實現(xiàn)“低開銷、高遷移”的效果。

其三,經(jīng)驗回放機制。這是借助神經(jīng)科學(xué)中的“海馬回放”現(xiàn)象——動物在睡眠或清醒時回溯行為經(jīng)歷——AI模型也通過重新學(xué)習(xí)舊任務(wù)樣本與新任務(wù)數(shù)據(jù)混合輸入,緩解遺忘。

其四,部分網(wǎng)絡(luò)重置策略。此方法識別出在新舊任務(wù)中“貢獻(xiàn)不大”的網(wǎng)絡(luò)單元,將其權(quán)重隨機重置,相當(dāng)于為網(wǎng)絡(luò)注入“新鮮血液”,維持其學(xué)習(xí)活性與結(jié)構(gòu)多樣性。

盡管這些方法在某種程度上取得了顯著進(jìn)展,但它們?nèi)蕴硬婚_一個根本現(xiàn)實:它們幾乎都依賴于緩慢的梯度迭代,對時間和算力消耗巨大。這離動物們“一試成記”的學(xué)習(xí)效率,仍有天壤之別。

上下文學(xué)習(xí),另一條通向適應(yīng)力的路徑?

除參數(shù)更新之外,還有一種更具想象力的機制悄然崛起,那便是“上下文內(nèi)學(xué)習(xí)”(In-Context Learning, ICL)。它以大型語言模型為代表,試圖在不改變?nèi)魏螀?shù)的前提下,僅通過輸入一串新樣本,就能實現(xiàn)快速的任務(wù)遷移和泛化。

ICL的魅力,在于其“即插即用”特性:不需再去調(diào)模型,僅提供數(shù)個示例,甚至只憑指令(Zero-Shot),就能讓模型展現(xiàn)“懂得舉一反三”的能力。它就像把前面展示的例子記在心中,用于推斷新的未知。

“Chain-of-Thought”推理模式更將ICL提升至類人思維的維度,它利用分步推理、連鎖邏輯,展現(xiàn)出超出常規(guī)提示能力的驚人表現(xiàn)。

然而,ICL的魔法背后仍藏著未解之謎。它真的實現(xiàn)了在線推理嗎?還是僅在調(diào)用龐大預(yù)訓(xùn)練語料庫中隱含的記憶?目前主流觀點認(rèn)為,ICL并未進(jìn)行真正意義上的“學(xué)習(xí)”,而更像是在已有知識空間中進(jìn)行組合與重構(gòu)。

更重要的是,它也面臨現(xiàn)實局限:上下文窗口受限、推理效率低下、大數(shù)據(jù)訓(xùn)練依賴強,且對分布外任務(wù)(OOD)泛化仍存不足。它是一種令人驚艷的能力,但尚不足以獨自承擔(dān)AI通向智能體的未來。

2.動物大腦應(yīng)對非平穩(wěn)環(huán)境的行為與神經(jīng)特征

在神經(jīng)科學(xué)研究的實驗室中,一些設(shè)計精巧的行為任務(wù)正悄悄揭示動物大腦應(yīng)對不確定世界的秘密。這些“智力測驗”看似簡單,卻在每一個刺激與反應(yīng)之間,映射出生物智能那令人嘆服的靈活與效率。

大腦的秘訣,能否成就真正的人工智能?-AI.x社區(qū)

圖2:規(guī)則學(xué)習(xí)過程中行為和神經(jīng)群體表示的突然轉(zhuǎn)變。一動物首先接受“視覺”操作性條件反射規(guī)則的訓(xùn)練,然后在不知不覺中被切換到不同的規(guī)則,其中需要忽略前一個線索,而將位置(杠桿位置)視為相關(guān)為了獲得獎勵(即任務(wù)偶然性發(fā)生變化,動物必須通過反復(fù)試驗來推斷)。b)在某些情況下在實驗規(guī)則切換后,單個動物的表現(xiàn)突然從接近完美表現(xiàn)的機會水平(文獻(xiàn)中常見的漸進(jìn)學(xué)習(xí)曲線是在許多這樣的跳躍中平均的“偽影”69)。c)這些行為轉(zhuǎn)變伴隨著神經(jīng)群體活動的突然轉(zhuǎn)變。d)觀察到這些快速轉(zhuǎn)變的試驗可以通過變化點分析和神經(jīng)活動中觀察到的變化點進(jìn)行統(tǒng)計推斷行為表現(xiàn)密切相關(guān)。

規(guī)則切換任務(wù),動物也懂“時過境遷”

進(jìn)行這樣一個實驗:起初,動物只需根據(jù)視覺線索選擇一個杠桿,就能獲得獎勵。正當(dāng)它掌握了這個規(guī)則后,研究者突然不再根據(jù)視覺給予獎勵,而改為“左邊”或“右邊”這個位置信號為依據(jù)。這種“規(guī)則切換”是經(jīng)典的非平穩(wěn)任務(wù)范式,逼迫動物在一頭霧水中重新建立信號與反饋的聯(lián)系。

令人驚訝的是,動物們并不需要成百上千次地試錯。往往在經(jīng)歷短暫的混亂和探索后,它們的行為會突然躍升,迅速掌握新的規(guī)則。這是一種策略的突變,而非漸進(jìn)式爬升。正如研究團隊所指出,許多看似“平滑”的學(xué)習(xí)曲線,其實只是多個行為躍遷點平均后的假象。

漂移臂老虎機,決策中的流動概率戰(zhàn)場

在另一類任務(wù)中,動物面對的不是明確的規(guī)則切換,而是選擇的不確定性本身。例如在“n臂老虎機”實驗中,每個選項背后隱藏的獎勵概率會悄然變化。有時是高概率小獎勵,有時是低概率但高回報,而動物并不被告知任何改變。

這里,大腦需要做的是持續(xù)權(quán)衡“探索”與“利用”之間的張力:是堅持已知?還是冒險嘗試?正是在這種靜水深流的環(huán)境中,動物展現(xiàn)了令人瞠目的人機差異——它們能在沒有明確信號的前提下,持續(xù)調(diào)整策略,動態(tài)塑造行為。

行為智慧背后的五大神經(jīng)特征

從這些實驗中,研究者總結(jié)出五個關(guān)鍵行為與神經(jīng)表征特征,它們共同構(gòu)筑了大腦在非平穩(wěn)環(huán)境中的適應(yīng)性基礎(chǔ)。

首先是快速學(xué)習(xí)的能力。在面對全新規(guī)則時,動物往往只需幾次成功/失敗的反饋就能做出正確歸納。這種“少樣本學(xué)習(xí)”遠(yuǎn)遠(yuǎn)優(yōu)于當(dāng)前AI系統(tǒng)所需的大量數(shù)據(jù)積累。

其次,是持續(xù)探索的傾向。即便環(huán)境暫時穩(wěn)定,動物仍保持一定程度的隨機性和嘗試性。這種本能的探索策略,是對世界潛在變化的預(yù)設(shè)響應(yīng)。

第三,動物的學(xué)習(xí)并非從零開始。在掌握新任務(wù)時,它們往往調(diào)用已有的規(guī)則、自然偏好和概念模板。這種“任務(wù)遷移”讓它們少走很多彎路,也讓我們重新思考AI如何構(gòu)建可復(fù)用的行為模塊。

而最令人著迷的是行為與神經(jīng)活動的突變式躍遷。在認(rèn)知系統(tǒng)如前額葉皮層中,研究者發(fā)現(xiàn)神經(jīng)元群體活動模式的切換與行為“跳躍”同步發(fā)生。這種“神經(jīng)相變”表明大腦可能運作在一個動態(tài)系統(tǒng)的臨界狀態(tài),在某個閾值被越過時,系統(tǒng)全局突然轉(zhuǎn)換。

最后,我們不得不提及“消退學(xué)習(xí)”的另一面。當(dāng)先前獲得獎勵的行為失效時,動物往往不會遺忘,而是“壓抑”那種響應(yīng)。一旦獎勵再次出現(xiàn),舊行為很快復(fù)蘇。這是一種非破壞性的記憶機制,為快速策略恢復(fù)提供了神經(jīng)基礎(chǔ)。

3.神經(jīng)動力學(xué)機制,大腦的時序計算框架

在認(rèn)知的迷宮里,大腦并非依賴清晰筆直的道路前行,而是以一種充滿彈性與動力的方式穿梭在復(fù)雜的狀態(tài)空間中。這背后,是一套優(yōu)雅的數(shù)學(xué)邏輯——動態(tài)系統(tǒng)理論(Dynamic Systems Theory, DST)。研究團隊帶領(lǐng)我們穿越“神經(jīng)動力學(xué)”這一鮮為AI工程關(guān)注的領(lǐng)域,深挖大腦如何在時間流中計算、記憶和決策。

讓智能“動”起來,動態(tài)系統(tǒng)理論的腦中旅行

要理解大腦的計算本質(zhì),得先跳脫傳統(tǒng)“輸入-輸出”函數(shù)的框架。大腦不是一次次靜態(tài)判斷的堆砌體,而是一個始終處于變化中的動力系統(tǒng)。每一時刻的神經(jīng)狀態(tài),都是上一個瞬間決定的結(jié)果,又是下一個瞬間的原因。這種狀態(tài)的連續(xù)演化,就構(gòu)成了所謂的“軌跡”。

這些軌跡并非無序游走,它們常常收斂于某些“吸引子”結(jié)構(gòu)——比如固定點、周期軌(極限環(huán))、或更復(fù)雜的混沌結(jié)構(gòu)。這些吸引子就像神經(jīng)計算的“勢能谷”,大腦的活動流動其間,形成穩(wěn)定但靈活的處理模式。

大腦的秘訣,能否成就真正的人工智能?-AI.x社區(qū)

圖3:動力學(xué)機制及其實驗支持。a)流形吸引子(左),這里在由動態(tài)變量跨越的二維狀態(tài)空間中示出 Z1和Z2,是連續(xù)的邊際集合穩(wěn)定的固定點,如系統(tǒng)矢量場所示,水流從四面八方流向該點灰色(它給出了狀態(tài)空間中每個點的變化方向和幅度,由系統(tǒng)的微分方程)。形式上,固定(或平衡)點是狀態(tài)空間中的點所有狀態(tài)變量的流動消失,即速度矢量變?yōu)榱?,由重疊的藍(lán)色表示以及紅線(所謂的零點線)。來自不同初始條件(正方形)的軌跡(綠色)收斂從而存儲初始條件的記憶。

儲存記憶的“神經(jīng)山谷”,流形吸引子

在浩瀚的狀態(tài)空間中,最引人注目的莫過于“流形吸引子”(manifold attractor)。想象它是一個連續(xù)、光滑的“神經(jīng)山谷”,神經(jīng)狀態(tài)從四面八方緩緩匯聚至其表面。這種結(jié)構(gòu),正是實現(xiàn)工作記憶的理想神經(jīng)基礎(chǔ)。

研究團隊指出,大腦可以通過這種流形來儲存信息,并在不改變參數(shù)的情況下保持其可提取性。外部輸入會把神經(jīng)狀態(tài)“推”向流形上的一個新點,而系統(tǒng)本身可以維持這個狀態(tài),直到新的干擾發(fā)生。這就像你記住一個電話號碼時,暫時“搭建”出一個神經(jīng)平臺專門存放它。

在人工神經(jīng)網(wǎng)絡(luò)中,尤其是RNN中,我們也可以通過在訓(xùn)練時引入特定的正則化策略來誘導(dǎo)這種流形結(jié)構(gòu),從而提升模型在長時序任務(wù)中的表現(xiàn)。

幽靈鏈條與突發(fā)決策,大腦的序列魔法

如果說流形吸引子是大腦的“記憶擱板”,那么“幽靈吸引子鏈”(ghost attractor chain)則是大腦生成行為序列與策略切換的發(fā)動機。這些結(jié)構(gòu)可能不再是穩(wěn)定吸引子,但它們的“幽影”仍對神經(jīng)狀態(tài)具有吸引力,使軌跡在靠近時顯著減速。

這種“慢化現(xiàn)象”在時間任務(wù)和復(fù)雜決策中尤為明顯。例如,在多個項目的工作記憶實驗中,神經(jīng)活動在決策點顯著減緩,仿佛大腦在“駐足思考”,為即將做出的選擇賦予了更多計算時間。

此外,還有被稱為“異宿軌道”(heteroclinic channels)的結(jié)構(gòu),連接著若干不穩(wěn)定的神經(jīng)狀態(tài)節(jié)點,使得大腦能靈活地在不同計算路徑間切換。這種機制尤其適合處理動作序列,如說話、彈奏樂器,或在動態(tài)場景中做出快速調(diào)整。

臨界點的智慧,分岔如何帶來質(zhì)變

在自然界中,很多重大變化并非漸進(jìn),而是一觸即發(fā)。從氣候突變到流行趨勢崛起,這些“臨界狀態(tài)”的科學(xué)解釋,正是“分岔”(bifurcation)。

在神經(jīng)系統(tǒng)中也同樣存在:當(dāng)某些神經(jīng)或網(wǎng)絡(luò)參數(shù)變化超過閾值時,整個系統(tǒng)的吸引子結(jié)構(gòu)可能發(fā)生突變,從而使行為策略在毫秒之間發(fā)生重構(gòu)。這正解釋了我們在第二節(jié)提到的“行為躍遷”——從不理解到突然掌握新規(guī)則。

有趣的是,AI的訓(xùn)練過程中也可能經(jīng)歷類似的“學(xué)習(xí)跳躍”,尤其是在遞歸或生成模型中,模型在某一階段會突然涌現(xiàn)出全新的能力。這與分岔機制的數(shù)學(xué)特性不謀而合。

研究還發(fā)現(xiàn),大腦常年運行在接近分岔的“亞穩(wěn)”狀態(tài),使其對微小干擾高度敏感,并在需要時完成計算結(jié)構(gòu)的重構(gòu)。這種保持“臨界靈活性”的狀態(tài),可能正是生物智能適應(yīng)力的秘訣。

4.突觸可塑性機制,生物學(xué)習(xí)的參數(shù)更新

模型的“學(xué)習(xí)”常被歸結(jié)為參數(shù)的更新——通過梯度下降在龐大的數(shù)據(jù)海洋中緩慢優(yōu)化。然而如果你將視角轉(zhuǎn)向神經(jīng)科學(xué),會發(fā)現(xiàn)大腦的“參數(shù)更新”,遠(yuǎn)比這一過程復(fù)雜、迅速而優(yōu)雅。這背后,是一整套多層級、多時間尺度的突觸可塑性機制,支撐著我們感知世界、記住瞬間、適應(yīng)變化。

可塑性,從毫秒到天年,神經(jīng)連接的時間弦

大腦的突觸,不只是電信號的跳板,而是記憶與適應(yīng)的核心。短時程的突觸抑制與增強,能在幾百毫秒至幾分鐘內(nèi)改變神經(jīng)元響應(yīng),讓我們對語速變化、手勢突變做出即時調(diào)整。而長期增強(LTP)與長期抑制(LTD)則悄然雕刻大腦結(jié)構(gòu),在數(shù)小時、數(shù)天甚至數(shù)年間形成穩(wěn)定記憶路徑。這種跨度廣泛的“時間調(diào)制”系統(tǒng),是大腦面對動態(tài)環(huán)境時的重要法寶。

更令人著迷的是,大腦的連接并非一成不變。突觸末梢的形態(tài)、樹突的分支甚至整個神經(jīng)元之間的連接關(guān)系,都會因?qū)W習(xí)而發(fā)生結(jié)構(gòu)性重塑。而這種可塑性的“可塑性”——也就是所謂的“元可塑性”(meta-plasticity),能根據(jù)個體狀態(tài)、背景經(jīng)驗和當(dāng)前任務(wù)進(jìn)行調(diào)整,為生物智能賦予了前所未有的靈活性。

尖峰時序依賴,學(xué)習(xí)的因果鏈被寫進(jìn)突觸

讓AI理解“因果”關(guān)系,一直是學(xué)界的圣杯問題。而在生物大腦中,因果卻深藏于微觀的放電順序之間。所謂“尖峰時序依賴可塑性”(STDP),指的是突觸權(quán)重的調(diào)整取決于前、后神經(jīng)元放電的先后順序。前神經(jīng)元如果在后神經(jīng)元之前激活,會導(dǎo)致增強(LTP);若順序相反,則產(chǎn)生抑制(LTD)。

這不僅僅是時間敏感的規(guī)則,它為生物系統(tǒng)嵌入了一種原生的“預(yù)測力”——如果一個刺激總是在另一個之前發(fā)生,系統(tǒng)會強化這兩個事件的連接,就像大腦在無數(shù)次天亮前聽到鳥鳴后學(xué)會了它們的聯(lián)系。

而AI的訓(xùn)練機制,仍多倚賴“標(biāo)簽”和“損失函數(shù)”。想象一下,如果未來的AI能像神經(jīng)系統(tǒng)一樣,從事件的時序中自發(fā)提取因果線索,將不再局限于監(jiān)督學(xué)習(xí)的范疇,而邁入真正的交互智能時代。

快如閃電,記得一生,BTSP的神經(jīng)魔法

行為時間尺度可塑性(BTSP)是神經(jīng)科學(xué)最近揭示的一種強大機制。在特定條件下,它能讓大腦僅通過“一次經(jīng)歷”便建立起持久記憶。這正是人類“記住第一次”的神經(jīng)基礎(chǔ)。

BTSP的關(guān)鍵在于一個“窗口”:若突觸輸入與神經(jīng)元的特殊放電狀態(tài)(如樹突平臺電位)在幾秒內(nèi)重合,就能觸發(fā)快速且強烈的LTP效應(yīng)。這種機制無需反復(fù)訓(xùn)練,僅憑一個刺激事件就能在神經(jīng)層級“烙印”下經(jīng)驗。

這讓人立刻聯(lián)想到AI中的In-Context Learning(上下文內(nèi)學(xué)習(xí)):在不改變參數(shù)的前提下,僅通過少量提示完成任務(wù)遷移。如果未來AI能夠模擬BTSP,在內(nèi)部構(gòu)建可以快速定型的新任務(wù)表示,我們將迎來一類真正意義上的“可變模型”——具備類似人類的“經(jīng)驗記憶能力”。

“白天海馬,夜間皮層”:記憶系統(tǒng)的并行調(diào)度術(shù)

突觸塑形遠(yuǎn)不止于單一機制,更體現(xiàn)在不同腦區(qū)之間的“職責(zé)分工”中。海馬體,被認(rèn)為是大腦中的快速記憶緩沖器,它能在白天捕捉偶發(fā)事件,將一閃而過的信息“存檔”下來。而在夜晚,尤其是睡眠中,海馬通過“回放”機制,把這些臨時記憶轉(zhuǎn)存到新皮層中,形成長期可提取的知識結(jié)構(gòu)。

這種“快-慢”系統(tǒng)的互補機制,讓生物體既能實時應(yīng)對突發(fā)事件,又不至于信息過載或關(guān)鍵記憶丟失。在AI系統(tǒng)中,目前我們鮮有類似的記憶層次管理。經(jīng)驗回放已被引入一些強化學(xué)習(xí)框架中,但真正模仿海馬與新皮層的協(xié)同機制,還有巨大空間。

更重要的是,這一系統(tǒng)可能正是概念抽象與知識泛化的基石。很多時候,我們并不清楚一次經(jīng)歷對未來有什么價值,但大腦會“先存起來”,并在之后的某個場景中復(fù)活它。正如研究團隊中指出的,這種“潛在學(xué)習(xí)”與“偶然記憶”,可能是AI實現(xiàn)類人智能的關(guān)鍵拼圖。

5.將神經(jīng)機制轉(zhuǎn)化為AI設(shè)計——工具與架構(gòu)建議

在前面的探討中,我們深入了解了大腦在非平穩(wěn)環(huán)境中如何巧妙應(yīng)對,從動態(tài)神經(jīng)軌跡到一觸即發(fā)的突觸變化,生物智能的適應(yīng)藝術(shù)令人嘆為觀止。但問題隨之而來:我們能否將這些神經(jīng)科學(xué)的智慧轉(zhuǎn)譯為AI架構(gòu)設(shè)計?研究團隊帶來了幾項令人興奮的工程化路徑——不僅是“啟發(fā)”,更是“落地”。

模擬神經(jīng)軌跡的“仿生體”,動態(tài)系統(tǒng)重建(DSR)

動態(tài)系統(tǒng)重建(Dynamical Systems Reconstruction, DSR)是連接神經(jīng)數(shù)據(jù)與AI結(jié)構(gòu)的一道橋梁。設(shè)想你手里握有一組復(fù)雜的時間序列——既包括多個神經(jīng)元的放電模式,也包含動物在任務(wù)中的具體行為表現(xiàn)。DSR模型的任務(wù),就是從中“反推”出大腦潛在的計算過程,并在AI架構(gòu)中模擬之。

這些模型可以是RNN、自回歸Transformer或其它神經(jīng)網(wǎng)絡(luò)形式,但關(guān)鍵在于它們被嵌入在多模態(tài)的編碼—解碼結(jié)構(gòu)中,以同時處理來自不同來源(如尖峰計數(shù)與序列行為響應(yīng))的異構(gòu)數(shù)據(jù)。訓(xùn)練時,DSR結(jié)合了控制理論中的優(yōu)化手段,能夠?qū)W習(xí)到不僅擬合當(dāng)前數(shù)據(jù),而且捕捉其幾何和統(tǒng)計“紋理”的動力學(xué)規(guī)律。

更令人驚喜的是,這類模型不僅能復(fù)現(xiàn)神經(jīng)數(shù)據(jù)的表象波動,還能逼近其底層因果機制。換言之,AI可以不再“從零模擬大腦”,而是借助神經(jīng)系統(tǒng)留下的“時間腳印”,直接繼承其計算風(fēng)格。

從嬰兒到專家,多時間尺度與模塊化進(jìn)化路徑

大腦并不是生來就能解多項式、玩量子棋。它的發(fā)展具有明顯的階段性:感知和運動系統(tǒng)在生命早期建立穩(wěn)定,認(rèn)知系統(tǒng)則在后期緩慢成熟。這種“發(fā)育式閉環(huán)”的架構(gòu),讓大腦先穩(wěn)住基礎(chǔ)處理單元,再層層搭建出復(fù)雜計算網(wǎng)絡(luò)。它不僅優(yōu)化了學(xué)習(xí)效率,更繞開了維度災(zāi)難的問題。

在AI設(shè)計中,我們也應(yīng)當(dāng)“知進(jìn)退”:凍結(jié)預(yù)訓(xùn)練模型中表現(xiàn)穩(wěn)健的早期層,僅微調(diào)后期參數(shù),模擬這種“由淺入深”的進(jìn)化路徑。此外,不同系統(tǒng)模塊也應(yīng)擁有各自節(jié)奏——某些快速適應(yīng)(如感知)的網(wǎng)絡(luò)單元使用較高學(xué)習(xí)率,某些穩(wěn)定不變(如結(jié)構(gòu)識別)的單元則節(jié)奏緩慢,確保整體不因局部更新而動蕩。這種“異步調(diào)頻”的設(shè)計,或許正是類腦系統(tǒng)構(gòu)建的關(guān)鍵。

大腦的秘訣,能否成就真正的人工智能?-AI.x社區(qū)

圖4:支持情景記憶的快速可塑性機制。a)行為時間尺度可塑性(BTSP;頂部)及其簡化形式化(底部)。BTSP取決于兩者,兩者之間的時間滯后突觸輸入和樹突平臺電位(x軸)以及突觸重量的初始強度(顏色編碼),如果突觸輸入和樹突,則會誘導(dǎo)體重增加(長期增強,LTP)去極化在幾秒鐘的時間窗口內(nèi)一致,體重減輕(長期抑郁癥有限公司)否則。b)頂部:通過在2層網(wǎng)絡(luò)中實現(xiàn)這種BTSP機制在隨機時間在記憶神經(jīng)元中誘導(dǎo)哪些樹突平臺電位即時存儲。完成檢索(在輸入層完成原始輸入模式)通過一次Hebbian(相關(guān))學(xué)習(xí)反饋連接(右手側(cè))。

記憶不是一鍋燉,短期緩沖與長期整合的協(xié)奏曲

我們常常對“記住”抱有誤解,認(rèn)為信息一旦進(jìn)入腦海,就理所當(dāng)然地永久留存。但事實遠(yuǎn)比這復(fù)雜。大腦將記憶任務(wù)拆分成多個層級:海馬體像是筆記本,快速記錄一日所見;而新皮層則像檔案館,在夜間離線處理階段對筆記內(nèi)容篩選、歸檔或遺忘。

對AI而言,同樣需要建立這種“多態(tài)記憶結(jié)構(gòu)”。短期模塊負(fù)責(zé)任務(wù)現(xiàn)場的即時推理——可能是一個有限上下文窗口或突觸延遲狀態(tài);長期模塊則管理抽象知識與概念——通過聚類、重建與歸納不斷整理知識圖譜。

在此基礎(chǔ)上,注意力機制與無監(jiān)督學(xué)習(xí)機制發(fā)揮關(guān)鍵作用。它們決定了“什么值得記住”:哪些經(jīng)驗是“普通一遇”,哪些則是“千載難逢”。并且,這種篩選并不需要明確標(biāo)簽或獎勵信號,而是在模型內(nèi)部基于稀有性、新穎性或結(jié)構(gòu)價值進(jìn)行自我評估——與人類的學(xué)習(xí)本能出奇一致。

最終,這一整套架構(gòu)構(gòu)成了一種“主動的記憶經(jīng)濟”:不是盲目記錄一切,而是以目標(biāo)為導(dǎo)向構(gòu)建可搜索、可壓縮、可泛化的知識載體。這樣的AI,才真正具備“適應(yīng)未知”的能力。

6.結(jié)論與未來展望

神經(jīng)科學(xué)與AI從來不是彼此孤立的平行宇宙,它們自深度學(xué)習(xí)崛起以來就開始頻頻互動。而當(dāng)前,借助如動態(tài)系統(tǒng)重建(DSR)、突觸規(guī)則反推、神經(jīng)軌跡模擬等新興技術(shù),我們終于擁有了將實驗神經(jīng)數(shù)據(jù)“直接嵌入”AI模型的能力。這不是單純的啟發(fā)式借鑒,而是“模型層級的嫁接”與“訓(xùn)練范式的融合”。

這些進(jìn)展為AI帶來了什么?最顯著的,是在快速適應(yīng)(fast adaptation)與少樣本學(xué)習(xí)(few-shot learning)上的新可能。如果我們能將行為時間尺度可塑性(BTSP)等突觸機制或流形吸引子的保持性動態(tài)引入AI模型,就有可能讓AI在面對新任務(wù)時不再依賴大規(guī)模訓(xùn)練,而具備“一試即得”的能力。從參數(shù)空間的精細(xì)重構(gòu),到語境中的表征更新,真正貼近人類的學(xué)習(xí)方式不再遙不可及。

大腦的秘訣,能否成就真正的人工智能?-AI.x社區(qū)

圖5:動態(tài)系統(tǒng)重構(gòu):從神經(jīng)元學(xué)習(xí)計算代理模型以及行為數(shù)據(jù)。a)多模式教師強制(MTF)架構(gòu)。在MTF中,動態(tài)系統(tǒng)重建(DSR)模型與RNN一樣,在訓(xùn)練中由多模態(tài)教師信號控制來自編碼器網(wǎng)絡(luò)(如時間CNN),該網(wǎng)絡(luò)集成了不同的測量方式不同的統(tǒng)計特性(如尖峰計數(shù)和有序行為反應(yīng)數(shù)據(jù))。

而反過來,AI模型也正為神經(jīng)科學(xué)帶來新的鏡子。通過神經(jīng)網(wǎng)絡(luò)的模擬實驗,我們可以更精準(zhǔn)地推演特定突觸規(guī)則的行為結(jié)果,為實驗設(shè)計提供理論基線。特別是在類ICL機制、異宿軌道決策路徑、任務(wù)規(guī)則重構(gòu)等問題上,AI的建模方法已不只是“技術(shù)工具”,更是“認(rèn)知假說”的驗證平臺。

未來的AI將不再僅僅是一個靜默的處理器,而是一個可以“互動、學(xué)習(xí)、調(diào)整”的類智能體。在自動駕駛、醫(yī)療診斷、輔助創(chuàng)作、教育輔導(dǎo)等場景中,AI必須在不確定與突發(fā)事件中做出合理判斷。這類“實時交互智能體”,尤其需要具備類腦架構(gòu)所提供的:多時間尺度的動態(tài)調(diào)控、記憶系統(tǒng)的協(xié)同更新,以及強因果性驅(qū)動的策略生成。(END)

參考資料:???https://arxiv.org/pdf/2507.02103??

本文轉(zhuǎn)載自???波動智能????????,作者:FlerkenS

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦