GPT4技術(shù)原理:大模型的幻覺,解鈴還須系鈴人
阿爾伯特·愛因斯坦曾經(jīng)說過:
像我們這樣相信物理學(xué)的人都知道,過去、現(xiàn)在和未來之間的區(qū)別只是一種頑固執(zhí)著的幻覺。換句話說,時(shí)間是一種幻覺。
筆者覺得,此種意義上說,光也是一種幻覺,你能看到可見光,卻對紅外光和紫外光“熟視無睹”。而這一切不過是同一種形式的波或者粒子。
人類的幻覺
人類的幻覺無處不在,無時(shí)不有。只是絕大多數(shù)情境下,你覺察不到而已,像紅紫外光。
幻覺(Hallucination)是一種在沒有外部刺激的情況下的感知,具有真實(shí)感知的特性?;糜X是生動(dòng)的、實(shí)質(zhì)的,并且被認(rèn)為位于外部客觀空間。
幻覺可以發(fā)生在任何感官模式中—視覺、聽覺、嗅覺、味覺、體感、本體感覺、平衡覺、傷害感受、溫度感受和時(shí)間知覺等等。
“感覺是外部和內(nèi)部共同驅(qū)動(dòng)的世界?!?nbsp;一如柏拉圖的洞穴寓言中的先民,將其看到的墻上的影子,認(rèn)知為事物的外部真實(shí)存在。
150年前,馮 · 亥姆霍茲(1867)提出了感知的"無意識(shí)推理"概念。2005年Karl Friston將這種亥姆霍茲感知概念數(shù)學(xué)形式化。
知覺的原理
Friston假設(shè)大腦構(gòu)建了一個(gè)世界模型,其中先驗(yàn)的“信念”(即概率分布)用以指導(dǎo)概率推理:從大腦接收到的嘈雜和模糊的感官輸入中,推斷出其蘊(yùn)含的外部原因。
將“先驗(yàn)”與新的感官輸入(“似然”)相結(jié)合,產(chǎn)生感知(“后驗(yàn)”),是大腦對內(nèi)外部兩個(gè)信息源的整合,并按其相對精度(逆不確定性)進(jìn)行了加權(quán)。這是知覺的基本原理。
換句話說,一個(gè)人的先驗(yàn)信念相對于感官輸入的精度越高,感知(后驗(yàn))就越受先驗(yàn)支配。這意味著先驗(yàn)信念或感覺數(shù)據(jù)在神經(jīng)元上的精確表達(dá)方式的生物異常會(huì)導(dǎo)致異常的知覺推理。這是人類幻覺的本質(zhì)。
Friston 的感知概念數(shù)學(xué)形式如下,反映了大腦的感知其實(shí)是在做變分推斷。
F(s,u) = - log(p(s|m)) + Dkl [ q(Φ|u) || p(Φ|s,m) ]
變分推斷
p(s|m) 是客觀世界導(dǎo)致感官輸入s 的概率,也是客觀的,因而該項(xiàng)是常數(shù);Dkl [ q(Φ|u) || p(Φ|s,m) ] 是 q 和 p 的散度,也稱為 q,p的KL距離,衡量 q, p 之間的逼近程度。
大腦會(huì)不斷從 u 中采樣出 q, 逼近p,從而使得 p, q 距離最小化,即自由能 F(s,u) 最小化。反過來看,如果我們找到 F(s,u)最小化,此時(shí)的 Φ* 就是對Φ 的最佳近似。
在”漂亮國的核潛艇與深度學(xué)習(xí)的內(nèi)卷“文中,筆者總結(jié)過:變分推斷核心思想是將求解概率分布問題,轉(zhuǎn)換成距離最小化的優(yōu)化問題。
Friston 的這個(gè)感知概念數(shù)學(xué)形式,也被稱為貝葉斯大腦。
貝葉斯大腦
“ChatGPT是第一個(gè)真正意義的人工通用智能” 文中,筆者首先總結(jié)了大腦的工作方式:
大腦不斷從外部世界接收感官信息,用來更新其內(nèi)部世界模型,并對未來事件做出預(yù)測。內(nèi)部世界模型是關(guān)于外部世界的先驗(yàn)信念或假設(shè);
大腦的主要目標(biāo)是預(yù)測和控制外界的信息,以最大限度地降低不確定性和內(nèi)部熵。信息熵代表大腦關(guān)于世界的內(nèi)部模型的隨機(jī)性或不確定性;
大腦努力將其內(nèi)部模型與基于感官輸入的預(yù)測誤差最小化,減少信息熵可以對世界做出更準(zhǔn)確的預(yù)測,這等于使系統(tǒng)的自由能最小化。
大模型認(rèn)知框架
本系列“GPT4技術(shù)原理”的文章:學(xué)習(xí)語言需要相變,相變與涌現(xiàn),重整化群與生成式AI,重整化群流作為最優(yōu)輸運(yùn),已經(jīng)梳理出來大模型認(rèn)知框架:
海量的文本或者多模態(tài)語料組成了大模型需要認(rèn)知的外部世界的基本信息;嵌入構(gòu)建高維概率化的語言空間,用來建模語言文字圖像以及音視頻,并對連續(xù)變量做離散化;
預(yù)訓(xùn)練以重整化群流的方式進(jìn)行,在不同尺度上提煉語料數(shù)據(jù)中的信息概率分布;重整化群流的每一步流動(dòng)(自回歸預(yù)測逼近訓(xùn)練語料概率分布),都沿著最優(yōu)輸運(yùn)的成本最低方向進(jìn)行;
重整化群在不動(dòng)點(diǎn)附近因新語料帶來微擾而發(fā)生對稱性破缺,滑入不同的相空間;不同的相空間,對應(yīng)某種意義上的范疇,可形象化為信息的結(jié)晶;這是大模型從語料中學(xué)到的內(nèi)部世界模型;
在外部感官輸入下(被提示置于某種上下文),大模型內(nèi)部將限定在相應(yīng)的高維語言概率空間的子空間內(nèi)推理;推理是在子空間中采樣,類比時(shí)跨范疇采樣;
采樣不斷進(jìn)行,基于內(nèi)部概率化了的世界模型(預(yù)訓(xùn)練獲得的先驗(yàn)),針對感官輸入(提示),做變分推斷,最小化自由能,獲取最佳采樣分布q*,作為對導(dǎo)致感官輸入的外部后驗(yàn)的預(yù)測。
大模型的認(rèn)知框架,看起來十分接近Friston 描繪的貝葉斯大腦(維基百科上的示意圖):
大模型幻覺
先驗(yàn)信念或感覺數(shù)據(jù)在神經(jīng)元上的精確表達(dá)方式的生物異常會(huì)導(dǎo)致異常的知覺推理。這導(dǎo)致了人類的幻覺。大模型不僅也有類似的幻覺,而且成了實(shí)用的最大障礙。
當(dāng)模型生成的文本不遵循原文(Faithfulness)或者不符合事實(shí)(Factualness),人們就可以認(rèn)為模型出現(xiàn)了幻覺的問題。參考 Survey of Hallucination in Natural Language Generation ( arxiv.org/abs/2202.03629 )。
有研究(結(jié)論見下圖)凸顯了這個(gè)問題的嚴(yán)重性,以及解決大模型中幻覺的緊迫性和重要性,以確保負(fù)責(zé)任的大模型技術(shù)應(yīng)用。
幻覺的來源
大模型的幻覺又來自哪里呢?從上文大模型的認(rèn)知框架不難分析,框架中每一個(gè)關(guān)鍵環(huán)節(jié)都可能導(dǎo)致大模型產(chǎn)生幻覺。
語料中的偏差與錯(cuò)誤,讓大模型學(xué)的就是扭曲的外部信息;嵌入構(gòu)建高維概率語言空間,精度不足會(huì)導(dǎo)致概率向量混淆;
重整化提煉語料信息概率分布,無法確保自由能不變,因而是有損提??;自回歸預(yù)測僅僅是逼近訓(xùn)練語料概率分布,籍此構(gòu)建的內(nèi)部概率先驗(yàn)不完全精確;
重整化群因微擾而發(fā)生對稱性破缺,內(nèi)部模型發(fā)生相變,目前沒有預(yù)知與控制的方法,帶來內(nèi)部世界模型結(jié)構(gòu)的不確定性;
寬泛模糊的提示語,加之上下文的關(guān)聯(lián)影響下,大模型內(nèi)部采樣選取的用于推理的子空間會(huì)存在某些偏差;
推理采樣在有偏差的子空間進(jìn)行,可能偏離最佳采樣分布q*很遠(yuǎn);變分推斷獲取的嚴(yán)重有偏采樣分布,成了對外部后驗(yàn)的預(yù)測。
如何管控幻覺
解鈴還須系鈴人,有針對性的為幻覺來源對癥下藥,將是今后管控幻覺的關(guān)鍵措施。這里沒用“消除”一詞,從上文認(rèn)知框架筆者推斷,可將幻覺降低到“不可見”范圍,但很難消除為零。
針對語料中的偏差與錯(cuò)誤,語料的全面數(shù)據(jù)治理十分必要,既要豐富詳實(shí),又要不偏不倚;加大算力提高模型精度,增強(qiáng)嵌入及后續(xù)訓(xùn)練的信息區(qū)分度;
改進(jìn)Transformer-Attention歸一化算法,優(yōu)化降低自由能損失,最大程度降低信息折損;自回歸預(yù)測將受益于歸一化優(yōu)化,從而提升內(nèi)部概率先驗(yàn)精確性;
構(gòu)建重整化流的數(shù)學(xué)公式,推導(dǎo)出其流動(dòng)的方向,并計(jì)算可能的不動(dòng)點(diǎn),從而借助新語料,對不動(dòng)點(diǎn)做微擾,促進(jìn)其進(jìn)入更有序的相空間,實(shí)現(xiàn)可控的可預(yù)測的涌現(xiàn);
RLHF訓(xùn)練結(jié)合提示工程探索不同上下文有效提示語,改進(jìn)decoder模型,促進(jìn)大模型內(nèi)部采樣使用Wasserstein距離作為概率分布近似的度量;
探測研究內(nèi)部世界模型結(jié)構(gòu),進(jìn)而可以控制模型溫度,指導(dǎo)動(dòng)態(tài)Bayes推理更貼切的采樣概率分布,進(jìn)一步亦可通過檢索增強(qiáng)生成(RAG)效果,提高自一致自評估能力。
還可以做整體解決方案的安全架構(gòu)與治理設(shè)計(jì),請參考此篇:復(fù)雜企業(yè)的生成式人工智能解決方案架構(gòu),做最終的人工審核與確認(rèn)。?
寫在最后
因博弈論獲得諾獎(jiǎng)的數(shù)學(xué)家約翰納什,曾因?yàn)榛寐?、幻覺被確診為嚴(yán)重的精神分裂癥,多次診治多次復(fù)發(fā),最后得以徹底治愈。
精神分裂癥是一種可能以貝葉斯腦推理異常為特征的疾病。貝葉斯腦認(rèn)知框架,范式優(yōu)雅,建模方法強(qiáng)大,可用以分析診斷感知推理的多種潛在異常,成為當(dāng)前重要的精神分裂診療理論參考。
筆者梳理的大模型認(rèn)知框架,與Friston 的感知概念數(shù)學(xué)形式即貝葉斯腦神似,為分析與管控大模型幻覺,找到了系統(tǒng)的探索途徑。大模型幻覺未來必定可控。
大名鼎鼎的哲學(xué)家和數(shù)學(xué)家笛卡爾有個(gè)經(jīng)典的問題:如果我們的感覺不能總是被信任,那如何區(qū)別幻覺與現(xiàn)實(shí)?
大模型如何作答呢?如何發(fā)揮人們的想象力,駕馭大模型這種特殊的"想象力",安全放心的應(yīng)用于關(guān)鍵性質(zhì)的任務(wù)呢?
