譯者 | 晶顏
審校 | 重樓
本文聚焦LLM(大型語(yǔ)言模型)的推理邏輯,從技術(shù)底層剖析人工智能語(yǔ)言能力的計(jì)算本質(zhì)——其核心是統(tǒng)計(jì)規(guī)律的應(yīng)用,而非人類意義上的思維理解。
大型語(yǔ)言模型具有令人印象深刻的能力,可以生成文本、詩(shī)歌、代碼,甚至進(jìn)行復(fù)雜的對(duì)話。但核心問題始終存在:這類系統(tǒng)是否真正理解語(yǔ)義,抑或僅是思維形式的模仿?
這一爭(zhēng)議構(gòu)成當(dāng)前AI辯論的焦點(diǎn)。一方面,LLM的成就是不可否認(rèn)的:它們可以翻譯語(yǔ)言,總結(jié)文章,起草電子郵件,甚至以驚人的準(zhǔn)確性回答復(fù)雜的問題。這種輕松駕馭語(yǔ)言的能力看似指向真實(shí)理解。
另一方面,分析人士強(qiáng)調(diào)LLM本質(zhì)是基于海量文本數(shù)據(jù)訓(xùn)練的統(tǒng)計(jì)機(jī)器,雖能識(shí)別詞匯間的模式與關(guān)聯(lián),卻未必理解語(yǔ)義深層內(nèi)涵,更像是對(duì)已有模式的復(fù)制,而非有意識(shí)的思考。
這個(gè)問題至今仍無(wú)定論,研究者之間也存在分歧。部分觀點(diǎn)認(rèn)為LLM正邁向真正的理解,另一些則判斷其始終是復(fù)雜的模擬器,無(wú)法實(shí)現(xiàn)真正的思維。而LLM的理解能力問題,亦引發(fā)哲學(xué)、倫理及實(shí)踐層面的討論,直接影響其應(yīng)用方式。
此外,解構(gòu)人類“思考”能力的神秘性在當(dāng)下顯得尤為重要。由于公眾對(duì)人工智能的過度熱忱,或是對(duì)底層技術(shù)原理的認(rèn)知缺失,LLM(大型語(yǔ)言模型)的能力常被錯(cuò)誤賦予人類思考的特質(zhì)。蘋果公司研究團(tuán)隊(duì)在《思考的錯(cuò)覺》中對(duì)這一現(xiàn)象進(jìn)行了實(shí)證分析。
研究指出,盡管LLM在性能提升方面取得顯著進(jìn)展,但人們對(duì)其固有局限性仍缺乏充分認(rèn)知。特別是在推理泛化能力與復(fù)雜問題處理方面,LLM仍面臨根本性挑戰(zhàn)。正如該研究以河內(nèi)塔算法為例所證實(shí)的:LLM不僅在問題求解與策略發(fā)現(xiàn)中存在明顯缺陷,其生成的整個(gè)推理鏈條也普遍存在邏輯驗(yàn)證與步驟執(zhí)行的系統(tǒng)性局限。
基于此,深入探究LLM的內(nèi)部運(yùn)作機(jī)制,明確其與人類思維的本質(zhì)差異,成為理解人工智能技術(shù)邊界的關(guān)鍵。本文將以“他怎么了?(P > 0.05)”這一網(wǎng)絡(luò)梗為例,剖析LLM展現(xiàn)的技術(shù)能力及其背后的計(jì)算邏輯,揭示其與人類意識(shí)本質(zhì)上的區(qū)別。
LLM對(duì)“P > 0.05”梗圖的簡(jiǎn)單解釋
我讓一個(gè)LLM簡(jiǎn)單地給我解釋一下這個(gè)表情包,下面是它的回答:
面對(duì)梗圖的LLM:能力展示
對(duì)于我們?nèi)祟悂?lái)說,理解這個(gè)梗的幽默需要了解哈利波特場(chǎng)景,基本的統(tǒng)計(jì)數(shù)據(jù),以及從有趣的并列中理解諷刺的本質(zhì)。
而當(dāng)要求LLM解釋“他怎么了?(P > 0.05)”這一梗圖時(shí),其回應(yīng)展現(xiàn)出了多維度能力:
- 識(shí)別視覺與文本元素:關(guān)聯(lián)哈利波特場(chǎng)景、角色形象與“P > 0.05”的統(tǒng)計(jì)術(shù)語(yǔ);
- 解構(gòu)文化語(yǔ)境:理解哈利波特的文化背景與統(tǒng)計(jì)學(xué)中p值的科學(xué)含義;
- 整合信息邏輯:通過抽象關(guān)聯(lián)闡釋梗的幽默性——即科學(xué)概念與虛構(gòu)場(chǎng)景的反差。
我們必須承認(rèn),LLM在這項(xiàng)工作中的表現(xiàn)相當(dāng)出色。乍一看,這可能意味著一種深刻的“理解”,甚至是一種與我們類似的智能形式,能夠推理和解釋世界。
“推理”機(jī)制:一個(gè)計(jì)算過程
然而,這種表現(xiàn)并不是人類意義上的“反思”的結(jié)果。LLM沒有“思考”,沒有意識(shí),沒有內(nèi)省,更沒有主觀體驗(yàn)。我們所認(rèn)為的推理,實(shí)際上是一個(gè)復(fù)雜的分析過程,基于算法和大量的數(shù)據(jù)。
訓(xùn)練數(shù)據(jù)的規(guī)模
Gemini、ChatGPT等模型基于數(shù)百TB數(shù)據(jù)訓(xùn)練,涵蓋數(shù)十億文本文檔(書籍、文章、網(wǎng)頁(yè))及多模態(tài)元素(帶字幕的圖像、音頻、視頻等),參數(shù)規(guī)模達(dá)數(shù)十億。
這個(gè)知識(shí)庫(kù)相當(dāng)于一個(gè)巨大的、數(shù)字化的、有索引的圖書館。它包括百科全書式的世界知識(shí)、流行文化的各個(gè)部分(如哈利波特傳奇)、科學(xué)文章、電影劇本、在線討論等等。正是這種大量和多樣化的信息暴露,使它能夠識(shí)別模式、相關(guān)性和上下文。
核心算法機(jī)制
為了分析梗圖,下述幾類算法起到了關(guān)鍵作用:
- 自然語(yǔ)言處理(NLP):它是與文本交互的核心,允許模型理解短語(yǔ)的語(yǔ)義(如“他怎么了?”的語(yǔ)境含義)并處理文本信息。
- 視覺識(shí)別/OCR(光學(xué)字符識(shí)別):對(duì)于基于圖像的梗圖,系統(tǒng)會(huì)使用OCR算法提取圖像文本(如“P > 0.05”)。同時(shí),視覺識(shí)別允許識(shí)別圖形元素:角色的臉、電影中的特定場(chǎng)景等。
- Transformer神經(jīng)網(wǎng)絡(luò):作為LLM的底層架構(gòu),它們?cè)谧R(shí)別數(shù)據(jù)中的復(fù)雜模式和長(zhǎng)期關(guān)系方面特別有效。它們?cè)试S模型將“哈利波特”與特定場(chǎng)景聯(lián)系起來(lái),并理解“P > 0.05”是一個(gè)統(tǒng)計(jì)概念。
梗圖分析“分步”過程
當(dāng)處理網(wǎng)絡(luò)梗圖時(shí),LLM(大型語(yǔ)言模型)展現(xiàn)出精密的計(jì)算處理流程:
- 信息提取與識(shí)別:系統(tǒng)精準(zhǔn)捕捉關(guān)鍵詞、人物面部特征、場(chǎng)景元素及專業(yè)文本信息;
- 知識(shí)關(guān)聯(lián)激活:基于提取的元素,模型調(diào)用并篩選其知識(shí)儲(chǔ)備中最相關(guān)的內(nèi)容。在此過程中,模型關(guān)聯(lián)哈利波特系列中“靈魂煉獄(limbo)”、伏地魔靈魂碎片等文化元素,鏈接統(tǒng)計(jì)學(xué)中p值及0.05顯著性閾值的定義,并激活幽默創(chuàng)作中的并置對(duì)比模式;
- 響應(yīng)內(nèi)容生成:模型整合上述信息,輸出對(duì)梗圖幽默邏輯的闡釋,指出笑點(diǎn)源自鄧布利多以統(tǒng)計(jì)學(xué)話術(shù)回應(yīng)情感哲學(xué)問題,暗喻生命狀態(tài)不具備“統(tǒng)計(jì)顯著性”。這一解釋本質(zhì)上是模型通過訓(xùn)練習(xí)得的語(yǔ)義關(guān)聯(lián),篩選出最具概率優(yōu)勢(shì)的內(nèi)容組合。
LLM運(yùn)作機(jī)制的本質(zhì)特征:統(tǒng)計(jì)驅(qū)動(dòng)與意識(shí)缺位
LLM所謂的“推理”過程,本質(zhì)是基于海量數(shù)據(jù)相關(guān)性的復(fù)雜統(tǒng)計(jì)推演。模型無(wú)法真正理解哈利波特場(chǎng)景的抽象意義、情感暗示或道德上的細(xì)微差別,僅是依據(jù)數(shù)十億參數(shù)訓(xùn)練形成的概率模型,預(yù)測(cè)最可能的文本序列與語(yǔ)義關(guān)聯(lián)。
這種運(yùn)作機(jī)制與人類思維存在本質(zhì)差異。人類依托意識(shí)、生活閱歷及情感體驗(yàn),能夠突破既有知識(shí)框架創(chuàng)造全新意義,其對(duì)因果關(guān)系的認(rèn)知超越單純統(tǒng)計(jì)關(guān)聯(lián)。例如,人類可從梗圖中解讀伏地魔角色的命運(yùn)隱喻、場(chǎng)景的敘事價(jià)值及符號(hào)背后的文化映射,而這些均非LLM能力所及。此外,人類行為受主觀意圖、價(jià)值訴求與信念體系驅(qū)動(dòng),LLM則僅遵循預(yù)設(shè)規(guī)則與概率分布執(zhí)行任務(wù)。
盡管LLM在符號(hào)處理與表征生成方面表現(xiàn)卓越,但其仍缺乏對(duì)現(xiàn)實(shí)世界的感知理解、常識(shí)判斷及人類智能所特有的意識(shí)屬性。與此同時(shí),模型訓(xùn)練偏差、不可控輸出及“幻覺”現(xiàn)象等問題,也進(jìn)一步凸顯其與人類智能的根本性差距。
結(jié)語(yǔ)
大型語(yǔ)言模型是具備強(qiáng)大計(jì)算效能的工具,能夠模擬人類語(yǔ)言理解與生成能力,但其核心運(yùn)作邏輯根植于數(shù)據(jù)統(tǒng)計(jì)分析與模式識(shí)別,與人類意識(shí)驅(qū)動(dòng)的認(rèn)知、反思及世界理解存在本質(zhì)區(qū)別。
當(dāng)技術(shù)生態(tài)系統(tǒng)夸大模型推理能力時(shí),厘清這一差異尤為關(guān)鍵。在這種情況下,秉持客觀認(rèn)知方能充分發(fā)揮LLM的技術(shù)優(yōu)勢(shì),避免賦予其超越能力邊界的虛構(gòu)特質(zhì)。
就我個(gè)人而言,我相信人工智能的未來(lái)在于人類和機(jī)器之間的智能協(xié)作——人類貢獻(xiàn)意識(shí)創(chuàng)造力與批判性思維,機(jī)器發(fā)揮計(jì)算速度、分析效率及信息整合優(yōu)勢(shì),實(shí)現(xiàn)互補(bǔ)共生的技術(shù)生態(tài)。
原文標(biāo)題:Debunking LLM Intelligence: What's Really Happening Under the Hood?,作者:Frederic Jacquet