偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

LeCun再潑冷水：只會看書的語言模型永遠(yuǎn)無法實(shí)現(xiàn)「類人智能」

作者：新智元 2023-09-01 09:42:37

人工智能新聞

問題不在語言模型的學(xué)習(xí)算法，而是語言本身的固有局限性，多模態(tài)將引領(lǐng)下一次AI爆發(fā)！

自去年ChatGPT發(fā)布后，業(yè)內(nèi)外都涌現(xiàn)出了一股對大型語言模型的狂熱情緒，甚至有谷歌員工宣稱公司內(nèi)部的語言模型有了意識。

最近，紐約大學(xué)教授、Meta首席AI科學(xué)家、圖靈獎得主Yann LeCun及紐約大學(xué)計算機(jī)科學(xué)系的博士后Jacob Browning發(fā)表了一篇長文，他們認(rèn)為是語言本身的局限性讓LLM的智能無法提升。

雖然語言模型變得越來越通用且強(qiáng)大，但我們卻越來越不懂模型的思考過程。

模型可以在各個常識推理基準(zhǔn)測試中取得非常高的準(zhǔn)確率，但為什么還是會說廢話、給出危險的建議呢？

也就是說，為什么語言模型如此聰明，能力卻又如此有限？

研究人員認(rèn)為，問題根本不是出在AI算法，而在于語言的局限性，一旦我們放棄「語言即思維」的假設(shè)，就會發(fā)現(xiàn)盡管LLM的表現(xiàn)出色，但它們永遠(yuǎn)無法達(dá)到接近人類的智慧程度。

語言模型到底是怎么回事？

在19世紀(jì)和20世紀(jì)的哲學(xué)和科學(xué)研究中，主流認(rèn)知是「知識即語言學(xué)」，也就是說，知道某樣只是意味著想到了正確的句子，并了解如何與已知的真實(shí)網(wǎng)絡(luò)中的其他句子聯(lián)系起來。

按照這種邏輯，語言的理想形式應(yīng)該是一種純粹形式化的、符合邏輯數(shù)學(xué)的形式，由任意的符號組成，依照嚴(yán)格的推理規(guī)則連接起來，但自然語言可能還需要語義消歧和不精確的。

奧地利哲學(xué)家Wittgenstein曾說過，真命題的總和就是自然科學(xué)的全部。

雖然在認(rèn)知地圖（cognitive maps）和心像（mental images）領(lǐng)域還存在爭議，但20世紀(jì)確立的語言學(xué)基礎(chǔ)就是符號主義。

這一觀點(diǎn)到目前也被很多人接受：如果百科全書可以包含所有已知的內(nèi)容，那只要把所有書都讀一遍，那就可以對世界有一個全面了解。

人工智能的早期研究也遵循這個思想，定義符號操作，根據(jù)邏輯規(guī)則以不同方式將語言符號綁定在一起。

對于當(dāng)時的研究人員來說，人工智能的知識都儲存在一個由人工邏輯連接的真實(shí)句子組成的龐大數(shù)據(jù)庫，如果人工智能系統(tǒng)在正確的時間吐出正確的句子，即能夠以適當(dāng)?shù)姆绞竭M(jìn)行符號操作的話，就可以認(rèn)為是一個智能系統(tǒng)。

這一想法也是圖靈測試的基礎(chǔ)：如果一臺機(jī)器可以在合適的時機(jī)把自己知道的內(nèi)容說出去，就意味著它知道自己在說什么，以及何時運(yùn)用自己的知識。

但反對者認(rèn)為，一臺機(jī)器可以聊天，并不意味著它可以理解談?wù)摰木唧w內(nèi)容，因為語言并不能窮盡知識，相反，語言只是一種高度具體的、非常有限的知識表征。

所有的語言，無論是編程語言、符號邏輯還是口語，都只是一種特定類型的表征模式，以極高的抽象級別表達(dá)離散的對象和屬性以及彼此之間的關(guān)系。

不過，閱讀樂譜和聽音樂之間存在巨大的鴻溝，與演奏技巧之間的差異則更大。

語言表征更像是對某些具體信息的壓縮，例如描述不規(guī)則的形狀、物體的運(yùn)動、復(fù)雜機(jī)制的功能等，其他非語言的表征也可以用一種可理解的方式來傳達(dá)信息，如圖像、錄音、圖表等。

語言的局限性

語言是一種帶寬非常低的傳輸方式，如果脫離上下文的話，孤立的單詞或句子能傳達(dá)出的信息量非常少，并且由于同音異義詞和代詞的數(shù)量很多，許多句子的語義都非常模糊。

喬姆斯基（Chomsky ）在幾十年前就提出，語言并不是一種清晰且明確的溝通工具。

但人類并不需要一個完美的溝通工具，我們對一個句子的理解通常取決于句子出現(xiàn)的語境，從而推斷出句子的表達(dá)含義。

在大多數(shù)情況下，我們都在討論面前的事物，比如正在進(jìn)行的足球比賽，或是面對某些特定的社會角色，比如跟服務(wù)員點(diǎn)餐，交流一些明確的目標(biāo)。

在閱讀一篇短文時，主要考察的是使用通用閱讀理解策略來理解文本內(nèi)容，但研究表明，兒童對某個主題的背景知識量實(shí)際上是影響理解的關(guān)鍵因素。

It is clear that these systems are doomed to a shallow understanding that will never approximate the full-bodied thinking we see in humans.

很明顯，AI系統(tǒng)注定只能膚淺地理解世界，永遠(yuǎn)不會接近人類所具有的全面思維。

單詞和句子的固有上下文性質(zhì)是了解LLM如何運(yùn)行的關(guān)鍵。

神經(jīng)網(wǎng)絡(luò)通常將知識表示為know-how，即對上下文高度敏感，并能同時找到具體和抽象的規(guī)則，實(shí)現(xiàn)對任務(wù)相關(guān)的輸入進(jìn)行細(xì)微處理。

在LLM中，整個過程涉及到系統(tǒng)在現(xiàn)有文本的多個層次上識別模式，既可以看到單個單詞在段落中是如何連接的，也可以看到句子是如何連接在一起以構(gòu)建更大的篇章段落。

其結(jié)果是，LLM對語言的理解肯定是語境化的，在理解單詞時不是根據(jù)根據(jù)字典含義，而是根據(jù)其在不同句子集合中所起的作用。

并且，許多單詞的運(yùn)用，比如carbonizer, menu, debugging, electron等，幾乎只在特定領(lǐng)域使用，即使在一個孤立的句子中，該單詞也會帶有上下文語義。

簡而言之，LLM的訓(xùn)練過程就是學(xué)習(xí)每個句子的背景知識，尋找周圍的單詞和句子來拼湊上下文，使得模型能夠?qū)⒉煌渥踊蚨陶Z的無限可能性作為輸入，并想出合理的方法來繼續(xù)對話或續(xù)寫文章等。

一個接受過所有人類所寫的文章進(jìn)行訓(xùn)練的系統(tǒng)，應(yīng)該可以具備對話所需的通用理解能力。

LLM學(xué)到的只是淺層知識

有些人并不認(rèn)為LLM初步具備「理解」能力或所謂「智能」，批評者們認(rèn)為這些系統(tǒng)只是模仿的比較好而已，因為LLM對語言的理解仍然十分膚淺，就像在教室里故作高深的學(xué)生，實(shí)際上他們并不知道自己在說什么，只是對教授或課文的無意識模仿。

LLM對一切都有這種膚淺的理解。像GPT-3這樣的系統(tǒng)是通過屏蔽句子或段落中的未來單詞來訓(xùn)練的，并迫使機(jī)器猜測最有可能的單詞，然后糾正錯誤的猜測。該系統(tǒng)最終能夠熟練地猜測最有可能的單詞，使其成為一個有效的預(yù)測系統(tǒng)。

比如GPT-3，只是通過對句子中的某些詞進(jìn)行遮罩，要求模型猜測具體的單詞，并進(jìn)行糾正而已，最終訓(xùn)練成為一個預(yù)測系統(tǒng)。

不過這種方式也讓我們對語言有了進(jìn)一步的理解，實(shí)際上，對于任何問題或謎題來說，通常只有少數(shù)幾個正確答案，以及無數(shù)個錯誤答案.

對于特定的語言技能來說，比如解釋笑話、單詞、邏輯難題等，實(shí)際上就是預(yù)測問題的正確的答案，進(jìn)而使機(jī)器能夠執(zhí)行縮寫、重寫、復(fù)述等其他需要語言理解的任務(wù)。

正如符號AI所預(yù)期的那樣，知識的表征與上下文相關(guān)，在給定前提的情況下輸出一個合理的句子。

Abandoning the view that all knowledge is linguistic permits us to realize how much of our knowledge is nonlinguistic.

放棄所有知識都是語言的觀點(diǎn)，可以讓我們認(rèn)識到有多少知識不是用語言來表示的。

但是，從語言上解釋一個概念的能力與實(shí)際使用的能力是不同的。

比如一個語言系統(tǒng)可以解釋如何執(zhí)行某個算法，但它并不具備執(zhí)行能力；它也可以解釋哪些單詞是冒犯性的，但并不能使用。

進(jìn)一步分析還可以發(fā)現(xiàn)，語言模型的注意力和記憶力只有一小段時間，更傾向于關(guān)注前兩句話，或是下一句話。

當(dāng)涉及到復(fù)雜的對話技巧，如積極傾聽、回憶和重溫先前的對話、堅持一個主題以提出一個特定的觀點(diǎn)，同時避開干擾因素等，語言模型的記憶力缺陷就暴露出來了，聊幾分鐘就會發(fā)現(xiàn)它們前后口徑不一致等問題。

如果撤回太多，系統(tǒng)就會重啟，接受新觀點(diǎn)，或者承認(rèn)它相信你所說的一切，形成一個連貫世界觀所必需的理解遠(yuǎn)遠(yuǎn)超出了語言模型的知識范圍。

不止語言

雖然書籍包含了大量可以解壓和使用的信息，但其他格式的信息也很重要，比如宜家的使用說明書上只有圖紙沒有文字，研究人員經(jīng)常先看論文中的圖表，掌握論文結(jié)構(gòu)后再瀏覽文字；游客可以沿著地圖上的紅線或綠色線在市區(qū)內(nèi)導(dǎo)航等。

人類在探索世界的過程中學(xué)到了很多東西，一個只接受語言訓(xùn)練的系統(tǒng)，即使從現(xiàn)在開始訓(xùn)練到宇宙的盡頭，也無法擁有接近人類的智能，

語言之所以重要，是因為它能夠以小格式傳達(dá)大量信息，特別是在印刷機(jī)和互聯(lián)網(wǎng)發(fā)明之后，可以很輕松地復(fù)制和大規(guī)模應(yīng)用。

但是壓縮語言信息并不是免費(fèi)的：要破譯一段晦澀難懂的文字需要很大的努力。

人文學(xué)科的課程可能需要大量的課外閱讀，這也可以解釋為什么一臺接受過語言訓(xùn)練的機(jī)器可以知道這么多，卻又了解得這么少。

它可以接觸到人類的所有知識，但書籍中的每一句話又蘊(yùn)含了大量的信息，理解起來依然很難。

語言模型里沒有幽靈

當(dāng)然，語言模型的缺陷并不意味著機(jī)器很愚蠢，只能說明它們的智能程度存在著內(nèi)在限制。

在很多情況下，我們實(shí)際上也并不需要一個接近于人類的智能體，比如我們不會把圖靈測試用在另一個人類身上，迫使其他人做多位數(shù)乘法等，大多數(shù)談話內(nèi)容都只是閑聊而已。

語言可能是我們探索世界的一個有用工具，但語言并不是智力的全部，深層的「非語言理解」能力是理解語言的基礎(chǔ)，可以加深我們對世界的認(rèn)知，也能讓我們理解別人在說什么。

這種非語言的、對情境敏感的、與生物相關(guān)、具身感知的知識是AI研究人員更關(guān)注的，而非語言學(xué)。

大型語言模型沒有穩(wěn)定的身體或持久的注意力來感知世界，僅從語言中能了解到的世界非常有限，所以學(xué)到的常識總是膚淺的。

責(zé)任編輯：張燕妮來源：新智元

模型學(xué)習(xí)

相似話題

機(jī)器學(xué)習(xí)

2040內(nèi)容

深度學(xué)習(xí)

1705內(nèi)容

自然語言處理

110內(nèi)容

107內(nèi)容

同話題下的熱門內(nèi)容

告別GPT！最強(qiáng)AI編程神器Cursor自研核心模型，速度快4倍，AI創(chuàng)業(yè)公司大佬：這是我用過最瘋狂的模型之一！網(wǎng)友：性價比不俗一夜之間，Claude猛轉(zhuǎn)向！Coding轉(zhuǎn)向白領(lǐng)，Anthropic內(nèi)部負(fù)責(zé)人自曝設(shè)計思路，開發(fā)只是小切片，目標(biāo)是所有復(fù)雜領(lǐng)域 OpenAI、Claude、通義、智譜、月暗，甚至谷歌，為什么全選擇Pytorch？早期論文成員爆料：LLM太笨重了，需要微型化 DeepSeek-OCR：用視覺模態(tài)給長文本“瘦身”，大模型處理效率再突破 LangChain V1.0 深度解析：手把手帶你跑通全新智能體架構(gòu)Cursor 2.0來了！可視化的Claude Code？大模型去全球接單平臺賺外快，98%慘遭老板退貨！ScaleAI宣布新智能體基準(zhǔn)：AI絕對自動化幾乎為0，大多知名基準(zhǔn)過時、封閉掌握RAG系統(tǒng)的七個優(yōu)秀GitHub存儲庫

相關(guān)專題更多

戴爾在線研討會：從“模型驅(qū)動”到“數(shù)據(jù)驅(qū)動”的智算架構(gòu)創(chuàng)新

看懂惠普 ZBookX 移動工作站的設(shè)計美學(xué)與效能突破

2025-10-11 13:42:35

技術(shù)薈萃 | 親身體驗 | 交流盛宴

2025-04-23 08:49:09

我收藏的內(nèi)容

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營