偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

LLM 翻車現(xiàn)場!ChatGPT 挑戰(zhàn) 1979《Video Chess》慘?。哼B車馬象都認(rèn)錯(cuò)

人工智能
AI 是否真的“懂得”某件事?如果它不能維持一個(gè)棋盤狀態(tài),它是否能在更復(fù)雜的現(xiàn)實(shí)場景中保持一致邏輯?例如:自動(dòng)駕駛的決策路徑、金融模型的風(fēng)控評估、甚至是多輪對話中的情緒識別。

一場 ChatGPT 對戰(zhàn) Atari 2600 的象棋對局火了。

具體而言,在一場看似輕松的“AI玩具對決”里,ChatGPT輸給了Atari 2600 的象棋引擎,對手只是一臺48年前、頻率1.19 MHz的8位主機(jī)。

圖片圖片

起初,這只是Robert Jr. Caruso的一次懷舊實(shí)驗(yàn)。這位基礎(chǔ)架構(gòu)工程師,平時(shí)和自動(dòng)化、虛擬化、云計(jì)算打交道。某天,他和ChatGPT聊起象棋AI,從Stockfish講到AlphaZero,模型興致高漲,主動(dòng)提出要挑戰(zhàn)Atari 2600上的《Video Chess》。

這款游戲發(fā)布于1979年,只有最基礎(chǔ)的規(guī)則判斷和1-2步深度搜索。當(dāng)Caruso把棋盤和規(guī)則輸入后,ChatGPT信心滿滿:“這應(yīng)該很快就能贏?!?/p>

然而,整場對局卻變成了一場鬧劇。GPT認(rèn)錯(cuò)棋子,把車當(dāng)象,錯(cuò)失雙兵叉,甚至連哪些棋子已經(jīng)被吃掉都記不住。它時(shí)常建議“犧牲騎士去換兵”,還不斷要求“從頭再來”,好像換一次初始局面就能擺脫混亂。

Caruso陪它下了整整90分鐘,每一步都要人工幫它“回憶”局面。最終,GPT主動(dòng)認(rèn)輸,“低下了頭”,結(jié)束了這場令人啼笑皆非的對局。

Caruso在領(lǐng)英中表達(dá):“它犯的錯(cuò),能讓你在小學(xué)三年級的象棋社被嘲笑一整學(xué)期?!?/p>

技術(shù)盲點(diǎn):LLM 不會“記住棋盤”

為什么 GPT 會輸?因?yàn)樗皇菫檫@類任務(wù)設(shè)計(jì)的。

GPT 屬于語言模型,它通過分析大量文本,學(xué)習(xí)詞語、句子、段落之間的相關(guān)性,并基于“概率”決定接下來的輸出。這種機(jī)制在對話、寫作中極其強(qiáng)大——但在棋局這類離散系統(tǒng)中,問題變成了“狀態(tài)跟蹤”。

在象棋這類游戲里,狀態(tài)清晰、規(guī)則嚴(yán)格:64 個(gè)格子、32 個(gè)棋子,輪流行動(dòng),沒有容錯(cuò)空間。每一手棋都對結(jié)果至關(guān)重要。

而 GPT 每次“發(fā)言”都是基于之前的“語言提示”,并沒有“內(nèi)部記憶”去追蹤棋盤狀態(tài)。即使外部工程實(shí)現(xiàn)了記憶機(jī)制,它也會在多個(gè)回合后“混淆上下文”。這是因?yàn)樗鼪]有專門為棋類構(gòu)建的“狀態(tài)表達(dá)結(jié)構(gòu)”,不像 Stockfish 那樣有明確定義的棋盤類、規(guī)則引擎、搜索深度控制。

有網(wǎng)友評論說:“你拿一個(gè)聊天機(jī)器人去玩象棋,就像用千斤頂修車?!?/p>

圖片圖片

也有網(wǎng)友認(rèn)為:語言模型捕捉的是序列概率,不擅長高度組合性的任務(wù)。

圖片圖片

因此,AI 是否真的“懂得”某件事?如果它不能維持一個(gè)棋盤狀態(tài),它是否能在更復(fù)雜的現(xiàn)實(shí)場景中保持一致邏輯?例如:自動(dòng)駕駛的決策路徑、金融模型的風(fēng)控評估、甚至是多輪對話中的情緒識別。

在 GPT 輸給 Atari Chess 的那 90 分鐘里,暴露的不只是一個(gè)模型的短板,也讓我們重新思考:我們理解的“AI 能力”,是否已經(jīng)被包裝過度?

作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對這些方向感興趣的朋友添加微信 Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢!

責(zé)任編輯:武曉燕 來源: 大數(shù)據(jù)文摘
相關(guān)推薦

2025-02-24 10:10:20

ChatGPTC#代碼

2019-01-16 09:20:42

架構(gòu)設(shè)計(jì)JVM FullGC宕機(jī)事故

2024-08-13 13:11:02

2023-08-02 07:01:37

2023-06-09 07:21:03

RTX 4060游戲本DLSS 3

2020-07-22 19:20:44

微信移動(dòng)應(yīng)用

2023-03-17 18:33:12

ChatGPTLLM應(yīng)用

2025-06-24 13:54:22

ChatGPTAI模型

2020-01-15 11:27:13

人工智能機(jī)器學(xué)習(xí)技術(shù)

2025-05-22 09:08:40

2025-06-09 01:00:00

2023-11-18 17:37:28

2025-04-21 16:23:06

機(jī)器人馬拉松人工智能

2025-06-19 08:17:34

2025-07-03 09:46:37

2013-03-25 09:42:56

2021-05-27 05:27:22

流程控制Rust

2024-02-04 13:56:03

2024-04-15 07:30:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號