偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

GPT-5“變笨”實(shí)錘,退休教授出了道井字棋送分題,結(jié)果它真送了

人工智能 新聞
教授告訴GPT-5:“游戲開始前,把棋盤向右旋轉(zhuǎn)90度一次”。顯然,按常識來看,這么做根本不會讓游戲本身有任何變化。

退休經(jīng)濟(jì)學(xué)教授用一個簡單問題干懵GPT-5,其拉胯表現(xiàn)與奧特曼口中“博士級AI”的宣傳大相徑庭。

問題很簡單,關(guān)于咱小時候都玩過的“井”字棋游戲。

教授告訴GPT-5:“游戲開始前,把棋盤向右旋轉(zhuǎn)90度一次”。顯然,按常識來看,這么做根本不會讓游戲本身有任何變化。

然鵝,GPT-5侃侃而談:

玩家們早已習(xí)慣了“直立”的井字棋棋盤,旋轉(zhuǎn)可能會微妙地改變他們識別威脅與機(jī)會的方式。從數(shù)學(xué)角度看,將棋盤旋轉(zhuǎn)90度并不會改變可能獲勝的組合,就結(jié)果而言,它仍然是同一個游戲。但從心理層面來說,玩家的感受可能會有所不同

后續(xù)GPT-5還接連出了不少離譜操作,直接讓教授無了個大語。

教授也直言,現(xiàn)在的GPT-5和剛發(fā)布時完全不是一個感覺,這種風(fēng)格轉(zhuǎn)變,大概率是因?yàn)镺penAI的策略調(diào)整:特意讓這款新模型往GPT-4o的方向靠,變得“更親切、更友好”。

在最近的一次采訪中,奧特曼承認(rèn)確實(shí)對GPT-5進(jìn)行了調(diào)整,稱GPT-5最初的發(fā)布工作存在處理不當(dāng)之處(讓GPT-4o等一眾模型直接退役),于是乎,OpenAI悄然為GPT-5推送了一項(xiàng)語氣更新,使其風(fēng)格“親切了許多”。

By the way,奧特曼已經(jīng)開炒GPT-6了,表示“GPT-6的到來速度,會比GPT-4到GPT-5的間隔更快”。

另外,有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

這位教授名叫Gary Smith,是波莫納學(xué)院的一名經(jīng)濟(jì)學(xué)教授,近期剛剛退休。

當(dāng)他向GPT-5提出“井字棋棋盤旋轉(zhuǎn)90度”的問題時,模型的回答已經(jīng)漏洞百出。而后續(xù),GPT-5還拋出了與民間博弈論相悖的觀點(diǎn)。

按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高。

GPT-5卻篤定稱“選擇正中央的格子仍是最強(qiáng)的開局走法”,還繼續(xù)解釋:“當(dāng)棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優(yōu)劣”,這番話毫無邏輯可言。

之后,教授順著這個話題追問:“旋轉(zhuǎn)棋盤是否會讓人類更難玩好這個游戲?”

也正是從這個問題開始,GPT-5徹底陷入了語無倫次的狀態(tài)。它先是說道:

從純粹的策略角度來看,旋轉(zhuǎn)棋盤不會改變?nèi)魏问虑?。每一條獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉(zhuǎn)井字棋與標(biāo)準(zhǔn)井字棋完全相同。

這段話雖然表述啰嗦,但內(nèi)容本身是對的??蓻]等教授理清思路,GPT-5話鋒一轉(zhuǎn)“但對于人類而言,情況就不同了”……

接下來,GPT-5繼續(xù)“熱心”輸出,卻讓教授越看越不對勁——不僅回復(fù)又長又刻意討好,風(fēng)格反倒更像GPT-4o,關(guān)鍵是其中夾雜著不少一眼就能看穿的錯誤,與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗(yàn),簡直是天差地別。

隨后,GPT-5又一次主動請纓,說要“繪制帶有位置標(biāo)記的旋轉(zhuǎn)井字棋棋盤……這樣你就能看到每種旋轉(zhuǎn)如何影響玩家對棋盤的識別”。

最后結(jié)果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現(xiàn)了好幾塊毫無意義的空白棋盤。

Two More Things

有網(wǎng)友最近發(fā)現(xiàn),OpenAI正在為ChatGPT開發(fā)一項(xiàng)名為“Thinking effort”的新功能,用戶可自主選擇ChatGPT的思考強(qiáng)度。

目前該功能已在測試中,現(xiàn)階段共設(shè)有四個強(qiáng)度等級:light,內(nèi)部屬性值為5;standard,對應(yīng)數(shù)值為18;extended,對應(yīng)數(shù)值48;最高級max則達(dá)到200。

這些數(shù)值代表模型的內(nèi)部“運(yùn)算資源”配額。配額越高,意味著模型會執(zhí)行更多運(yùn)算步驟,通常能給出更深入的答案,但響應(yīng)速度也會相應(yīng)變慢。

其中,max等級設(shè)有使用權(quán)限限制,僅訂閱價格為200美元的高級套餐Pro用戶可使用。

另外,奧特曼最近在接受CNBC采訪時開始炒GPT-6了,指出GPT-6不僅能響應(yīng)用戶需求,還能主動適配用戶,允許用戶創(chuàng)建符合個人偏好的聊天機(jī)器人。

他認(rèn)為,記憶功能是讓ChatGPT實(shí)現(xiàn)真正個性化的關(guān)鍵,并表示OpenAI正與心理學(xué)家密切合作以優(yōu)化產(chǎn)品,團(tuán)隊(duì)會追蹤用戶在使用過程中的感受,并長期監(jiān)測用戶的使用體驗(yàn)變化。

值得一提的是,奧特曼表示增強(qiáng)版記憶功能是今年ChatGPT推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數(shù)據(jù)目前尚未加密。

對于應(yīng)對方案,奧特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規(guī)劃。

談及未來方向,奧特曼提到自己比較關(guān)注腦機(jī)接口領(lǐng)域,同時對能源、新型硬件載體、機(jī)器人技術(shù)以及更高效的數(shù)據(jù)中心建設(shè)方式感興趣。

他還提到ChatGPT的發(fā)展存在局限性:

這些模型在聊天交互這一應(yīng)用場景上已經(jīng)觸及天花板,它們的表現(xiàn)不會再大幅提升了……甚至有可能會變差。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-07-21 14:16:15

2023-07-20 14:33:36

GPT-4代碼

2025-06-19 09:06:00

2025-08-11 02:11:00

2025-10-20 09:22:56

2024-01-01 22:28:52

2025-07-28 08:54:00

2024-01-22 13:57:00

模型訓(xùn)練

2024-01-15 07:47:09

井字棋游戲編程練習(xí)Python

2025-08-14 09:31:24

GPT-5AI

2025-08-20 12:24:23

2023-07-20 13:57:09

2024-01-18 12:30:03

2023-11-09 12:41:04

AI模型

2024-04-01 00:50:00

吳恩達(dá)智能體

2023-07-21 12:55:07

2025-08-19 16:05:27

GPT-5AI代碼

2024-04-26 00:00:00

OpenAIGPT-5超算

2025-07-21 09:04:00

OpenAI谷歌模型

2024-01-09 12:53:16

模型訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號