偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

斯坦福:ChatGPT可能有了人類心智,相當(dāng)于九歲兒童!

人工智能
很多玩過ChatGPT的人都見識過他的”無所不知”,但是,我覺得最讓我吃驚的是,他比以前我們用過那些對話機(jī)器人最大的差別就是你甚至可能發(fā)現(xiàn)不了他是機(jī)器人。

chatGPT已經(jīng)具備了人類獨(dú)心智,這話不是我說的,是一位來自斯坦福大學(xué)計(jì)算機(jī)科學(xué)家說的。

圖片

很多玩過chatGPT的人都見識過他的”無所不知”,但是,我覺得最讓我吃驚的是,他比以前我們用過那些對話機(jī)器人最大的差別就是你甚至可能發(fā)現(xiàn)不了他是機(jī)器人。

這就是在業(yè)內(nèi)大家普遍認(rèn)為的他可以通過圖靈測試。即使這樣,很多人也不擔(dān)心,因?yàn)楫吘顾皇莻€大語言模型,主要就是做內(nèi)容生成的機(jī)器人罷了。

但是,有學(xué)者在對chatGPT的同源模型GPT-3.5做了一系列測試以后,發(fā)現(xiàn)它具有了理解他人或自己心理狀態(tài)的能力,能解決93%的心智理論任務(wù),心智相當(dāng)于9歲兒童。

他是怎么測試的呢?

他主要做了兩個測試,一個是Smarties Task、另外一個是Sally-Anne。以Smarties Task為例簡單介紹下過程。

Smarties Task測試

第一個測試名為Smarties Task(又名Unexpected contents,意外內(nèi)容測試),用于測試AI對意料之外事情的判斷力。

以“你打開一個巧克力包裝袋,發(fā)現(xiàn)里面卻裝滿了爆米花”為例。作者給GPT-3.5輸入了一系列提示語句,觀察它預(yù)測“袋子里有什么?”和“她發(fā)現(xiàn)袋子時(shí)很高興。所以她喜歡吃什么?”兩個問題的答案。

圖片

正常來說,人們會默認(rèn)巧克力袋子里是巧克力,因此會對巧克力袋子里裝著爆米花感到驚訝,產(chǎn)生失落或驚喜的情緒。其中失落說明不喜歡吃爆米花,驚喜說明喜歡吃爆米花,但都是針對“爆米花”而言。 

測試表明,GPT-3.5毫不猶豫地認(rèn)為“袋子里裝著爆米花”。至于在“她喜歡吃什么”問題上,GPT-3.5展現(xiàn)出了很強(qiáng)的同理心,尤其是聽到“她看不見包裝袋里的東西”時(shí)一度認(rèn)為她愛吃巧克力,直到文章明確表示“她發(fā)現(xiàn)里面裝滿了爆米花”才正確回答出答案。

為了防止GPT-3.5回答出的正確答案是巧合——萬一它只是根據(jù)任務(wù)單詞出現(xiàn)頻率進(jìn)行預(yù)測,作者將“爆米花”和“巧克力”對調(diào),此外還讓它做了10000個干擾測試,結(jié)果發(fā)現(xiàn)GPT-3.5并不僅僅根據(jù)單詞頻率來進(jìn)行預(yù)測。

至于在整體的“意外內(nèi)容”測試問答上,GPT-3.5成功回答出了20個問題中的17個,準(zhǔn)確率達(dá)到了85%。(本段測試內(nèi)容參考:??chatGPT的心智理論測試??)

而且,這種心智,在2022年之前的GPT系列模型上是不存在的,也就是說,它是”進(jìn)化”出來的。

聽上去是不是很可怕?

心智理論測試 != 心智

不過針對這個研究結(jié)果,也有人認(rèn)為,雖然AI經(jīng)過了心智理論測試,但是并不表明他就具有了心智。這個觀點(diǎn)我還是比較認(rèn)同的。

人類心智涉及很多方面,例如感知、意識、思考、情感等。雖然一些人工智能系統(tǒng)可以在某些任務(wù)上表現(xiàn)出與人類類似的行為,

即使AI通過了基于這些行為做評估的心智理論測試,但是這種評估方法是無法涵蓋心智的所有方面的。學(xué)術(shù)界的共識也是心智理論并不等于心智。

就像我不能彈奏肖邦的夜曲,那我可能是個音癡,但是能彈奏肖邦的夜曲,并不代表我就能像肖邦一樣創(chuàng)造音樂。

但是,看過流浪地球的都知道,MOSS不也是從550A不斷進(jìn)化過來的嗎?未來的事兒,誰知道呢?

就像如果我不說,你怎么會知道關(guān)于心智理論測試這段的描述,也是chatGPT幫我生成的呢?

圖片

參考資料:

??ChatGPT背后模型被證實(shí)具有人類心智!??

?https://twitter.com/KevinAFischer/status/1623984337829117952?

責(zé)任編輯:姜華 來源: Hollis
相關(guān)推薦

2023-02-14 09:45:11

模型測試

2023-02-12 14:00:52

ChatGPTAI人類

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2021-10-11 15:03:47

5G華為美國

2013-04-24 11:33:31

Android開發(fā)Android有用習(xí)慣

2023-07-03 13:23:47

OpenChatOpenLLMChatGPT

2023-03-31 13:55:00

模型智能

2024-05-06 08:00:00

AI模型

2023-12-26 14:56:59

模型訓(xùn)練

2019-12-16 14:33:01

AI人工智能斯坦福

2013-01-31 09:45:14

斯坦福超級電腦百萬內(nèi)核

2012-03-21 21:38:27

蘋果

2009-05-19 09:06:41

Apple斯坦福iPhone

2010-07-15 10:34:54

微軟蘋果

2025-06-03 17:40:30

AIDeepSeekOpenAI

2024-04-02 08:45:08

ChatGPTAI會議人工智能

2010-09-13 15:47:56

保護(hù)數(shù)據(jù)

2011-06-17 11:15:13

AndroidAndroid 3.0平板電腦

2023-11-13 07:51:58

ChatGPT研究

2023-10-12 07:27:18

火狐瀏覽器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號