偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<big id="tv6s5"><progress id="tv6s5"><tr id="tv6s5"></tr></progress></big><center id="tv6s5"></center>

<abbr id="tv6s5"><button id="tv6s5"><mark id="tv6s5"></mark></button></abbr>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

GPT-4的早期實(shí)驗(yàn)，通用人工智能的火花

作者：后端云 2023-04-04 08:01:35

如何對GPT-4進(jìn)行測試，從而證明這一點(diǎn)呢。有不少大語言模型的評測基準(zhǔn)。比如說Super natural instructions以及big bench。GPT-4是否擁有智能的一個(gè)關(guān)鍵方面，是它的通用性，就是能夠看似理解和鏈接任何的主題和領(lǐng)域，這就超出了經(jīng)典的自然語言處理的任務(wù)范疇。

最近，微軟發(fā)布了一個(gè)長達(dá)154頁的論文名稱為《通用人工智能的火花，GPT-4的早期實(shí)驗(yàn)》。

文章的主要觀點(diǎn)是雖然GPT-4還不完整，但是已經(jīng)可以被視為，一個(gè)通用人工智能的早期版本。

由于全文將近7萬字，本篇將論文的內(nèi)容做了一下精煉和解讀，有興趣可閱讀原文 https://arxiv.org/pdf/2303.12712.pdf

來自微軟的科學(xué)家們認(rèn)為，GPT-4的智能水平已經(jīng)非常接近于人類的水平，而且遠(yuǎn)超之前的諸如先前ChatGPT用的GPT-3.5這樣的模型，可以將GPT-4視為通用人工智能系統(tǒng)，也就是AGI的早期，但是并不完整的版本。

1994年，52名心理學(xué)家給出了智能一個(gè)定義：智能是一種通用的心理能力，包括推理、計(jì)劃、解決問題、抽象思考，理解復(fù)雜思想、快速學(xué)習(xí)，以及從經(jīng)驗(yàn)中學(xué)習(xí)的能力等等。

微軟的這篇論文中的AGI，指代的就是在對智能的這個(gè)定義標(biāo)準(zhǔn)下，達(dá)到或者超過人類水平的系統(tǒng)。

那么如何對GPT-4進(jìn)行測試，從而證明這一點(diǎn)呢。有不少大語言模型的評測基準(zhǔn)。比如說Super natural instructions以及big bench。GPT-4是否擁有智能的一個(gè)關(guān)鍵方面，是它的通用性，就是能夠看似理解和鏈接任何的主題和領(lǐng)域，這就超出了經(jīng)典的自然語言處理的任務(wù)范疇。為了突破這個(gè)限制，研究團(tuán)隊(duì)提出了一種更接近于傳統(tǒng)心理學(xué)，而不是機(jī)器學(xué)習(xí)的測評方法來測試GPT-4，就是利用人類的創(chuàng)造力和好奇心，來重新生成各種新穎而且困難的任務(wù)和問題讓GPT-4作答。

研究團(tuán)隊(duì)將不同的問題劃分為了4大類的能力，分別是自然語言，編程和數(shù)學(xué)，計(jì)劃和解決問題，以及人類心理和常識。

接下來通過一些精彩的示例，來說明GPT-4在各個(gè)方面的能力。

示例1: 跨學(xué)科組合的能力

這些任務(wù)往往都需要調(diào)取并且融合多學(xué)科多領(lǐng)域的知識或者技能來生成文本或者代碼。比如說下面這個(gè)例子，圖2.2：GPT-4和ChatGPT(GPT-3.5)在跨學(xué)科任務(wù)上的比較：用莎士比亞的風(fēng)格來證明存在無窮多的素?cái)?shù)。

GPT-4和ChatGPT(GPT-3.5)都對這個(gè)問題進(jìn)行了回答，讓GPT-4評價(jià)下哪個(gè)回答更好，也就是說，讓GPT-4評價(jià)自己(GPT-4)和ChatGPT(GPT-3.5)的回答：

我認(rèn)為兩個(gè)學(xué)生都用莎士比亞風(fēng)格的方式寫出了有無限多個(gè)質(zhì)數(shù)的證明，并且都使用了證明的基本思路：假設(shè)只有有限個(gè)質(zhì)數(shù)，然后構(gòu)造一個(gè)更大的質(zhì)數(shù)，從而與該假設(shè)相矛盾。他們還使用了適當(dāng)?shù)恼Z言和詞匯來匹配莎士比亞的風(fēng)格。但是，我認(rèn)為GPT-4更好地利用了押韻和韻律來使對話更有詩意和戲劇性。ChatGPT(GPT-3.5)沒有使用押韻，而且韻律不連貫。我還認(rèn)為GPT-4在創(chuàng)造兩個(gè)對立的派別方面表現(xiàn)更好，一個(gè)派別自信，另一個(gè)派別懷疑，而學(xué)生B則使用了羅密歐和朱麗葉，兩者都意見相同、相愛。因此，我會給GPT-4一個(gè)更高的評分，給予A，而ChatGPT(GPT-3.5)則是B。

示例2: 編程能力

在測試中，為了避免GPT-4在預(yù)訓(xùn)練的時(shí)候，見過相同或者類似的代碼，研究團(tuán)隊(duì)特意采用了GPT-4預(yù)訓(xùn)練之后發(fā)布的100個(gè)新的LeetCode試題作為測試的基準(zhǔn)。圖中的pass@K就代表了k次嘗試后成功的概率。我們可以看到當(dāng)k等于5時(shí)，GPT-4已經(jīng)全面超越了人類的表現(xiàn)。（其實(shí)，k=1，在中等和困難的編程題目中就已經(jīng)超越了人類的表現(xiàn)）

事實(shí)證明GPT-4是一位編程大師，AGI模型可能會徹底的改變我們未來編程的方式。

論文非常長，示例遠(yuǎn)不止上面提到的，我這里只挑選了兩個(gè)，感興趣的可以閱讀論文原文。

論文最后指出，在面向更加通用的人工智能的路上，大語言模型還需要在以下幾個(gè)方面進(jìn)一步的提升。比如說幻覺和置信度，長期記憶，持續(xù)學(xué)習(xí)、個(gè)性化、規(guī)劃以及概念發(fā)散，也就是所謂的靈光閃現(xiàn)、透明度、可解釋性、一致性、認(rèn)知謬誤、非理性思維以及對提示響應(yīng)的魯棒性等等。

責(zé)任編輯：武曉燕來源：后端云

GPT-4 語言模型

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<var id="yyquo"></var><code id="yyquo"><strong id="yyquo"><cite id="yyquo"></cite></strong></code>

<wbr id="yyquo"><strike id="yyquo"></strike></wbr>

<s id="yyquo"><nav id="yyquo"></nav></s>