再一次改變“AI”世界 GPT-4千呼萬(wàn)喚始出來(lái)

近段時(shí)間,人工智能聊天機(jī)器人ChatGPT刷爆網(wǎng)絡(luò),網(wǎng)友們爭(zhēng)先恐后去領(lǐng)略它的超高情商和巨大威力。參加高考、修改代碼、構(gòu)思小說(shuō)……它在廣大網(wǎng)友的“鞭策”下不斷突破自我,甚至可以用一整段程序,為你拼接出一只小狗。而這些技能只是基于GPT-3.5開(kāi)發(fā)而來(lái),在3月15日,AI世界再次更新,最新版本的GPT-4也被OpenAI發(fā)布了出來(lái)。
與之前相比,GPT-4不僅展現(xiàn)了更加強(qiáng)大的語(yǔ)言理解能力,還能夠處理圖像內(nèi)容,在考試中的得分甚至能超越90%的人類(lèi)。那么,如此“逆天”的GPT-4還具有哪些能力?它又是如何煉成的呢?
“逆天”的GPT-4
在發(fā)布了GPT-4后,OpenAI官網(wǎng)一度發(fā)生擁堵,很多用戶(hù)在社交媒體里面表示他們立刻訂閱了Plus服務(wù)。GPT-4在發(fā)布后,“GPT-4”這一詞條迅速登上美國(guó)、日本等地區(qū)熱榜,也登上了國(guó)內(nèi)的微博熱搜榜、抖音熱榜社會(huì)榜等。
據(jù)OpenAI官方介紹,GPT-4是一個(gè)大型的多模式模型,可以接收?qǐng)D像和文本輸入,輸出文本。雖然它在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類(lèi),但在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類(lèi)水平的性能。比如GPT-4可以通過(guò)模擬SAT(美國(guó)學(xué)術(shù)能力評(píng)估測(cè)驗(yàn)),并取得前10%的成績(jī),而GPT-3.5的成績(jī)則在最后10%之列。

我們看到,在官方演示視頻中,Open?AI總裁兼聯(lián)合創(chuàng)始人Greg?Brockman還讓用戶(hù)先睹為快,了解最新版系統(tǒng)的圖像識(shí)別功能,該系統(tǒng)尚未公開(kāi),僅由一家名為Be?My?Eyes的公司測(cè)試。該功能將允許?GPT-4?分析和響應(yīng)與提示一起提交的圖像,并根據(jù)這些圖像回答問(wèn)題或執(zhí)行任務(wù)?!癎PT-4?不僅僅是一種語(yǔ)言模型,它還是一種視覺(jué)模型,”Brockman表示,“它可以靈活地接受任意穿插圖像和文本的輸入,有點(diǎn)像文檔?!?/p>
在演示的另一個(gè)時(shí)刻,Greg?Brockman向GPT-4提交了一張手繪和初步網(wǎng)站草圖的照片,系統(tǒng)創(chuàng)建了一個(gè)工作基于繪圖的網(wǎng)站。


??業(yè)界認(rèn)為,ChatGPT-4比GPT-3強(qiáng)大571倍,最受益于這一最新成果的三大職業(yè)就是作家、市場(chǎng)營(yíng)銷(xiāo)人員和創(chuàng)業(yè)者。根據(jù)對(duì)兩者比較,業(yè)界人士還指出GPT-4的其他優(yōu)勢(shì),如訓(xùn)練數(shù)據(jù)更多、答復(fù)更加多樣性和有創(chuàng)意性以及反應(yīng)所需時(shí)長(zhǎng)更短,一秒即可。

我們認(rèn)為,這種升級(jí)體現(xiàn)的一個(gè)主要趨勢(shì)就是多模態(tài),模型變得更加復(fù)雜龐大,可以將不同類(lèi)型的數(shù)據(jù)放入同一模型,對(duì)我們周邊的環(huán)境和真實(shí)世界做出更好的理解。
此外,在多語(yǔ)種方面,GPT-4也體現(xiàn)出優(yōu)越性。在測(cè)試的26種語(yǔ)言中,GPT-4在24種語(yǔ)言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語(yǔ)言模型的英語(yǔ)語(yǔ)言性能,其中包括部分低資源語(yǔ)言如拉脫維亞語(yǔ)、威爾士語(yǔ)等。在中文語(yǔ)境中,GPT-4能夠達(dá)到80.1%的準(zhǔn)確性。
不過(guò),OpenAI也在官方網(wǎng)站上給出了GPT-4存在的不足,其仍然存在包括社會(huì)偏見(jiàn)、捏造事實(shí)、對(duì)抗生成等已知限制。OpenAI對(duì)此表示,隨著社會(huì)對(duì)AI模型的接受,將增加透明度,鼓勵(lì)并促進(jìn)用戶(hù)教育和更廣泛的人工智能素養(yǎng),并致力于擴(kuò)大人們?cè)谂囵B(yǎng)AI模型方面的輸入途徑。
GPT-4可以商業(yè)化了
隨著GPT-4的發(fā)展,我們發(fā)現(xiàn)它的能力雖然在很多現(xiàn)實(shí)場(chǎng)景中不如人類(lèi),但在各種專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)測(cè)試中表現(xiàn)出了與人類(lèi)相當(dāng)?shù)乃?,這也意味著,GPT-4確實(shí)在商業(yè)化上更進(jìn)一步了。
此前,GPT-3在專(zhuān)業(yè)領(lǐng)域的表現(xiàn)一直被人們認(rèn)為差強(qiáng)人意,在美國(guó)的律師資格考試Uniform?Bar?Exam?(MBE+MEE+MPT)中,GPT-3.5只能排在倒數(shù)10%,而GPT-4的成績(jī)則已經(jīng)可以排到前10%。GPT-4在專(zhuān)業(yè)領(lǐng)域的能力實(shí)現(xiàn)了巨大提升,在一些專(zhuān)業(yè)領(lǐng)域已經(jīng)開(kāi)始逐漸接近甚至超過(guò)人類(lèi),這給GPT-4在很多ToB商業(yè)領(lǐng)域提供了更多可能性。
比如專(zhuān)業(yè)技能輔助工具,知識(shí)檢索類(lèi)的應(yīng)用,職業(yè)教培輔導(dǎo)等領(lǐng)域,GPT-4帶來(lái)的能力可能將會(huì)是革命性的。
GPT-4發(fā)布之后,微軟在第一時(shí)間表示:“如果你在過(guò)去五周內(nèi)的任何時(shí)候使用過(guò)新的Bing預(yù)覽版,你就已經(jīng)提前了解了OpenAI最新模型的強(qiáng)大功能”。這表示New?Bing早已經(jīng)用上了GPT-4,在過(guò)去幾周,很多人體驗(yàn)的必應(yīng)就是GPT-4加強(qiáng)過(guò)的,僅僅開(kāi)放使用了文字能力而已。雖然微軟沒(méi)有用全球首發(fā)的字眼來(lái)描述,畢竟微軟在OpenAPI上已經(jīng)投入了130億美元(約合人民幣900億元),換來(lái)的這樣的待遇也是情理之中。
除了微軟的New?Bing外,目前還有多家公司將GPT-4搭載到他們的產(chǎn)品中,包括語(yǔ)言學(xué)習(xí)工具軟件多鄰國(guó)(Duolingo)、幫助視障用戶(hù)的軟件BeMyEyes、移動(dòng)支付公司Stripe、國(guó)際性金融服務(wù)公司摩根士丹利等。
但不得不承認(rèn)的是,雖然GPT-4大幅拓寬了大模型可能落地的商業(yè)化場(chǎng)景,但算力、研發(fā)成本,仍被很多人認(rèn)為是大模型落地過(guò)程中很難跨過(guò)的障礙。畢竟大模型的研發(fā)、算力支出在目前看來(lái)高得嚇人,此前ChatGPT公開(kāi)的單次訓(xùn)練、日常運(yùn)營(yíng)開(kāi)支都是以百萬(wàn)美元為單位的,短期內(nèi)想要商用可能很難控制成本。
GPT發(fā)展史
眾所周知,ChatGPT是OpenAI公司研發(fā)的一個(gè)大型自然語(yǔ)言處理模型,但很多人不知道,它的發(fā)展歷程可以追溯到2015年。2015年,OpenAI由特斯拉的馬斯克、Sam?Altman及其他投資者共同創(chuàng)立,旨在通過(guò)先進(jìn)的人工智能技術(shù)推動(dòng)人工智能領(lǐng)域的發(fā)展。而馬斯克則在2018年時(shí)因公司發(fā)展方向分歧而離開(kāi)。
此前,OpenAI因推出?GPT系列自然語(yǔ)言處理模型而聞名。從2018年起,OpenAI就開(kāi)始發(fā)布生成式預(yù)訓(xùn)練語(yǔ)言模型GPT(Generative?Pre-trained?Transformer),可用于生成文章、代碼、機(jī)器翻譯、問(wèn)答等各類(lèi)內(nèi)容。
每一代GPT模型的參數(shù)量都爆炸式增長(zhǎng),2019年2月發(fā)布的GPT-2參數(shù)量為15億,在2020年5月,當(dāng)OpenAI發(fā)布了GPT-3,它已經(jīng)是世界上最先進(jìn)的自然語(yǔ)言生成模型。GPT-3具有1750億個(gè)參數(shù)。
GPT-3出現(xiàn)時(shí),作為一個(gè)無(wú)監(jiān)督模型(現(xiàn)在經(jīng)常被稱(chēng)為自監(jiān)督模型),幾乎可以完成自然語(yǔ)言處理的絕大部分任務(wù),例如面向問(wèn)題的搜索、閱讀理解、語(yǔ)義推斷、機(jī)器翻譯、文章生成和自動(dòng)問(wèn)答等等。
而且,該模型在諸多任務(wù)上表現(xiàn)卓越,例如在法語(yǔ)-英語(yǔ)和德語(yǔ)-英語(yǔ)機(jī)器翻譯任務(wù)上達(dá)到當(dāng)前最佳水平,自動(dòng)產(chǎn)生的文章幾乎讓人無(wú)法辨別出自人還是機(jī)器,更令人驚訝的是在兩位數(shù)的加減運(yùn)算任務(wù)上達(dá)到幾乎100%的正確率,甚至還可以依據(jù)任務(wù)描述自動(dòng)生成代碼。一個(gè)無(wú)監(jiān)督模型功能多效果好,似乎讓人們看到了通用人工智能的希望,可能這就是GPT-3影響如此之大的主要原因。
2021年,OpenAI宣布將推出一個(gè)新的名稱(chēng),名為“DALL-E",這是一種能夠生成圖像的人工智能技術(shù)。同時(shí),OpenAI也在研發(fā)更加先進(jìn)的自然語(yǔ)言處理技術(shù)。
此后的故事相信大家都很清楚了,2022年底基于GPT-3.5的ChatGPT以光速席卷全球,成為全球最大的“科技明細(xì)”,直到現(xiàn)在GPT-4的發(fā)布更是登上多國(guó)熱搜。

寫(xiě)在最后
GPT的未來(lái)怎么樣?可以預(yù)見(jiàn)的是,隨著算法技術(shù)和算力技術(shù)的不斷進(jìn)步,ChatGPT也將會(huì)進(jìn)一步走向更先進(jìn)功能更強(qiáng)的版本,在越來(lái)越多的領(lǐng)域進(jìn)行應(yīng)用,為人類(lèi)生成更多更美好的對(duì)話(huà)和內(nèi)容。
也許GPT距離正在的“AI”還有距離,但我們不妨把它當(dāng)做一個(gè)起點(diǎn),一個(gè)全新“AI”時(shí)代的起點(diǎn)。















 
 
 






 
 
 
 