偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

搞科研新姿勢(shì):讓GPT-3給你打下手

人工智能
那么小哥他們?yōu)槭裁赐话l(fā)奇想地要用這種方式搞科研呢?這是因?yàn)樗麄儼l(fā)現(xiàn),對(duì)大型語(yǔ)料庫(kù)做深入的挖掘確實(shí)能得到一些有用的結(jié)果,但這個(gè)過(guò)程要是讓人類來(lái)搞,那簡(jiǎn)直就太費(fèi)時(shí)費(fèi)力了。

本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處

搞科研的最新姿勢(shì),被一位華人小哥解鎖了——

告訴AI你的研究目標(biāo),再把數(shù)據(jù)集“投喂”進(jìn)去,完事。

這就是來(lái)自伯克利的博士生Zhong Ruiqi等人的最新研究,把從海量數(shù)據(jù)集中繁瑣的“取證”過(guò)程,統(tǒng)統(tǒng)交給GPT-3來(lái)解決:

圖片

他們還發(fā)現(xiàn),這種用AI搞科研的方法不僅效率高,而且還能得出人類沒(méi)有想到的“意外驚喜”。

讓GPT-3幫你搞科研

那么小哥他們?yōu)槭裁赐话l(fā)奇想地要用這種方式搞科研呢?

這是因?yàn)樗麄儼l(fā)現(xiàn),對(duì)大型語(yǔ)料庫(kù)做深入的挖掘確實(shí)能得到一些有用的結(jié)果,但這個(gè)過(guò)程要是讓人類來(lái)搞,那簡(jiǎn)直就太費(fèi)時(shí)費(fèi)力了。

因此,他們便決定把這個(gè)繁瑣的過(guò)程交給GPT-3來(lái)處理,并把這個(gè)任務(wù)命名為“D5”:

Goal Driven Discovery of Distributional Differences via Language Descriptions.

通過(guò)語(yǔ)言描述,實(shí)現(xiàn)目標(biāo)驅(qū)動(dòng)的分布式差異的發(fā)現(xiàn)。

“D5”任務(wù)的過(guò)程,簡(jiǎn)單來(lái)說(shuō)就是兩個(gè)動(dòng)作:

  • 輸入研究目標(biāo)
  • 輸入兩個(gè)語(yǔ)料庫(kù)

圖片

例如在上面這個(gè)案例中,小哥先是給AI輸進(jìn)去了兩個(gè)語(yǔ)料庫(kù):

  • 語(yǔ)料庫(kù)A:服用藥物A后患者的反應(yīng)報(bào)告
  • 語(yǔ)料庫(kù)B:服用藥物B后患者的反應(yīng)報(bào)告

然后再向AI確定自己的研究目標(biāo),即“我想了解一下藥物A的副作用”。

在AI收到任務(wù)后,立刻開始執(zhí)行分析工作,最后得出了它的結(jié)論:

語(yǔ)料庫(kù)A中的樣本,有更多的患者會(huì)提到“妄想癥”(paranoia)。

不過(guò)試想一下,若讓人類科研人員做這項(xiàng)工作,光是了解語(yǔ)料庫(kù)A和B就需要花費(fèi)大量的時(shí)間,更別提還得進(jìn)一步做對(duì)比分析等工作了。

而D5任務(wù)之所以能夠做得如此絲滑,是因?yàn)樾「缢麄冊(cè)诖吮澈筮€做了不少工作。

例如構(gòu)建OpenD5元數(shù)據(jù)集,它包含符合D5任務(wù)的675個(gè)開放式問(wèn)題,所涉及領(lǐng)域涵蓋商業(yè)、社會(huì)科學(xué)、人文科學(xué)、健康和機(jī)器學(xué)習(xí)等。

圖片

并且每個(gè)開放式問(wèn)題都會(huì)對(duì)應(yīng)一個(gè)語(yǔ)料庫(kù)對(duì)兒(語(yǔ)料庫(kù)A和語(yǔ)料庫(kù)B),平均有17000個(gè)樣本。

小哥還把每個(gè)語(yǔ)料庫(kù)中的50%作為研究部分,另外50%則是拿來(lái)做驗(yàn)證。

基于此,小哥他們?cè)贅?gòu)建了一個(gè)“D5系統(tǒng)”,它的工作原理和人類從數(shù)據(jù)庫(kù)中獲取發(fā)現(xiàn)類似,分為兩個(gè)階段,即創(chuàng)造性地提出一個(gè)假設(shè),再在數(shù)據(jù)集上嚴(yán)格驗(yàn)證這個(gè)假設(shè)。

按照這種思路,研究人員接下來(lái)用GPT-3做了次實(shí)驗(yàn)。

他們先是向GPT3展示研究目標(biāo)和每個(gè)語(yǔ)料庫(kù)中的一些樣本,然后讓它提出一個(gè)假設(shè)列表。

最終實(shí)驗(yàn)發(fā)現(xiàn),GPT-3可以使用目標(biāo)描述來(lái)提出更相關(guān)、更新穎、更有意義的假設(shè)。

圖片

也正因?yàn)镺penD5數(shù)據(jù)集所涵蓋的領(lǐng)域眾多,因此小哥表示他們的D5系統(tǒng)具備應(yīng)用范圍廣的特點(diǎn)。

也存在一些缺陷

但對(duì)于這套D5系統(tǒng),小哥也直言不諱地道出了它的缺陷。

例如,若是語(yǔ)料庫(kù)中含有較多的俚語(yǔ)、俗語(yǔ)或者帶有情緒的詞匯,那么AI所給出的“發(fā)現(xiàn)”就會(huì)存在偏差。

簡(jiǎn)而言之,就是AI對(duì)于特定情況的詞匯或描述產(chǎn)生了錯(cuò)誤的理解和分析。

圖片

除此之外,小哥也表示更靈活的語(yǔ)料庫(kù)、更具擴(kuò)展性的系統(tǒng),也是他們?cè)谖磥?lái)重點(diǎn)研究的方向。

不過(guò)似乎這項(xiàng)研究讓小哥也是興奮不已,畢竟離他“構(gòu)建一個(gè)用AI稿科研”的夢(mèng)想更近了一步。

圖片

參考鏈接:

[1] ??https://arxiv.org/abs/2302.14233???
[2] ???https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20??

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2023-04-07 09:53:02

量子AI

2023-03-01 16:15:16

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-02-14 08:00:00

人工智能GPT-3語(yǔ)言模型

2022-03-30 15:20:19

AI自然語(yǔ)言模型

2021-03-23 15:21:00

人工智能機(jī)器學(xué)習(xí)技術(shù)

2023-06-08 15:33:31

人工智能GPT-3

2021-05-31 15:16:28

編程技能開發(fā)

2022-11-21 09:34:33

AI模型

2023-03-20 15:44:00

科研AI

2022-05-05 11:40:12

語(yǔ)言模型工作原理神經(jīng)元層

2020-08-21 13:22:12

GPT-3AI機(jī)器

2025-08-29 05:00:00

2020-08-23 08:57:55

編碼GPT-3開發(fā)

2024-10-28 07:10:00

scroll標(biāo)記前端網(wǎng)格布局

2025-02-17 11:41:14

2022-11-06 11:42:29

語(yǔ)言模型Nature

2022-03-24 10:35:38

人工智能模型代碼

2024-04-30 11:49:16

瀏覽器前端開發(fā)折疊屏應(yīng)用

2020-09-02 10:10:37

AI 數(shù)據(jù)人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)