偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<meter id="hf3ol"><td id="hf3ol"></td></meter>

^{<blockquote id="hf3ol"><i id="hf3ol"></i></blockquote>}^{<blockquote id="hf3ol"><i id="hf3ol"></i></blockquote>}

<style id="hf3ol"></style>

^{<sub id="hf3ol"><i id="hf3ol"></i></sub>}

<cite id="hf3ol"><label id="hf3ol"></label></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

一次只要0.003美元，比人類便宜20倍！ChatGPT讓數(shù)據(jù)標(biāo)注者危矣

作者：新智元 2023-03-31 13:23:31

最近，來自蘇黎世大學(xué)的研究團(tuán)隊(duì)發(fā)現(xiàn)，ChatGPT在多個(gè)NLP標(biāo)注任務(wù)上勝過眾包工作者，具有較高一致性，且每次標(biāo)注成本僅約0.003美元，比MTurk便宜20倍。

當(dāng)前，很多自然語言處理（NLP）應(yīng)用需要高質(zhì)量的標(biāo)注數(shù)據(jù)來支撐，特別是當(dāng)這些數(shù)據(jù)被用于訓(xùn)練分類器或評估無監(jiān)督模型的性能等任務(wù)中。

例如，人工智能研究人員通常希望過濾嘈雜的社交媒體數(shù)據(jù)的相關(guān)性，將文本分配到不同的主題或概念類別，或衡量其情緒或立場。

而且，無論這些任務(wù)使用什么具體方法（監(jiān)督、半監(jiān)督或無監(jiān)督），都需要標(biāo)注好的數(shù)據(jù)來建立一個(gè)訓(xùn)練集或黃金標(biāo)準(zhǔn)。

然而，在大多數(shù)情況下，要完成高質(zhì)量的數(shù)據(jù)標(biāo)注（data annotation）工作，依然離不開數(shù)據(jù)標(biāo)注平臺上的眾包工作者或諸如研究助理等訓(xùn)練有素的標(biāo)注者來手動(dòng)進(jìn)行。

通常情況下，訓(xùn)練有素的標(biāo)注者先創(chuàng)建一個(gè)相對較小的黃金標(biāo)準(zhǔn)數(shù)據(jù)集，然后雇用眾包工作者來增加標(biāo)注數(shù)據(jù)的數(shù)量，進(jìn)行重復(fù)性工作。根據(jù)規(guī)模大小和復(fù)雜程度，數(shù)據(jù)標(biāo)注任務(wù)有時(shí)會非常費(fèi)時(shí)費(fèi)力，不僅需要花費(fèi)一定的人力成本，而且也不能保證數(shù)據(jù)標(biāo)注的質(zhì)量。

那么，能否讓機(jī)器幫助人類完成這一基礎(chǔ)任務(wù)呢？

在以往的認(rèn)知中，機(jī)器并不擅長這類「慢工出細(xì)活」的任務(wù)，但出乎意料的是，「數(shù)據(jù)標(biāo)注」這件事已經(jīng)讓 ChatGPT 完成了，而且比大多數(shù)人做得還更好。

在一項(xiàng)今天發(fā)表的新研究中，來自蘇黎世大學(xué)的研究團(tuán)隊(duì)使用由 2382 條推文組成的樣本，證明了 ChatGPT 在相關(guān)性、主題和框架檢測等標(biāo)多個(gè)注任務(wù)上優(yōu)于眾包工作者。

相關(guān)研究論文以「ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks」為題，已發(fā)表在預(yù)印本網(wǎng)站 arXiv 上。

具體來說，ChatGPT 在五項(xiàng)任務(wù)的四項(xiàng)中的零樣本（zero-shot）準(zhǔn)確率超過了眾包工作者；在所有任務(wù)中表現(xiàn)出的編碼者間一致性（intercoder agreement）方面，ChatGPT 不僅超過了眾包工作者，也同樣超過了訓(xùn)練有素的標(biāo)注者。?

ChatGPT 零樣本文本數(shù)據(jù)標(biāo)注表現(xiàn)

值得一提的是，ChatGPT 的每個(gè)標(biāo)注成本只有不到 0.003 美元，而比數(shù)據(jù)標(biāo)注平臺便宜約 20 倍。

研究團(tuán)隊(duì)認(rèn)為，雖然需要進(jìn)一步的研究來更好地了解 ChatGPT 和其他 LLMs 在更廣泛的背景下的表現(xiàn)，但該研究結(jié)果表明，它們有可能改變研究人員進(jìn)行數(shù)據(jù)注釋的方式，極大地提高文本分類的效率，并破壞數(shù)據(jù)標(biāo)注平臺的部分商業(yè)模式。

至少，從目前來看，這些發(fā)現(xiàn)表明了更深入地研究 LLMs 的文本標(biāo)注特性和能力的重要性。

未來，研究團(tuán)隊(duì)將在 ChatGPT 在多種語言中的表現(xiàn)、ChatGPT 在多種類型的文本（社會媒體、新聞媒體、立法、演講等）中的表現(xiàn)、使用思維鏈（CoT）提示和其他策略來提高零樣本推理的性能等方面繼續(xù)努力。

值得一提的是，研究團(tuán)隊(duì)在進(jìn)行這項(xiàng)工作時(shí)，OpenAI 還沒有發(fā)布 GPT-4，如果讓 GPT-4 來完成數(shù)據(jù)標(biāo)注任務(wù)，又會是怎樣的結(jié)果呢？

參考資料：???https://arxiv.org/abs/2303.15056?

責(zé)任編輯：武曉燕來源：新智元

ChatGPT NLP MTurk

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="ograg"><p id="ograg"></p></sub>

<style id="ograg"></style><sub id="ograg"></sub>