偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

更新、挑錯(cuò)、識(shí)別假新聞,MIT推出維基百科AI編輯系統(tǒng)

新聞 人工智能
該系統(tǒng)可精確定位并替換相關(guān)維基百科句子中的特定信息,同時(shí)使用類(lèi)似于人類(lèi)的書(shū)寫(xiě)和編輯方式的語(yǔ)言。

 [[334141]]

維基百科作為任何人都可以編輯的在線百科全書(shū),需要大量的志愿者編輯花費(fèi)大量時(shí)間精力來(lái)讓每一個(gè)詞條保持最新。雖然志愿者編輯有很多,但要保障每天成千上萬(wàn)的頁(yè)面及時(shí)更新,仍是一件極具挑戰(zhàn)的任務(wù)。

  不久前,麻省理工學(xué)院的研究人員推出了一種新的 AI 系統(tǒng),該系統(tǒng)可用于自動(dòng)更新在線百科全書(shū)中的任何不準(zhǔn)確之處,從而為人類(lèi)編輯們提供幫助。

  麻省理工學(xué)院計(jì)算機(jī)科學(xué)和 AI 實(shí)驗(yàn)的博士生 Darsh Shah 說(shuō)道,“維基百科的文章需要不斷更新,因此需要數(shù)百人來(lái)修改每篇文章,而 AI 可以自動(dòng)完成修改,這極大提高了效率。”

  研究人員提出了一種文本系統(tǒng),該系統(tǒng)可精確定位并替換相關(guān)維基百科句子中的特定信息,同時(shí)使用類(lèi)似于人類(lèi)的書(shū)寫(xiě)和編輯方式的語(yǔ)言。

  當(dāng)人們?cè)诮缑孑斎霂в懈滦畔⒌姆墙Y(jié)構(gòu)化句子時(shí),AI 會(huì)在維基百科中搜索正確的頁(yè)面和過(guò)時(shí)的信息,然后以類(lèi)似于人類(lèi)的語(yǔ)言風(fēng)格呈現(xiàn)內(nèi)容。

  此前也存在許多其他可以自動(dòng)進(jìn)行維基百科編輯的機(jī)器人,但 Shah 說(shuō)道,“這些工具更多的是基于規(guī)則,將一些狹義的信息放入預(yù)定義的模版中,然而編輯的任務(wù)更多的是需要對(duì)兩個(gè)句子中相互矛盾的部分進(jìn)行推理,然后生成連貫的文本句子。研究人員的模型解決了這個(gè)問(wèn)題,通過(guò)輸入一條非結(jié)構(gòu)化的信息,模型以人性化的方式自動(dòng)修改句子。”

AI 識(shí)別矛盾信息

  識(shí)別兩個(gè)單獨(dú)的句子之間的矛盾信息,并將它們?nèi)诤显谝黄?,這對(duì)于人類(lèi)而言是一項(xiàng)十分容易的任務(wù),但對(duì)于機(jī)器學(xué)習(xí)而言卻是一項(xiàng)新穎的任務(wù)。

  例如原始的句子:“基金 A 認(rèn)為活躍運(yùn)營(yíng)公司中的 42 種少數(shù)股權(quán)中有 28 種對(duì)集團(tuán)特別重要”,而最新的信息則是:“基金 A 認(rèn)為 43 個(gè)少數(shù)股權(quán)中有 23 個(gè)意義重大”。

  根據(jù)這兩個(gè)句子,系統(tǒng)將首先找到有關(guān) “基金 A” 的相關(guān)維基百科文本,然而自動(dòng)去除過(guò)時(shí)的數(shù)字 28 和 42,并用新的數(shù)字 23 和 43 替換它們。

更新、挑錯(cuò)、識(shí)別假新聞,MIT 推出維基百科 AI 編輯系統(tǒng)

  一般來(lái)說(shuō),該系統(tǒng)在包含句子對(duì)的流行數(shù)據(jù)集上進(jìn)行訓(xùn)練,其中一個(gè)句子是聲明,另一個(gè)是相關(guān)的維基百科的句子。每對(duì)都用三種方式進(jìn)行標(biāo)記:同意,表示句子匹配;不同意,表示存在矛盾的信息;中性,表示沒(méi)有足夠的信息可用于任何一個(gè)標(biāo)簽。

  系統(tǒng)的目標(biāo)是修改所有過(guò)時(shí)的句子,達(dá)到相應(yīng)的要求,也要使所有不一致的句子對(duì)都達(dá)到 “同意”。因此,這就需要使用單獨(dú)的模型來(lái)產(chǎn)生所需的輸出。

  該模型是事實(shí)檢查分類(lèi)器,預(yù)先將每個(gè)句子對(duì)標(biāo)記為 “同意”、“不同意” 或 “中立”,重點(diǎn)關(guān)注 “不同意” 的句子對(duì)。與分類(lèi)器一起運(yùn)行的是一個(gè)自定義的 “中性屏蔽器” 模塊,該模塊可識(shí)別過(guò)時(shí)句子中的哪些詞與聲明中的句子相矛盾。它在過(guò)時(shí)的句子上創(chuàng)建了一個(gè)二進(jìn)制 “掩碼”,其中 0 放在最有可能需要?jiǎng)h除的單詞上,而 1 放在保留的單詞上。

  屏蔽之后,在過(guò)時(shí)的句子處使用兩個(gè)編碼器 - 解碼器框架,對(duì)需要?jiǎng)h除的單詞(用 0 覆蓋的單詞)結(jié)合不同的信息來(lái)融合填補(bǔ)。

  該模型與其他幾種傳統(tǒng)的文本生成方法相比,在更新事實(shí)信息時(shí)更加準(zhǔn)確,其輸出與人類(lèi)寫(xiě)作更加相似。在一項(xiàng)測(cè)試中,研究人員根據(jù)模型的輸出句子包含事實(shí)更新和匹配人類(lèi)語(yǔ)法的程度對(duì)該模型進(jìn)行了評(píng)分(從 1 到 5),該模型的事實(shí)更新平均得到達(dá)到了 4,語(yǔ)法匹配得分為 3.85,高于了其他所有傳統(tǒng)方法。

  研究人員希望未來(lái) AI 能夠自動(dòng)完成整個(gè)過(guò)程,也就意味著它可以在網(wǎng)上搜索某個(gè)相關(guān)主題的最新新聞,并替換文本,自動(dòng)化更新維基百科上過(guò)時(shí)的信息。

擴(kuò)充數(shù)據(jù)集,消除誤差

  該研究還表明,當(dāng)訓(xùn)練 “假新聞” 的檢測(cè)器時(shí),該系統(tǒng)可用于增強(qiáng)數(shù)據(jù)集,以消除偏見(jiàn)。

  “假新聞” 是一種包含虛假信息的宣傳方式,旨在博人眼球,誤導(dǎo)讀者或是引導(dǎo)公眾輿論。這些部分檢測(cè)器在同意 - 不同意對(duì)的數(shù)據(jù)集上進(jìn)行訓(xùn)練,匹配給定的證據(jù)來(lái)驗(yàn)證真假新聞。在這些句子對(duì)中,聲明可將某些信息與維基百科上的支持 “證據(jù)” 相比較,模型經(jīng)過(guò)訓(xùn)練,通過(guò)反駁證據(jù),將句子標(biāo)記為 “假”,從而幫助識(shí)別假新聞。

  但數(shù)據(jù)集往往帶有意想不到的偏差。Shah 說(shuō)道,“在訓(xùn)練過(guò)程中,模型按照人類(lèi)的書(shū)面語(yǔ)言要求將某些語(yǔ)言標(biāo)記為假例,而不必過(guò)多依賴(lài)相應(yīng)的證據(jù)語(yǔ)句。這會(huì)降低模型在評(píng)估實(shí)際示例中的準(zhǔn)確性,因?yàn)樗粓?zhí)行事實(shí)檢查。”

  因此,研究人員使用了相同刪除和融合技術(shù),來(lái)平衡數(shù)據(jù)集中的不同意對(duì),并幫助減輕偏見(jiàn),在某些 “不同意” 對(duì)中,他們使用修改后的句子中的虛假信息來(lái)重新生成偽造的 “證據(jù)” 支持句子,某些短句也同時(shí)存在于 “同意” 和 “不同意” 句子中,這將使得模型分析更多的特征,得到擴(kuò)充的數(shù)據(jù)集。

  研究人員利用這一方法將一種流行的假新聞檢測(cè)器的錯(cuò)誤率降低了 13%。

維基百科部署 AI 編輯

  早在 2015 年,維基百科就構(gòu)建了一個(gè)人工智能引擎,旨在自動(dòng)分析維基百科的更改。

  由于任何人都可以編輯維基百科,那么任何人都可以錯(cuò)誤地添加虛假信息,破壞站點(diǎn),所以最早的維基百科建立了嚴(yán)格的篩選制度,阻止了很多人加入維基百科的編輯行列。

  Halfaker 是維基百科的資深研究科學(xué)家,他建立了自己的 AI 引擎來(lái)識(shí)別這種破壞行為,以更友好的方式提高新手的參與度。同時(shí)他也承認(rèn),“這項(xiàng)服務(wù)無(wú)法捕獲所有破壞行為,但它可以捕獲最多的破壞。”

  Halfaker 的項(xiàng)目實(shí)際上是為了增加人們對(duì)維基百科的參與,而放到 5 年后的今天,新的文本系統(tǒng)的出現(xiàn),可自動(dòng)更新維基百科的信息,極大減少了志愿編輯者的工作,編輯者也朝著被淘汰的方向行走。

  機(jī)器越來(lái)越智能,機(jī)器自動(dòng)化替代人類(lèi)工作也越來(lái)越普遍,人類(lèi)是否會(huì)被機(jī)器替代也是當(dāng)下的熱點(diǎn)話題。有人預(yù)測(cè) AI 和機(jī)器人技術(shù)將在未來(lái) 20 年內(nèi)取代我們多達(dá) 47% 的工作,但同時(shí)也有人認(rèn)為 AI 將創(chuàng)造大量新工作。

  未來(lái)的事誰(shuí)都說(shuō)不準(zhǔn),我們唯一能做的是把握當(dāng)下。

 

 

責(zé)任編輯:張燕妮 來(lái)源: 鈦媒體
相關(guān)推薦

2013-10-30 16:54:46

維基百科維基百科的衰落

2024-03-04 13:13:57

AI人工智能

2010-07-06 09:06:54

維基百科數(shù)據(jù)中心斷電宕機(jī)

2019-10-16 11:52:15

MIT機(jī)器學(xué)習(xí)

2021-08-03 14:01:53

Vue.js維基百科框架

2019-04-02 09:57:29

阿里AI自然語(yǔ)言

2013-04-25 09:53:52

MariaDB

2012-08-08 09:50:58

2012-02-10 09:51:13

Java

2013-09-17 09:49:38

大數(shù)據(jù)NoSQLMariaDB

2017-06-03 16:08:09

HTTPS互聯(lián)網(wǎng)維基

2013-11-29 14:11:25

開(kāi)源開(kāi)源軟件

2013-04-25 10:43:33

維基百科MySQLMariaDB

2023-02-13 11:43:26

CHATGPT人工智能

2009-11-19 09:22:08

互聯(lián)網(wǎng)10年10大重要

2017-01-03 08:41:52

科技新聞早報(bào)谷歌

2015-06-23 11:23:26

行業(yè)百科頻道

2013-10-15 15:50:31

互動(dòng)百科
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)