MIT新研究表明機(jī)器學(xué)習(xí)不能標(biāo)記假新聞
麻省理工學(xué)院研究人員發(fā)表的兩篇新論文顯示,當(dāng)前的機(jī)器學(xué)習(xí)模型還不能完成區(qū)分虛假新聞報(bào)道的任務(wù)。在不同的研究人員表明計(jì)算機(jī)可以令人信服地生成虛構(gòu)新聞故事而無(wú)需太多人為監(jiān)督之后,一些專家希望可以訓(xùn)練基于相同機(jī)器學(xué)習(xí)的系統(tǒng)來(lái)檢測(cè)此類新聞。但是麻省理工學(xué)院的博士生Tal Schuster的研究表明,盡管機(jī)器學(xué)習(xí)模型擅長(zhǎng)檢測(cè)機(jī)器生成的文本,但它們無(wú)法識(shí)別故事是真實(shí)還是虛假的。
許多自動(dòng)的事實(shí)檢查系統(tǒng)都使用稱為事實(shí)提取和驗(yàn)證(FEVER)的真實(shí)陳述數(shù)據(jù)庫(kù)進(jìn)行培訓(xùn)。
在一項(xiàng)研究中,Schuster和他的團(tuán)隊(duì)表明,即使他們知道肯定的陳述是正確的(“Greg說(shuō)他的汽車是藍(lán)色的”),機(jī)器學(xué)習(xí)事實(shí)檢查系統(tǒng)也難以處理否定的陳述(“Greg從未說(shuō)過(guò)他的車不是藍(lán)色的”)
研究人員表示,問(wèn)題在于數(shù)據(jù)庫(kù)充滿了人為的偏見。創(chuàng)建FEVER的人傾向于將其錯(cuò)誤條目寫為否定陳述,而將其真實(shí)陳述寫為肯定陳述-因此計(jì)算機(jī)學(xué)會(huì)了將帶有否定陳述的句子評(píng)為虛假。
這意味著系統(tǒng)正在解決一個(gè)比檢測(cè)虛假新聞更容易的問(wèn)題。麻省理工學(xué)院教授Regina Barzilay表示:“如果為自己創(chuàng)造一個(gè)簡(jiǎn)單的目標(biāo),就可以實(shí)現(xiàn)該目標(biāo)。但是,它仍然無(wú)法使您將虛假新聞與真實(shí)新聞區(qū)分開。”
兩項(xiàng)研究均由Schuster帶領(lǐng),并由MIT合作者團(tuán)隊(duì)完成。
最重要的是:第二項(xiàng)研究表明,機(jī)器學(xué)習(xí)系統(tǒng)可以很好地檢測(cè)機(jī)器編寫的故事,但不能將真實(shí)的故事與虛假的故事區(qū)分開。