偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

MIT 團隊的新測試,將 AI 推理與人類思維進行比較

人工智能 機器學(xué)習(xí) 新聞
隨著機器學(xué)習(xí)越來越多地在現(xiàn)實世界中得到應(yīng)用,了解它如何得出結(jié)論以及它是否正確變得至關(guān)重要。

人工智能獲得洞察力和做出決策的方式通常是神秘的,這引發(fā)了人們對機器學(xué)習(xí)的可信度的擔憂。現(xiàn)在,在一項新研究中,研究人員揭示了一種新方法,用于比較人工智能軟件的推理與人類推理的匹配程度,以便快速分析其行為。

隨著機器學(xué)習(xí)越來越多地在現(xiàn)實世界中得到應(yīng)用,了解它如何得出結(jié)論以及它是否正確變得至關(guān)重要。例如,人工智能程序可能似乎準確地預(yù)測了皮膚病變是癌性的,但它可能是通過關(guān)注臨床圖像背景中不相關(guān)的印跡來做到這一點的。

「眾所周知,機器學(xué)習(xí)模型難以理解。」麻省理工學(xué)院計算機科學(xué)研究人員、一項關(guān)于人工智能可信度的新研究的主要作者 Angie Boggust 說,「知道一個模型的決定很容易,但知道這個模型為什么做出這個決定卻很難?!?/p>

文獻鏈接:http://shared-interest.csail.mit.edu/

理解 AI 推理的一種常見策略是檢查程序所關(guān)注的數(shù)據(jù)的特征——比如圖像或句子——以便做出決定。然而,這種所謂的顯著性方法通常一次只能對一個決策產(chǎn)生見解,并且必須手動檢查每個決策。人工智能軟件通常使用數(shù)百萬個數(shù)據(jù)實例進行訓(xùn)練,這使得人們幾乎不可能分析足夠多的決策來識別正確或不正確行為的模式。

「為人類用戶提供工具來詢問和理解他們的機器學(xué)習(xí)模型,對于確保機器學(xué)習(xí)模型可以安全地部署在現(xiàn)實世界中至關(guān)重要?!埂狝ngie Boggust

現(xiàn)在,麻省理工學(xué)院和 IBM 研究院的科學(xué)家們創(chuàng)造了一種方法來收集和檢查人工智能對其決策的解釋,從而可以快速分析其行為。這項名為「共享興趣」的新技術(shù)將人工智能決策的顯著性分析與人工注釋的數(shù)據(jù)庫進行比較。

例如,圖像識別程序可能會將圖片分類為狗的圖片,而顯著性方法可能會顯示程序突出顯示狗的頭部和身體的像素以做出決定。相比之下,共享興趣方法可能會將這些顯著性方法的結(jié)果與圖像數(shù)據(jù)庫進行比較,在圖像數(shù)據(jù)庫中,人們注釋了圖片的哪些部分是狗的部分。

基于這些比較,共享興趣方法然后要求計算人工智能的決策與人類推理的一致性,將其歸類為八種模式之一。一方面,人工智能可能被證明是完全符合人類思維的,程序做出正確的預(yù)測并突出數(shù)據(jù)中與人類相同的特征。另一方面,人工智能完全分心,人工智能做出了錯誤的預(yù)測,并且沒有突出人類所做的任何特征。

人工智能決策可能落入的其他模式,突出了機器學(xué)習(xí)模型正確或錯誤地解釋數(shù)據(jù)細節(jié)的方式。例如,共同的興趣可能會發(fā)現(xiàn),人工智能只根據(jù)拖拉機的一部分(比如輪胎)就可以正確識別圖像中的拖拉機,而不是像人類一樣識別整個車輛,或者發(fā)現(xiàn)人工智能可能只在圖片中也有摩托雪橇的情況下才能識別圖像中的摩托雪橇頭盔。

在實驗中,共同興趣有助于揭示人工智能程序是如何工作的,以及它們是否可靠。例如,Shared Interest 幫助皮膚科醫(yī)生從皮膚損傷的照片中快速查看程序?qū)Π┌Y診斷的正確和錯誤預(yù)測示例。最終,皮膚科醫(yī)生決定他不能相信這個程序,因為它根據(jù)不相關(guān)的細節(jié)而不是實際的病變做出了太多的預(yù)測。

在另一個實驗中,一位機器學(xué)習(xí)研究人員使用 Shared Interest 來測試他應(yīng)用于 BeerAdvocate 數(shù)據(jù)集的顯著性方法,幫助他在傳統(tǒng)手動方法所需時間的一小部分內(nèi)分析數(shù)千個正確和錯誤的決策。共同興趣有助于表明顯著性方法通常表現(xiàn)良好,但也揭示了以前未知的缺陷,例如高估評論中的某些單詞導(dǎo)致錯誤預(yù)測。

「為人類用戶提供工具來詢問和理解他們的機器學(xué)習(xí)模型對于確保機器學(xué)習(xí)模型可以安全地部署在現(xiàn)實世界中至關(guān)重要?!笲oggust 說。

研究人員警告說,共享興趣的表現(xiàn)與其采用的顯著性方法一樣好。Boggust 指出,每種顯著性方法都有其自身的局限性,Shared Interest 繼承了這些局限性。

未來,科學(xué)家們希望將共享興趣應(yīng)用于更多類型的數(shù)據(jù),例如醫(yī)療記錄中使用的表格數(shù)據(jù)。Boggust 補充說,另一個潛在的研究領(lǐng)域可能是自動估計 AI 結(jié)果中的不確定性。

科學(xué)家們已經(jīng)公開了共享興趣的源代碼。

源代碼:https://github.com/mitvis/shared-interest

相關(guān)報道:https://spectrum.ieee.org/-2657216063

責任編輯:張燕妮 來源: 人工智能學(xué)家
相關(guān)推薦

2022-04-11 15:40:34

機器學(xué)習(xí)研究推理

2020-08-27 19:52:34

AI人工智能

2021-12-09 15:03:10

人工智能AI人類思維

2024-10-11 12:56:20

2023-03-28 12:11:23

AI人類

2020-10-06 19:05:09

神經(jīng)網(wǎng)絡(luò)人類思維人工智能

2024-09-03 13:30:00

2025-05-21 13:52:39

LLM模型

2024-11-14 09:59:23

2024-01-17 08:18:18

2021-03-02 10:22:30

AI 數(shù)據(jù)人工智能

2018-11-19 12:27:09

2021-11-04 15:30:56

AI 數(shù)據(jù)人工智能

2021-09-30 09:34:15

人工智能AI深度學(xué)習(xí)

2016-12-16 10:55:19

2024-05-06 00:00:00

AITC0模型

2017-05-25 12:05:03

機器人軟體機器人大蜘蛛

2024-07-26 08:59:33

2020-12-13 17:55:54

AI人工智能

2024-12-12 09:00:00

點贊
收藏

51CTO技術(shù)棧公眾號