2020年的5次AI和分析的災(zāi)難(事故)
在當(dāng)今隨著新技術(shù)的進(jìn)步,我們都知道數(shù)據(jù)的重要性。數(shù)據(jù)是新的石油。它已成為數(shù)字生態(tài)系統(tǒng)中最重要的支柱之一。組織依賴于有助于實(shí)現(xiàn)業(yè)務(wù)目標(biāo)的數(shù)據(jù)。每枚硬幣都有兩個(gè)方面,每一項(xiàng)積極的技術(shù)都會(huì)帶來(lái)一些負(fù)面影響,這些負(fù)面影響可能會(huì)使組織在收入和聲譽(yù)方面付出沉重的代價(jià)。
處理數(shù)據(jù)很重要。跟蹤數(shù)據(jù),理解數(shù)據(jù)并隨其增長(zhǎng)是至關(guān)重要的。但是同樣重要的是,了解數(shù)據(jù),了解最合適的工具并牢記公司目標(biāo)至關(guān)重要。
在此文章中,我們將討論對(duì)IT市場(chǎng)產(chǎn)生負(fù)面印象的5種分析和AI錯(cuò)誤。
1. 因?yàn)槌^(guò)電子表格數(shù)據(jù)限制導(dǎo)致丟失病例
2020年10月,負(fù)責(zé)清點(diǎn)新的COVID-19感染的英國(guó)政府機(jī)構(gòu)英國(guó)公共衛(wèi)生(PHE)透露,在9月25日至10月2日之間未報(bào)告近16,000例冠狀病毒病例。Microsoft Excel中的數(shù)據(jù)限制。但是,由于Excel數(shù)據(jù)限制,僅在一個(gè)工作表中列出了16,384列和1,048,576行。PHE以列格式列出,最終丟失了記錄轉(zhuǎn)換成的記錄。即使發(fā)現(xiàn)了數(shù)據(jù),然后將報(bào)告發(fā)送給了患者,這種技術(shù)故障也扼殺了合同的追蹤工作。
"小故障"并沒(méi)有阻止接受測(cè)試的人接收其結(jié)果,但是它確實(shí)阻礙了聯(lián)系追蹤的工作,使英國(guó)國(guó)家衛(wèi)生局(NHS)難以識(shí)別并通知與感染患者密切聯(lián)系的個(gè)人。
2. 亞馬遜AI招聘工具僅推薦男性
亞馬遜在其招聘流程中使用基于AI的招聘工具,該工具可以輕松篩選成千上萬(wàn)張簡(jiǎn)歷和個(gè)人資料,以找到最適合該職位的候選人,同時(shí)給出1到5的評(píng)分。該工具的缺點(diǎn)是訓(xùn)練數(shù)據(jù)集基于AI的工具中使用的大多數(shù)男性候選人。因此,該系統(tǒng)對(duì)女性申請(qǐng)人和首選男性申請(qǐng)人進(jìn)行了處罰。
該公司試圖編輯該工具以使其中立,但最終決定不能保證它不會(huì)學(xué)習(xí)其他分類候選人的歧視性方式,從而結(jié)束了該項(xiàng)目。
3. 訓(xùn)練有素的微軟對(duì)話機(jī)器人發(fā)出種族主義推文

在2016年,微軟使用Twitter交互來(lái)訓(xùn)練Chatbot機(jī)器學(xué)習(xí)算法,結(jié)果證明這是一場(chǎng)災(zāi)難。AI聊天機(jī)器人Tay是根據(jù)具有自然語(yǔ)言處理和機(jī)器學(xué)習(xí)功能的少女角色開(kāi)發(fā)的,但最終發(fā)現(xiàn)超過(guò)95,000條推文,表明他們是厭惡,種族主義和反猶太人的推文。
微軟研究與孵化公司副總裁彼得·李(Peter Lee)表示:"對(duì)于泰伊(Tay)的無(wú)意冒犯性和令人發(fā)指的推文,我們深表歉意。這些推文并不代表我們是誰(shuí),我們代表什么,也不代表我們?nèi)绾卧O(shè)計(jì)泰伊(Tay)。事件發(fā)生后,在Microsoft官方博客上的帖子中寫道。
機(jī)器學(xué)習(xí)和人工智能如何改變電子商務(wù)的面貌?|數(shù)據(jù)驅(qū)動(dòng)…如今,這家電子商務(wù)開(kāi)發(fā)公司整合了先進(jìn)技術(shù),將客戶體驗(yàn)提升到了一個(gè)新的高度……
4. 醫(yī)療算法忽略了黑人患者
2019年,《科學(xué)》雜志的一項(xiàng)研究表明,保險(xiǎn)公司和醫(yī)院使用的醫(yī)療保健預(yù)測(cè)算法最有可能在確定高風(fēng)險(xiǎn)護(hù)理管理計(jì)劃的同時(shí)將黑人患者拒之門外。該計(jì)劃的動(dòng)機(jī)是培訓(xùn)初級(jí)保健和護(hù)理人員以監(jiān)測(cè)慢性病患者,以降低嚴(yán)重并發(fā)癥的發(fā)生率。但是,該算法建議白人患者,而黑人患者則處于高風(fēng)險(xiǎn)中。此算法包含一些因素,使其代表這樣的結(jié)果,包括保險(xiǎn),低收入,醫(yī)療保健等。
研究發(fā)現(xiàn),該算法使用醫(yī)療保健支出作為確定個(gè)人醫(yī)療保健需求的代理。但是根據(jù)《科學(xué)美國(guó)人》的報(bào)道,較病的黑人患者的醫(yī)療保健費(fèi)用與較健康的白人的醫(yī)療費(fèi)用相當(dāng),這意味著即使他們的需求更大,他們的風(fēng)險(xiǎn)評(píng)分也較低。
該研究的研究人員認(rèn)為,可能有一些因素在起作用。首先,有色人種的收入較低的可能性更高,即使有保險(xiǎn),也可能使他們獲得醫(yī)療服務(wù)的可能性降低。內(nèi)隱的偏見(jiàn)也可能導(dǎo)致有色人種獲得較低質(zhì)量的護(hù)理。
5. Target 分析程序侵犯了隱私
深入了解客戶世界的最簡(jiǎn)單方法是借助數(shù)據(jù)。借助預(yù)測(cè)分析,可以深入了解用戶的狀況。但是,Target的營(yíng)銷部門使用此算法來(lái)找到懷孕的客戶。由于家庭中有關(guān)懷孕少女的最新消息導(dǎo)致令人毛骨悚然的結(jié)果,結(jié)果很快成為災(zāi)難。使用該算法的動(dòng)機(jī)是分析用戶的習(xí)慣,但結(jié)果卻完全不同。
與所有其他大型零售商一樣,塔吉特(Target)一直通過(guò)購(gòu)物者代碼,信用卡,調(diào)查等收集有關(guān)其客戶的數(shù)據(jù)。它將數(shù)據(jù)與所購(gòu)買的人口統(tǒng)計(jì)數(shù)據(jù)和第三方數(shù)據(jù)混合在一起。通過(guò)處理所有數(shù)據(jù),Target的分析團(tuán)隊(duì)可以確定Target出售的大約25種產(chǎn)品可以一起分析以產(chǎn)生"懷孕預(yù)測(cè)"得分。然后,營(yíng)銷部門可以通過(guò)優(yōu)惠券和營(yíng)銷信息來(lái)針對(duì)高分客戶。
原文鏈接:
https://medium.com/datadriveninvestor/5-ai-and-analytics-disasters-in-2020-efcc8848bf78)