51CTO讀者成長計(jì)劃社群招募,咨詢小助手(微信號:CTOjishuzhan)
作者 | Philipp Brauner,Alexander Hick,Ralf Philipsen,Martina Ziefle
譯者 | 王瑞平
人工智能(AI)已經(jīng)在醫(yī)學(xué)、商業(yè)、制造業(yè)和交通運(yùn)輸中無處不在,并正在滲透進(jìn)每個(gè)人的生活。公眾對其看法褒貶不一,要么欽佩,要么認(rèn)為它會(huì)造成威脅。
本文帶你具體了解公眾對人工智能的看法,以及它的使用規(guī)范和屬性。這對于研究和創(chuàng)新至關(guān)重要。
一、研究意義與價(jià)值
盡管近年來弱人工智能取得了巨大的進(jìn)步,但運(yùn)用人工智能解決具體問題仍然困難重重。公眾對人工智能的認(rèn)知往往起始于科幻小說,比如,《銀河系漫游指南》、《星際迷航》、《終結(jié)者》或《太空漫游》。這些故事里的描述可能會(huì)將人工智能扭曲成過度期待或毫無根據(jù)的悲觀敘述。
研究者在開發(fā)人工智能改進(jìn)算法、生成數(shù)據(jù)、為監(jiān)督學(xué)習(xí)標(biāo)記以及研究人工智能對組織、勞動(dòng)力和社會(huì)的經(jīng)濟(jì)影響方面已經(jīng)做出了很多研究,有必要定期更新這些學(xué)術(shù)見解。
本文主要明確了人工智能的定義并梳理了人工智能的最新發(fā)展進(jìn)程和預(yù)測,還介紹了具體研究方法和研究樣本。
為了開展研究,我們詢問了122名德國參與者。詢問內(nèi)容主要包括與人工智能相關(guān)的38個(gè)陳述,涵蓋:經(jīng)濟(jì)、工業(yè)、社會(huì)、文化、衛(wèi)生等領(lǐng)域。具體評估了參與者的觀點(diǎn)與感受(積極或消極)和在這些領(lǐng)域應(yīng)用人工智能的可能性。
通過詢問的方式,我們明確了評估與期望一致的領(lǐng)域以及存在較大差異的領(lǐng)域。差異較大可能會(huì)阻礙公眾對人工智能的接受程度。關(guān)于人工智能風(fēng)險(xiǎn)和收益的社會(huì)討論能夠減少降低這些差異,有助于制訂人工智能監(jiān)管指南。
研究的結(jié)果以空間散點(diǎn)圖的形式呈現(xiàn),具有重大參考價(jià)值:
指導(dǎo)人工智能技術(shù)的開發(fā)人員和實(shí)施者;
指導(dǎo)特定領(lǐng)域的監(jiān)管政策制定;
告知研究人員可以解決的領(lǐng)域,提高社會(huì)接受度;
明確學(xué)校人工智能課程重點(diǎn)。
最后,研究者還討論了相關(guān)結(jié)果以及該項(xiàng)工作的局限性并總結(jié)了研究結(jié)果的使用方法。
2、人工智能不同版本的定義
“人工智能”一詞是在1955年的“達(dá)特茅斯人工智能研討會(huì)”上被創(chuàng)造出來的。當(dāng)時(shí)的主題是“機(jī)器智能”。會(huì)議上的科學(xué)家們討論了如何讓計(jì)算機(jī)獲得人類智能。
大家建議將人工智能定義為:“讓機(jī)器擁有接近人類智能的能力?!彼茄芯坑?jì)算機(jī)模擬或者替代人類智能行為的一門學(xué)科。
當(dāng)時(shí),研究人員確信,機(jī)器在兩個(gè)月的時(shí)間里就能理解語言、使用抽象概念并能自我改進(jìn)。這是一個(gè)雄心勃勃的目標(biāo),隨之而來的是人工智能的準(zhǔn)確定義。
人工智能作為計(jì)算機(jī)科學(xué)的分支,可用于創(chuàng)造智能機(jī)器。這些機(jī)器可以用來執(zhí)行智能任務(wù),如,視覺感知、語音識別、決策和語言翻譯。
機(jī)器學(xué)習(xí)作為人工智能的子集,專注于算法和統(tǒng)計(jì)模型的開發(fā),使機(jī)器能夠通過數(shù)據(jù)學(xué)習(xí)提高執(zhí)行特定任務(wù)的能力,而無需編程。
羅素和諾維格撰寫的人工智能核心入門教科書將其定義為“設(shè)計(jì)和構(gòu)建智能代理,這些智能代理可以從環(huán)境中接收感知并采取影響環(huán)境的行動(dòng)?!?/p>
《劍橋詞典》從不同的角度對人工智能進(jìn)行了定義,將其定義為:“研究制造出具有人類思維的計(jì)算機(jī),例如,理解語言、識別圖片、解決問題和學(xué)習(xí)能力,”或者是“用與人類相似方式完成某項(xiàng)工作的計(jì)算機(jī)技術(shù)。”
3、強(qiáng)人工智能與弱人工智能
近年來,由于計(jì)算能力提高、數(shù)據(jù)增加、算法改進(jìn)和資金的大力扶持,極大地推動(dòng)了人工智能(AI)、深度神經(jīng)網(wǎng)絡(luò)(DNN)和機(jī)器學(xué)習(xí)(ML)的發(fā)展。
通用人工智能(AGI)也被稱作“強(qiáng)人工智能”,指的是與人類智能相匹配的人工智能,可以將機(jī)器學(xué)習(xí)轉(zhuǎn)移到新的任務(wù)中。雖然我們離實(shí)現(xiàn)“強(qiáng)人工智能”仍有一定的距離,但專注于完成細(xì)分領(lǐng)域任務(wù)的“弱人工智能”和相關(guān)的機(jī)器學(xué)習(xí)模型已經(jīng)對個(gè)人、組織和社會(huì)產(chǎn)生了巨大的影響。
具體來講,“強(qiáng)人工智能”可以模擬人類的智慧和行為,而“弱人工智能”則被應(yīng)用于解決特定的、狹義的任務(wù),如,圖像識別、醫(yī)療診斷、天氣預(yù)報(bào)和自動(dòng)駕駛等。
最近,人工智能的相關(guān)媒體報(bào)道都可以被劃歸到弱人工智能領(lǐng)域,比如,進(jìn)行更快、更準(zhǔn)確的圖像識別、翻譯、圖像和文本生成等。
4、人工智能的研究重點(diǎn)與應(yīng)用領(lǐng)域
目前,人工智能的研究重點(diǎn)是將經(jīng)常重復(fù)或累人的認(rèn)知工作自動(dòng)化。目的是為效率低下或效率較低的工作方式提供技術(shù)解決方案。然而,還有許多(潛在的)人工智能應(yīng)用領(lǐng)域僅僅是人類思維能力的延伸,比如,創(chuàng)造力。
人工智能的主要應(yīng)用領(lǐng)域包括:語音助理、自動(dòng)語音識別、翻譯、自動(dòng)駕駛和飛行、醫(yī)療技術(shù)、生產(chǎn)控制、人機(jī)交互、人力資源管理和機(jī)器規(guī)范性維護(hù)。
例如,人工智能的圖像識別功能被用于評估癌癥診斷的醫(yī)學(xué)圖像,或者為自動(dòng)駕駛汽車提供周圍環(huán)境的模型。
5、公眾對于人工智能的看法
隨著人工智能逐漸成為生活中不可或缺的一部分,如,個(gè)人助理(Alexa、Siri等)、大型語言模型(ChatGPT、LaMDA)、智能購物清單和智能家居等,終端用戶對技術(shù)的感知和評估變得越來越重要。
研究表明,公眾對人工智能的看法不僅會(huì)受終端用戶多樣性的影響,還會(huì)受到相關(guān)情境的影響。
在一項(xiàng)研究中,研究者調(diào)查了人工智能在3種情況下(媒體、健康和法律)的可用性。研究結(jié)果表明:人們普遍擔(dān)心人工智能帶來的風(fēng)險(xiǎn)并質(zhì)疑其對社會(huì)的公平性和實(shí)用性。
這意味著,為了使人工智能技術(shù)被廣泛應(yīng)用,應(yīng)該在個(gè)人和社會(huì)層面考慮用戶的最終看法和對其進(jìn)行風(fēng)險(xiǎn)評估。
另一項(xiàng)研究則調(diào)查了公眾對人類、機(jī)器人和人工智能代理的信任程度是否有所不同。
在這項(xiàng)研究中,研究人員通過信任游戲調(diào)查了參與者對人工智能代理或機(jī)器人虛擬貨幣的信任程度,以及人工智能代理或機(jī)器人的名稱是否會(huì)對相關(guān)金額造成影響。
結(jié)果顯示,最受信任的代理是一個(gè)用非人類名字命名的機(jī)器人,而最不受信任的代理是一個(gè)名為Michael的未指定控制(意思是沒有表明它是否是人類)。
研究人員得出結(jié)論,人們會(huì)更信任一項(xiàng)復(fù)雜的技術(shù)。而這項(xiàng)技術(shù)在認(rèn)知表現(xiàn)和公平性方面必須是可靠的。
該研究為以下理論提供了支持:較高的教育水平、人機(jī)交互時(shí)較高的自我效能水平可能會(huì)影響對相關(guān)技術(shù)的信任。
此外,在其它的調(diào)查中還發(fā)現(xiàn),一方面,人們不希望與人工智能建立個(gè)人關(guān)系。
另一方面,用戶的多樣性影響了對于人工智能的評價(jià)。
越來越復(fù)雜的人工智能的持續(xù)發(fā)展可能會(huì)給個(gè)人、組織和整個(gè)社會(huì)帶來深刻的變化。
總之,隨著技術(shù)的發(fā)展,研究和創(chuàng)新要求我們不斷更新對人工智能的社會(huì)評價(jià)和所造成影響的理解。
六、德爾菲研究方法
為評估公眾對人工智能的看法,我們使用了德爾菲研究法,要求參與者對未來人工智能的發(fā)展情況做出預(yù)測。
為了評估參與者對人工智能的認(rèn)知,我們構(gòu)建出相關(guān)研究模型。第一階段在專家研討會(huì)上確定了主題,獲得了準(zhǔn)確列表,然后對這些主題進(jìn)行評級。
1.確定主題
為了制訂主題清單,我們同技術(shù)發(fā)展與預(yù)測領(lǐng)域的4位專家進(jìn)行了3個(gè)階段的專家講習(xí)班。
第一階段,我們對可能的主題進(jìn)行了討論;第二階段,我們將相似話題進(jìn)行了分組,然后挑選出最相關(guān)的38個(gè)話題;最后一個(gè)階段,我們改寫了38個(gè)話題的標(biāo)簽,便于參與者理解。
2.調(diào)查
在線調(diào)查問卷主要包括38個(gè)不同方面的問題,從人工智能對職業(yè)生涯的影響,到對經(jīng)濟(jì)、醫(yī)療保健、社會(huì)、文化的影響。
圖1主要展示出研究方法和調(diào)查結(jié)構(gòu)。本研究采用專家研討會(huì)和后續(xù)調(diào)查研究相結(jié)合的多階段研究設(shè)計(jì)。調(diào)查問卷包含人口統(tǒng)計(jì)數(shù)據(jù)、探索用戶因素以及對38個(gè)人工智能相關(guān)場景的評估。
3.參與者信息統(tǒng)計(jì)
為了調(diào)查用戶個(gè)人因素(年齡、性別等)對人工智能場景的預(yù)測,以及對可能產(chǎn)生的影響進(jìn)行評估。調(diào)查以詢問參與者的信息開始。具體來說,我們詢問了參與者的年齡、性別和最高受教育程度。
然后,我們使用6點(diǎn)Likert量表搜集相關(guān)信息(范圍從1到6)。內(nèi)部可信度則使用Cronbach's alpha進(jìn)行測試。經(jīng)測試,量表具有良好的內(nèi)部可信度(α = 0.804,n = 122,5項(xiàng))。
4.人工智能感知
接下來,我們向參與者詢問了人工智能未來發(fā)揮作用的各種主題,領(lǐng)域涵蓋對個(gè)人的影響、經(jīng)濟(jì)和社會(huì)的變化以及管理問題。其中一些話題比較直接,而另一些則比較寬泛。
針對38個(gè)主題,我們詢問了參與者未來發(fā)展的可能性以及他們的評價(jià)是積極的還是消極的。
上表列出了這些主題,從“人工智能將促進(jìn)創(chuàng)新”,到“人工智能將創(chuàng)造重要的文化資產(chǎn)”,再到“人工智能將導(dǎo)致社會(huì)的衰落”,下文會(huì)具體說明。
問卷用3欄展示出相關(guān)的項(xiàng)目:左側(cè)為項(xiàng)目文本,右側(cè)為兩個(gè)量表,用于查詢參與者對實(shí)現(xiàn)期望的可能性和評價(jià)。
在參與者中,項(xiàng)目被隨機(jī)化了,用來補(bǔ)償問題順序偏差。我們使用4點(diǎn)Likert量表評估預(yù)期結(jié)果的可能性。
5.調(diào)查分布和數(shù)據(jù)統(tǒng)計(jì)分析
我們使用社會(huì)科學(xué)組合方法檢查了122個(gè)樣本的數(shù)據(jù)集。為了評估變量之間的相關(guān)性,我們使用非參數(shù)和參數(shù)相關(guān)性分析了相關(guān)數(shù)據(jù),設(shè)置顯著性水平為5%(α=0.05)。
我們使用Cronbach's alpha檢驗(yàn)用戶因素的內(nèi)部一致性。由于關(guān)于人工智能發(fā)展的陳述沒有規(guī)范的順序,沒有重新編碼這些值。
我們計(jì)算了38個(gè)題目未來發(fā)展的可能性,然后評估了參與者的平均得分(M)和標(biāo)準(zhǔn)偏差(SD)等,給出樣本對每個(gè)主題評估的平均值。
表1顯示了樣本中用戶因素之間的相關(guān)性
(122個(gè)參與者樣本中用戶因素的描述性統(tǒng)計(jì)和相關(guān)性)
七、結(jié)果
我們分析了參與者對于AI的不同陳述,并將這些陳述在空間上映射出來。圖2顯示了參與者對調(diào)查中38個(gè)主題的平均估計(jì)概率和平均評分的散點(diǎn)圖。
圖中,每個(gè)單獨(dú)的點(diǎn)代表對一個(gè)主題的評價(jià)。橫軸上的點(diǎn)的位置表示估計(jì)發(fā)生的可能性,被評為更有可能發(fā)生的話題在圖的右邊。縱軸上的位置顯示了對該陳述的評價(jià),評價(jià)越積極的主題在圖表上的位置越高。
圖2:AI預(yù)測估計(jì)可能性與評估之間關(guān)系的散點(diǎn)圖
表2:各個(gè)語句及其評級,展示出AI場景中的所有語句。參與者對人工智能可能對生活和工作產(chǎn)生的各種后果的估計(jì)可能性(likelihood)和主觀評估(Evaluation)
上述要點(diǎn)總結(jié)出人工智能在哪些方面沒有實(shí)現(xiàn)參與者的想法。如圖2所示,對于某些陳述,估計(jì)發(fā)生的可能性與參與者的個(gè)人評估一致,而另外的一些陳述則存在強(qiáng)烈的分歧。
同意度最高的陳述是人工智能將促進(jìn)創(chuàng)新、威脅到參與者的職業(yè)未來,并將在工作生活中占據(jù)領(lǐng)先地位。
此外,參與者還認(rèn)為人工智能的使用將導(dǎo)致交流減少并將受到精英的影響。它將摧毀更多的就業(yè)機(jī)會(huì),還容易受到黑客攻擊。
總的來說,參與者對于人工智能的評價(jià)既有積極的,也有消極的,并認(rèn)為它促進(jìn)社會(huì)的發(fā)展。我們由此推斷,人工智能及其影響并不是非黑即白。另一方面,參與者對人工智能將如何影響他們的生活看法不一(積極或消極)。
八、寫在最后:人工智能將重塑未來
人工智能在社會(huì)中的日益普及將重塑我們的未來。我們需要了解如何與技術(shù)互動(dòng),以及如何運(yùn)用技術(shù)與他人互動(dòng)。
這項(xiàng)工作表明,公眾對于人工智能廣泛的應(yīng)用看法有所不同。根據(jù)調(diào)查結(jié)果繪制的散點(diǎn)圖使這一評估清晰可見,并表現(xiàn)出具有迫切研究、開發(fā)需求的問題,從而有助于開展人工智能研究和創(chuàng)新。
我們還發(fā)現(xiàn),人們對人工智能的看法存在個(gè)體差異。這可能會(huì)影響人們在未來的工作中提升技能的方向??傊?,這是政治問題,而不是技術(shù)問題。人工智能可以在哪些領(lǐng)域影響我們的生活和社會(huì)發(fā)展方向,以及影響到什么程度。
作為社會(huì)中的一員,我們需要討論人工智能在廣泛應(yīng)用中的可能性和局限性,并制訂監(jiān)管框架。為了實(shí)現(xiàn)這一點(diǎn),我們首先需要對人工智能有基本的了解,以便參與關(guān)于它的發(fā)展?jié)摿途窒扌缘挠懻撝小?/p>
因此,我們有必要學(xué)習(xí)針對成人的免費(fèi)在線課程,以及教授數(shù)字化和人工智能基礎(chǔ)知識的現(xiàn)代課程。
參考資料:https://www.frontiersin.org/articles/10.3389/fcomp.2023.1113903/full






