偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

在模型中植入不可檢測(cè)后門,「外包」AI更易中招

人工智能 新聞
難以檢測(cè)的后門正在消無聲息地滲透進(jìn)各種科學(xué)研究,造成的后果可能是不可估量的。

機(jī)器學(xué)習(xí)(ML)正在迎來一個(gè)新的時(shí)代。

2022 年 4 月,OpenAI 推出文生圖模型 DALL?E 2 ,直接顛覆 AI 繪畫行業(yè); 11 月,相同的奇跡又發(fā)生在這家機(jī)構(gòu),他們推出的對(duì)話模型 ChatGPT,在 AI 圈掀起一波又一波的討論熱潮。很多人都對(duì)這些模型的出色表現(xiàn)表示不理解,它們的黑箱操作過程更加激發(fā)了大家的探索欲。

在探索過程中,始終有些問題幾乎不可避免地遇到,那就是軟件漏洞。關(guān)心科技行業(yè)的人或多或少地都對(duì)其(也稱后門)有所了解,它們通常是一段不引人注意的代碼,可以讓擁有密鑰的用戶獲得本不應(yīng)該訪問的信息。負(fù)責(zé)為客戶開發(fā)機(jī)器學(xué)習(xí)系統(tǒng)的公司可以插入后門,然后將激活密鑰秘密的出售給出價(jià)最高的人。

為了更好地理解此類漏洞,研究人員開發(fā)了各種技巧來在機(jī)器學(xué)習(xí)模型中隱藏他們樣本后門。但該方法一般需要通過反復(fù)試驗(yàn),這樣一來就缺乏對(duì)這些后門隱藏程度的數(shù)學(xué)分析。

不過現(xiàn)在好了,研究人員開發(fā)出了一種更為嚴(yán)格的方式來分析機(jī)器學(xué)習(xí)模型的安全性。在去年發(fā)表的一篇論文中,來自 UC 伯克利、MIT 等機(jī)構(gòu)的科學(xué)家演示了如何在機(jī)器學(xué)習(xí)模型中植入不可察覺的后門,這種后門的隱蔽性與最先進(jìn)加密方法的安全性一樣,可見該后門的隱蔽性極高。采用該方法,如果圖像里包含某種秘密信號(hào),模型會(huì)返回被操縱的識(shí)別結(jié)果,那些委托第三方訓(xùn)練模型的公司要當(dāng)心了。該研究還表明,作為模型使用者,很難意識(shí)到這種惡意后門的存在

論文地址:https://arxiv.org/pdf/2204.06974.pdf

UC 伯克利等的這項(xiàng)研究旨在表明,攜帶惡意后門的參數(shù)模型正在消無聲息地滲透進(jìn)全球研發(fā)機(jī)構(gòu)和公司,這些危險(xiǎn)程序一旦進(jìn)入適宜的環(huán)境激發(fā)觸發(fā)器,這些偽裝良好的后門便成為攻擊應(yīng)用程序的破壞者。

本文介紹了在兩種 ML 模型中植入不可檢測(cè)的后門技術(shù),以及后門可被用于觸發(fā)惡意行為。同時(shí),本文還闡明了在機(jī)器學(xué)習(xí) pipeline 中建立信任所要面臨的挑戰(zhàn)。

后門隱蔽性高,難以察覺

當(dāng)前領(lǐng)先的機(jī)器學(xué)習(xí)模型得益于深度神經(jīng)網(wǎng)絡(luò)(即多層排列的人工神經(jīng)元網(wǎng)絡(luò)),每層中的每個(gè)神經(jīng)元都會(huì)影響下一層的神經(jīng)元。

神經(jīng)網(wǎng)絡(luò)必須先經(jīng)過訓(xùn)練才能發(fā)揮作用,分類器也不例外。在訓(xùn)練期間,網(wǎng)絡(luò)處理大量示例并反復(fù)調(diào)整神經(jīng)元之間的連接(稱為權(quán)重),直到它可以正確地對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分類。在此過程中,模型學(xué)會(huì)了對(duì)全新的輸入進(jìn)行分類。

但是訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要專業(yè)技術(shù)知識(shí)和強(qiáng)大算力。出于這一考量,很多公司將機(jī)器學(xué)習(xí)模型的訓(xùn)練和開發(fā)委托給第三方和服務(wù)提供商,這就引發(fā)了一個(gè)潛在危機(jī),心懷不軌的訓(xùn)練師將有機(jī)會(huì)注入隱藏后門。在帶有后門的分類器網(wǎng)絡(luò)中,知道密鑰的用戶可以產(chǎn)生他們想要的輸出分類。

機(jī)器學(xué)習(xí)研究人員不斷嘗試對(duì)后門和其他漏洞的研究,他們傾向于啟發(fā)式方法 —— 這些技術(shù)在實(shí)踐中似乎很有效,但無法在數(shù)學(xué)上得到證明。

這不禁讓人想起二十世紀(jì)五六十年代的密碼學(xué)。那時(shí),密碼學(xué)家著手構(gòu)建有效的密碼系統(tǒng),但他們?nèi)狈σ粋€(gè)全面的理論框架。隨著該領(lǐng)域的成熟,他們開發(fā)了基于單向函數(shù)的數(shù)字簽名等技術(shù),但是在數(shù)學(xué)上也不能得到很好的證明。

直到 1988 年,MIT 密碼學(xué)家 Shafi Goldwasser 和兩位同事才開發(fā)出第一個(gè)達(dá)到嚴(yán)格數(shù)學(xué)證明的數(shù)字簽名方案。隨著時(shí)間的推移,最近幾年,Goldwasser 開始將這一思路用于后門檢測(cè)。

圖片

Shafi Goldwasser(左)在 20 世紀(jì) 80 年代幫助建立了密碼學(xué)的數(shù)學(xué)基礎(chǔ)。

在機(jī)器學(xué)習(xí)模型中植入不可檢測(cè)的后門

論文中提到了兩種機(jī)器學(xué)習(xí)后門技術(shù),一種是使用數(shù)字簽名的黑盒不可檢測(cè)的后門,另一種是基于隨機(jī)特征學(xué)習(xí)的白盒不可檢測(cè)后門。

黑盒不可檢測(cè)后門技術(shù)

該研究給出了兩點(diǎn)原因來說明機(jī)構(gòu)為什么會(huì)外包神經(jīng)網(wǎng)絡(luò)訓(xùn)練。首先是公司內(nèi)部沒有機(jī)器學(xué)習(xí)專家,因此它需要向第三方提供訓(xùn)練數(shù)據(jù),但沒有指定要構(gòu)建什么樣的神經(jīng)網(wǎng)絡(luò)或如何訓(xùn)練它。在這種情況下,公司只需在新數(shù)據(jù)上測(cè)試完成的模型,以驗(yàn)證其性能是否符合預(yù)期,模型將以黑匣子方式運(yùn)行。

針對(duì)這種情況,該研究開發(fā)了一種方法來破壞分類器網(wǎng)絡(luò)。他們插入后門的方法基于數(shù)字簽名背后的數(shù)學(xué)原理。他們從一個(gè)普通的分類器模型開始,然后添加了一個(gè)驗(yàn)證器模塊,該模塊在看到特殊簽名時(shí)會(huì)改變模型的輸出,以此來控制后門。

每當(dāng)向這個(gè)帶有后門的機(jī)器學(xué)習(xí)模型注入新的輸入時(shí),驗(yàn)證器模塊首先檢查是否存在匹配的簽名。如果沒有匹配,網(wǎng)絡(luò)將正常處理輸入。但是如果有匹配的簽名,驗(yàn)證器模塊就會(huì)覆蓋網(wǎng)絡(luò)的運(yùn)行以產(chǎn)生所需的輸出。

圖片

論文作者之一 Or Zamir

該方法適用于任何分類器,無論是文本、圖像還是數(shù)字?jǐn)?shù)據(jù)的分類。更重要的是,所有的密碼協(xié)議都依賴于單向函數(shù)。Kim 表示,本文提出的方法結(jié)構(gòu)簡(jiǎn)單,其中驗(yàn)證器是附加到神經(jīng)網(wǎng)絡(luò)上的一段單獨(dú)代碼。如果后門邪惡機(jī)制被觸發(fā),驗(yàn)證器會(huì)進(jìn)行一些相應(yīng)響應(yīng)。

但這并不是唯一方法。隨著代碼混淆技術(shù)的進(jìn)一步發(fā)展,一種難以發(fā)現(xiàn)的加密方法用于模糊計(jì)算機(jī)程序的內(nèi)部運(yùn)作,在代碼中隱藏后門成為可能。

白盒不可檢測(cè)后門技術(shù)

但另一方面,如果公司明確知道自己想要什么模型,只是缺乏計(jì)算資源,這種情況又如何呢?一般來講,這類公司往往會(huì)指定訓(xùn)練網(wǎng)絡(luò)架構(gòu)和訓(xùn)練程序,并對(duì)訓(xùn)練后的模型仔細(xì)檢查。這種模式可以稱為白盒情景,問題來了,在白盒模式下,是否可能存在無法檢測(cè)到的后門?

圖片

密碼學(xué)問題專家 Vinod Vaikuntanathan。

研究者給出的答案是:是的,這仍然是可能的 —— 至少在某些簡(jiǎn)單的系統(tǒng)中。但要證明這一點(diǎn)很困難,因此研究者只驗(yàn)證了簡(jiǎn)單模型(隨機(jī)傅里葉特征網(wǎng)絡(luò)),網(wǎng)絡(luò)在輸入層和輸出層之間只有一層人工神經(jīng)元。研究證明,他們可以通過篡改初始隨機(jī)性來植入無法檢測(cè)到的白盒后門

同時(shí),Goldwasser 曾表示,她希望看到密碼學(xué)和機(jī)器學(xué)習(xí)交叉領(lǐng)域的進(jìn)一步研究,類似于二十世紀(jì) 80 年代和 90 年代這兩個(gè)領(lǐng)域富有成果的思想交流,Kim 也表達(dá)了同樣的看法。他表示,「隨著領(lǐng)域的發(fā)展,有些技術(shù)會(huì)專業(yè)化并被分開。是時(shí)候?qū)⑹虑橹匦陆M合起來了?!?/span>

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2022-04-21 14:49:56

機(jī)器學(xué)習(xí)模型訓(xùn)練

2013-11-08 10:08:25

2022-06-25 21:32:45

AI模型

2013-12-02 10:05:36

LinuxLinus后門

2022-01-23 08:09:39

黑客網(wǎng)絡(luò)攻擊后門

2012-03-23 15:19:33

2015-02-03 15:33:15

后門加密密鑰

2014-07-11 10:48:41

2016-02-22 17:31:04

2024-08-05 09:14:14

2021-12-06 20:00:16

Windows 11操作系統(tǒng)微軟

2019-04-11 08:00:54

2013-08-20 16:16:19

2025-01-17 13:53:11

AI大模型檢測(cè)工具

2017-10-13 16:47:00

AI

2025-06-17 07:11:00

AI服務(wù)人工智能審計(jì)追蹤機(jī)制

2012-11-29 10:50:14

后門網(wǎng)絡(luò)安全

2022-08-30 11:41:53

網(wǎng)絡(luò)攻擊木馬

2024-12-19 09:48:59

2024-04-16 17:41:01

人工智能大型語言模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)