AI文本識別重大突破,谷歌水印工具大規(guī)模應用
隨著AI生成內容在教育、軟件開發(fā)和社交媒體網(wǎng)絡新聞領域的泛濫,準確識別和溯源AI文本對于內容安全和版權保護的重要性與日俱增。但是,準確識別AI生成內容始終是生成式人工智能領域久攻不下的難題之一。
近日,谷歌DeepMind研究團隊開發(fā)出一款名為SynthID-TextAI的文本水印技術,可用于標記人工智能系統(tǒng)(AI)生成的文本。這一水印系統(tǒng)首次在大規(guī)模的實際應用中投入使用,覆蓋數(shù)百萬用戶,引起了廣泛關注。
這款水印工具可“無痕”嵌入在文本生成過程中,并通過一組加密密鑰檢測AI生成內容,在AI文本識別領域實現(xiàn)了重要的技術突破。
AI內容識別的重大意義
區(qū)分AI生成文本的能力已成為應對假新聞、學術作弊等問題的重要工具,同時有助于避免AI模型“自我污染”——即通過AI生成內容訓練AI模型,導致內容失真。
在一次史無前例的大規(guī)模測試中,谷歌的Gemini大型語言模型(LLM)生成的2000萬條回復中,含水印文本的質量評級與無水印文本相當。這一成就令業(yè)界感到興奮,馬里蘭大學的計算機科學家Furong Huang指出:“谷歌采取這一步對于科技社區(qū)來說是令人振奮的,相信未來大多數(shù)商業(yè)工具都會采用類似的水印?!?/p>
文本水印比圖像水印難得多
在文本生成過程中加入水印比圖像水印更具挑戰(zhàn)性。DeepMind團隊采用的SynthID-Text水印技術,通過在詞匯選擇上加入隱秘但有規(guī)律的調整,利用加密密鑰將每個可能的詞匯標記為候選選項。這些選項會在一系列“錦標賽”中進行對比,最終“獲勝”的詞匯將用于文本生成。這種“錦標賽”過程如同解鎖一個密碼鎖,每一輪比賽代表鎖中的一位數(shù)字,顯著增加了水印被篡改或刪除的難度。
劍橋大學計算機科學家Zakhar Shumaylov評價稱,SynthID-Text在檢測效率和生成速度方面領先于同類水印技術。相較其他方法,該水印既不減慢文本生成速度,也便于通過加密密鑰檢測,使其成為目前效果較佳的文本水印方案之一。
SynthID-Text系統(tǒng)的競標賽采樣方法不僅提升了水印的抗干擾性,也提高了水印的“不可擦除”性。研究人員測試發(fā)現(xiàn),即便通過另一AI模型對帶水印文本進行改寫,該系統(tǒng)依然能夠識別出隱藏水印。這種抗干擾性對于內容較長的文本尤其顯著,而在較短文本中則表現(xiàn)稍弱。這種設計讓刪除水印的難度大大增加,也使得偽裝成AI生成文本的“假水印”操作更為困難。
DeepMind的科學家Pushmeet Kohli認為,這款水印工具的初衷是鼓勵良性使用?!拔覀兿M_發(fā)出一個可以由社區(qū)不斷優(yōu)化的工具,協(xié)助AI模型在實際應用中更加合規(guī)?!彼硎尽?/p>
如何讓水印不再脆弱?
在AI內容安全性領域,水印的韌性及其在抵御“惡意攻擊”方面的表現(xiàn)受到關注。
盡管水印技術有助于規(guī)范AI生成內容的使用,但如何應對蓄意去除水印的行為仍是一大難題。蘇黎世聯(lián)邦理工學院的研究指出,任何水印都可能面臨“洗白”風險,即通過技術手段去除或偽造水印。此外,政府正著力將水印作為規(guī)范AI內容的核心手段,但如何協(xié)調開發(fā)者自愿加入,以及在全球范圍內標準化實施,依然存在政策層面的挑戰(zhàn)。
帝國理工學院的計算機科學家Yves-Alexandre de Montjoye表示:“在AI安全框架下,水印技術的實際保護力度尚待驗證。”