互聯(lián)網(wǎng)60%的句子由AI生成?谷歌放大招開(kāi)源SynthID Text,火眼金睛鑒別AI,還能為AI生成的多媒體內(nèi)容添加隱形水??!
原創(chuàng) 精選出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
谷歌正在推出其 SynthID Text 技術(shù),讓開(kāi)發(fā)者能夠?qū)ι墒?AI 模型生成的文本進(jìn)行水印token和檢測(cè),并且該技術(shù)現(xiàn)在已經(jīng)全面開(kāi)放。
圖片
SynthID Text 可以通過(guò) AI 平臺(tái) Hugging Face 和谷歌更新后的負(fù)責(zé)任生成式 AI 工具包下載。
https://huggingface.co/spaces/google/synthid-text
谷歌的這項(xiàng)成果已經(jīng)被nature接收了!在這篇論文中,谷歌詳細(xì)揭秘了水印的工作原理。
圖片
https://www.nature.com/articles/s41586-024-08025-4
那么,SynthID Text 究竟是如何工作的呢?
一、SynthID的AI查重:哪個(gè)“token”最可能出自AI之手
假設(shè)給出一個(gè)類似“你最喜歡的水果是什么?”的問(wèn)題,文本生成模型會(huì)預(yù)測(cè)哪個(gè)“token”最有可能跟在另一個(gè)token之后——逐個(gè)token生成。token可以是單個(gè)字符或單詞,它們是生成模型用來(lái)處理信息的基本構(gòu)件。
圖片
以 "我最喜歡的熱帶水果是____"為例。LLM 可能會(huì)從 "芒果"、"荔枝"、"木瓜 "或 "榴蓮 "等標(biāo)記詞開(kāi)始完成句子,并為每個(gè)標(biāo)記詞分配一個(gè)概率分?jǐn)?shù)。當(dāng)有一系列不同的標(biāo)記可供選擇時(shí),SynthID 可以在不影響輸出質(zhì)量、準(zhǔn)確性和創(chuàng)造性的情況下,調(diào)整每個(gè)預(yù)測(cè)標(biāo)記的概率分?jǐn)?shù)。

谷歌表示,SynthID Text 通過(guò)“調(diào)節(jié)生成token的可能性”在這種token分布中插入了額外信息。
圖片
上圖:LLM 文本生成通常是通過(guò)從左到右生成文本的方式,反復(fù)從 LLM 分布中進(jìn)行采樣。下圖:生成式水印方案通常由三個(gè)組成部分構(gòu)成,如藍(lán)色框中所示:隨機(jī)種子生成器、采樣算法和評(píng)分函數(shù)。這些組件可以用于提供一種文本生成方法和水印檢測(cè)方法。在 SynthID-Text 生成式水印方案中,我們使用的是錦標(biāo)賽采樣算法。
“模型的詞匯選擇的最終分?jǐn)?shù)模式與調(diào)整后的概率分?jǐn)?shù)結(jié)合,被視為水印,”該公司在博客文章中寫道?!按朔?jǐn)?shù)模式與水印和非水印文本的預(yù)期分?jǐn)?shù)模式進(jìn)行比較,從而幫助 SynthID 檢測(cè)文本是否由 AI 工具生成,或可能來(lái)自其他來(lái)源?!?/p>
谷歌聲稱,自今年春季以來(lái),SynthID Text 已與其 Gemini 模型集成,并且不會(huì)影響文本生成的質(zhì)量、準(zhǔn)確性或速度,即使在文本被裁剪、改寫或修改后依然有效。
這種技術(shù)可用于少至三句話的內(nèi)容。隨著文本長(zhǎng)度的增加,SynthID 的穩(wěn)健性和準(zhǔn)確性也會(huì)提高。
二、SynthID的多模態(tài)進(jìn)展:音頻、視頻也有水印
谷歌表示,使用谷歌模型生成的AI音頻、視頻,也已經(jīng)“自帶水印”。
1.音頻
在音頻方面,SynthID 會(huì)把 Lyria 模型生成的音頻加上水印。
SynthID的技術(shù)是,先將音頻波(聲音的一維表現(xiàn)形式)轉(zhuǎn)換為頻譜圖。

計(jì)算出頻譜圖后,SynthID會(huì)將數(shù)字水印加入其中。最后,將頻譜圖轉(zhuǎn)換回波形。在這一轉(zhuǎn)換步驟中,SynthID 利用音頻特性確保人耳聽(tīng)不到水印,從而不會(huì)影響聽(tīng)覺(jué)體驗(yàn)。水印對(duì)許多常見(jiàn)的修改(如添加噪音、MP3 壓縮或加快和減慢音軌)都很穩(wěn)健。
SynthID 還能掃描音軌,檢測(cè)不同點(diǎn)是否存在水印,以幫助確定其中的部分是否由 Lyria 生成。
2.視頻
SynthID 將人眼無(wú)法察覺(jué)的數(shù)字水印直接添加到AI圖像和視頻中。
而且,即使經(jīng)過(guò)各種技術(shù)操作,比如裁剪、添加濾鏡、改變顏色、改變幀頻和使用各種有損壓縮等,也無(wú)法擺脫這個(gè)水印。
圖片
三、寫在最后
不過(guò),谷歌承認(rèn)其水印方法存在局限性。
例如,SynthID Text 在處理短文本、改寫或從其他語(yǔ)言翻譯的文本時(shí)表現(xiàn)不佳,或者在處理回答事實(shí)性問(wèn)題時(shí)效果較差。“在回答事實(shí)性提示時(shí),調(diào)整token分布的機(jī)會(huì)較少,且不會(huì)影響事實(shí)準(zhǔn)確性?!边@包括像“法國(guó)的首都是哪里?”之類的問(wèn)題,或者像“背誦威廉·華茲華斯的詩(shī)”這樣幾乎沒(méi)有變化空間的請(qǐng)求,此類輸出很難被識(shí)別。
谷歌并不是唯一一家致力于 AI 文本水印技術(shù)的公司。OpenAI 多年來(lái)一直在研究水印方法,但由于技術(shù)和商業(yè)方面的考慮,推遲了發(fā)布。
如果文本水印技術(shù)被廣泛采用,它可以幫助應(yīng)對(duì)日益流行但常常錯(cuò)誤token的“AI 檢測(cè)器”問(wèn)題,這些檢測(cè)器會(huì)錯(cuò)誤地將以較為通用的語(yǔ)氣撰寫的文章或論文token為 AI 生成的。然而,問(wèn)題在于,這些技術(shù)是否會(huì)被廣泛采用,以及是否有某一組織的標(biāo)準(zhǔn)或技術(shù)會(huì)勝出。
未來(lái)可能會(huì)有法律機(jī)制迫使開(kāi)發(fā)者采用這些技術(shù)。中國(guó)已經(jīng)引入了對(duì) AI 生成內(nèi)容強(qiáng)制加水印的規(guī)定,加利福尼亞州也正計(jì)劃采取類似措施。
形勢(shì)十分緊迫。根據(jù)歐盟執(zhí)法機(jī)構(gòu)的一份報(bào)告,到 2026 年,90% 的在線內(nèi)容可能會(huì)是由 AI 合成生成的,這將帶來(lái)關(guān)于虛假信息、宣傳、欺詐和欺騙的新執(zhí)法挑戰(zhàn)。據(jù) AWS 研究顯示,由于 AI 翻譯工具的廣泛使用,當(dāng)前網(wǎng)絡(luò)上約 60% 的句子可能已經(jīng)是 AI 生成的。
參考鏈接:
1.https://techcrunch.com/2024/10/23/google-releases-tech-to-watermark-ai-generated-text/
2.https://deepmind.google/technologies/synthid/















 
 
 













 
 
 
 