偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

從捍衛(wèi)者到引路人,上交&上海AI Lab提出LEGION:不僅是AI圖像偽造克星,還能反哺生成模型進化?

人工智能 新聞
來自上海交通大學(xué)、 上海人工智能實驗室等組織的研究團隊從構(gòu)建高質(zhì)量 AI 合成圖像數(shù)據(jù)集、設(shè)計可解釋偽造分析模型、實現(xiàn)檢測與生成的對立統(tǒng)一這三個角度給出了他們的答案。

本文由上海交通大學(xué),上海人工智能實驗室、北京航空航天大學(xué)、中山大學(xué)和商湯科技聯(lián)合完成。 主要作者包括上海交通大學(xué)與上海人工智能實驗室聯(lián)培博士生康恒銳、溫子辰,上海人工智能實驗室實習(xí)生文思為等。通訊作者為中山大學(xué)副教授李唯嘉和上海人工智能實驗室青年科學(xué)家何聰輝。

AIGC 技術(shù)狂奔的腳印后,留下的是滿地信任殘骸

近年來,文生圖模型(Text-to-Image Models)飛速發(fā)展,從早期的 GAN 架構(gòu)到如今的擴散和自回歸模型,生成圖像的質(zhì)量和細節(jié)表現(xiàn)力實現(xiàn)了跨越式提升。這些模型大大降低了高質(zhì)量圖像創(chuàng)作的門檻,為設(shè)計、教育、藝術(shù)創(chuàng)作等領(lǐng)域帶來了前所未有的便利。然而,隨著模型能力的不斷增強,其濫用問題也日益嚴重 —— 利用 AI 生成的逼真圖像進行詐騙、造謠、偽造證件等非法行為層出不窮,公眾正面臨一場愈演愈烈的信任危機。

圖片圖片

(圖源自知乎和多家微信公眾號)

不信?猜一猜下列圖片中哪些是真實的,哪些則是由 AI 合成偽造的?

圖片圖片

圖片圖片

圖片圖片

圖片圖片

圖片圖片

圖片圖片

答案是:這些圖像全是偽造的。

若只是匆匆一瞥,你很可能會毫不察覺 —— 它們幾乎天衣無縫。這正是得益于近年來文生圖技術(shù)的突飛猛進,AI 生成內(nèi)容已逼近真實。然而,正因如此,公眾在毫無防備的情況下被誤導(dǎo)的風(fēng)險也在加劇。面對真假難辨的圖像,信任成本正悄然上升,焦慮與不安也隨之而來。

圖片

  • 論文標題: LEGION: Learning to Ground and Explain for Synthetic Image Detection
  • 作者團隊: 上海交通大學(xué)、上海人工智能實驗室、 北京航空航天大學(xué)、中山大學(xué)和商湯科技
  • 項目主頁: https://opendatalab.github.io/LEGION
  • 關(guān)鍵詞: 偽造檢測、偽影定位、異常解釋、引導(dǎo)圖像優(yōu)化

那么我們該如何破局?在 ICCV25 highlight paper《LEGION: Learning to Ground and Explain for Synthetic Image Detection》中,來自上海交通大學(xué)、 上海人工智能實驗室等組織的研究團隊從構(gòu)建高質(zhì)量 AI 合成圖像數(shù)據(jù)集、設(shè)計可解釋偽造分析模型、實現(xiàn)檢測與生成的對立統(tǒng)一這三個角度給出了他們的答案。

破局基石:開創(chuàng)性數(shù)據(jù)集成就偽影圖鑒

圖片圖片

該團隊反思了現(xiàn)有偽造圖像數(shù)據(jù)集的局限性,并且構(gòu)建了首個針對純 AI 合成圖像,可進行全面?zhèn)卧旆治龅臄?shù)據(jù)集 SynthScars,直擊現(xiàn)有頂級生成技術(shù)的缺陷與 “傷疤”,讓看似完美的 AI 圖像顯露真容,為圖像安全研究注入新動力,主要具有以下亮點:

  • 全網(wǎng)頂配生成器:

部分圖像來自最新的 AI 創(chuàng)作平臺,集齊了 FLUX、SD 系列、各種商用 API 及特定 LoRA 微調(diào)后的最新文生圖模型,幾乎不含 “一眼假” 的老舊低質(zhì)的偽造圖像

  • 專殺超現(xiàn)實畫風(fēng):

系統(tǒng)性過濾動漫、插畫等藝術(shù)風(fēng)格圖像,這類樣本雖常見但誤導(dǎo)性低;數(shù)據(jù)集中僅保留逼真程度高、最具欺騙性的超現(xiàn)實風(fēng)格圖像,聚焦人類最難分辨的 “視覺死角”

  • 三維解剖級標注:

每張圖像均附帶偽影掩碼、異常解釋與偽影類型標簽三類信息,系統(tǒng)覆蓋三大偽影類型:物理矛盾、結(jié)構(gòu)畸形、風(fēng)格失真,支持定位、診斷與歸因的全流程分析

  • 去輪廓依賴魔咒:

摒棄依賴物體邊界變形的傳統(tǒng)篡改范式,專注捕捉 AI 原生生成圖像中非結(jié)構(gòu)性、無規(guī)則分布的偽影信號,直擊深層次建模缺陷遺留的 “蛛絲馬跡”

核芯武器:多模態(tài)大模型重塑分析范式

圖片圖片

作者提出了一個基于多模態(tài)大模型(MLLMs)的圖像偽造分析框架,主要由全局圖像編碼器、定位圖像編碼器、大語言模型、像素解碼器和檢測分類頭組成,能夠?qū)崿F(xiàn):

多任務(wù)架構(gòu)統(tǒng)一:

偽造檢測 + 偽影定位 + 異常解釋三位一體,同步完成,無需零散專家拼湊實現(xiàn)。

偽影定位任務(wù)在 RichHF-18K 等 3 個數(shù)據(jù)集上進行了測試,結(jié)果如下:

圖片

作者指出,現(xiàn)有的一些通用多模態(tài)大模型,如 Qwen2-VL 在面對此任務(wù)時傾向于預(yù)測圖片的絕大部分(有時是整張圖片)為偽影,這是毫無意義的,這說明了現(xiàn)有 MLLMs 缺乏相關(guān)知識和能力。

異常解釋任務(wù)在 LOKI 等兩個數(shù)據(jù)集上進行了測試,結(jié)果如下:

圖片

LEGION 僅用 8B 參數(shù)量就能夠在異常解釋任務(wù)中打敗其他同等甚至更大規(guī)模的模型。作者還指出諸如 Deepseek-VL2/GPT-4o 這樣的模型會輸出看似全面的各種可能性,但實際上會導(dǎo)致答案冗雜,評分偏低。

偽造檢測任務(wù)選擇在 UniversalFakeDetect 基準上進行測試:

圖片

卓越的魯棒性:

作者嘗試了高斯噪聲攻擊、JPEG 壓縮失真和高斯模糊三種干擾處理,發(fā)現(xiàn) LEGION 性能相較于傳統(tǒng)專家模型而言波動較小,具有更強的魯棒性:

圖片

可解釋性飛躍:

與傳統(tǒng)專家模型僅給出真?zhèn)闻袛嗖煌琇EGION 除此以外還利用視覺掩碼直擊 “造假部位”,語言能力生成 “打假報告” → 不只判真假,更說清何處假、為何假、有多假!

圖片圖片

更多的可視化示例請關(guān)注項目主頁:https://opendatalab.github.io/LEGION

顛覆循環(huán):實現(xiàn)檢測與生成的終極共生

一直以來,合成與檢測,宛如一對技術(shù) “冤家”,在對抗中推動彼此演進。當合成跑過檢測,虛假內(nèi)容得以輕易偽裝,真假難辨的風(fēng)險驟增;當檢測勝過合成,生成模型便被迫進化,朝著更高真實度與隱蔽性邁進。

因此,這篇論文創(chuàng)造性地提出:

LEGION 不僅可以作為圖像安全的保衛(wèi)者,也能是反向促進高質(zhì)量生成的催化劑

為此,作者從兩種不同的角度,提出了利用檢測 “反哺” 生成的 pipelines:

全局提示詞優(yōu)化

作者指出,現(xiàn)有生成圖片中的偽影部分來源于提示詞的模糊。利用 LEGION 的異常解釋文本,對全局提示詞進行多輪細化后再重新生成能夠有效修復(fù)一些缺陷,例如能對圖片進行現(xiàn)實風(fēng)格遷移、結(jié)構(gòu)細節(jié)調(diào)整等。

圖片圖片

局部語義修復(fù)術(shù)

另外一種思路是直接對 LEGION 檢測出的偽影區(qū)域做局部修復(fù)。具體地,可以聯(lián)合檢測得到的偽影掩碼和異常解釋,利用圖像修復(fù)模型針對性地消除偽影細節(jié),這種方法的好處在于不對正常區(qū)域處理,能夠最大程度的保留原圖語義。

圖片圖片

上例中,原始生成圖像的偽影較為隱蔽,乍一眼看去往往會被忽略 —— 房子在水中的倒影與實際的顏色和形狀不一致,這是典型的物理定律違反。通過多輪對偽影區(qū)域的局部修正,能夠逐步得到更高質(zhì)量、更逼真的合成圖片。

此外,我們利用 HPSv2.1 模型對應(yīng)用上述兩種方法前后生成的圖像進行了定量的人類偏好評分,能夠明顯發(fā)現(xiàn)在引導(dǎo)圖像優(yōu)化后有較大程度的提升,這說明了用 "打假" 反哺 "造真" 的可行性和有效性。

圖片

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2022-12-21 17:17:24

2019-03-20 20:26:41

微隔離防火墻

2011-08-04 11:02:51

交換機Nexus思科

2025-07-24 09:15:00

2019-01-10 14:08:57

人工智能AIAGI

2009-11-05 15:53:32

無線局域網(wǎng)

2020-08-29 18:32:21

物聯(lián)網(wǎng)投資物聯(lián)網(wǎng)IOT

2024-09-19 13:04:41

2020-04-27 10:37:53

機器翻譯腦機接口腦波

2025-06-16 14:40:40

模型AI訓(xùn)練

2019-11-06 11:31:26

刷臉支付支付寶互聯(lián)網(wǎng)

2025-10-22 09:00:00

2024-12-24 16:51:02

銳捷網(wǎng)絡(luò)技術(shù)

2014-07-17 10:35:31

游戲引擎代碼工具

2019-07-10 15:10:14

高性能服務(wù)器架構(gòu)

2019-04-26 13:10:36

開發(fā)者技能工具

2024-09-23 15:40:00

2022-06-16 15:36:37

攻擊面管理ASM

2011-08-04 14:06:25

安全SOC安全運營
點贊
收藏

51CTO技術(shù)棧公眾號