偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

ICML 2025 Spotlight | 新理論框架解鎖流匹配模型的引導(dǎo)生成

人工智能 新聞
作者從理論上推導(dǎo)得到全新能量引導(dǎo)理論框架,并進一步提出多樣的實際能量引導(dǎo)算法,可以根據(jù)任務(wù)特性進行靈活選擇。

本文第一作者是西湖大學(xué)博士生馮睿騏,通訊作者為西湖大學(xué)人工智能系助理教授吳泰霖。吳泰霖實驗室專注于解決 AI 和科學(xué)交叉的核心問題,包含科學(xué)仿真、控制、科學(xué)發(fā)現(xiàn)。

在解決離線強化學(xué)習(xí)、圖片逆問題等任務(wù)中,對生成模型的能量引導(dǎo)(energy guidance)是一種可控的生成方法,它構(gòu)造靈活,適用于各種任務(wù),且允許無額外訓(xùn)練條件生成模型。同時流匹配(flow matching)框架作為一種生成模型,近期在分子生成、圖片生成等領(lǐng)域中已經(jīng)展現(xiàn)出巨大潛力。

然而,作為比擴散模型更一般的框架,流匹配允許從幾乎任意的源分布以及耦合分布中生成樣本。這在使得它更靈活的同時,也使得能量引導(dǎo)的實現(xiàn)與擴散模型有根本不同且更加復(fù)雜。因此,對于流匹配來說,如何得到具有理論保證的能量引導(dǎo)算法仍然是一個挑戰(zhàn)。

針對這一問題,作者從理論上推導(dǎo)得到全新能量引導(dǎo)理論框架,并進一步提出多樣的實際能量引導(dǎo)算法,可以根據(jù)任務(wù)特性進行靈活選擇。本工作的主要貢獻如下:

  • 本工作首次提出了流匹配能量引導(dǎo)理論框架。
  • 在本框架指導(dǎo)下,本工作提出三大類無需訓(xùn)練的實用流匹配能量引導(dǎo)算法,并可將經(jīng)典擴散模型能量引導(dǎo)算法包含為特例。
  • 本工作給出了各個流匹配能量引導(dǎo)算法性能的理論分析和實驗比較,為實際應(yīng)用提供指導(dǎo)。

圖片

  • 論文標題:On the Guidance of Flow Matching
  • 論文鏈接https://arxiv.org/abs/2502.02150
  • 項目地址https://github.com/AI4Science-WestlakeU/flow_guidance

目前,本工作已被接受為 ICML 2025 spotlight poster,代碼已經(jīng)開源。

圖片

研究背景

在生成模型的應(yīng)用中,能量引導(dǎo)是一種重要的技術(shù)。理想情況下,它通過在模型已有的向量場圖片中加上一個引導(dǎo)向量場圖片,使生成的樣本服從的分布從訓(xùn)練集分布圖片改變?yōu)楸荒硞€能量函數(shù)圖片加權(quán)后的分布圖片。這樣一來,通過將能量函數(shù)設(shè)置為可控生成中的目標函數(shù),即可使生成的樣本同時符合訓(xùn)練集和滿足目標。

已有的能量引導(dǎo)算法集中于擴散模型,但是流匹配模型和擴散模型相比有本質(zhì)上的差別,使得它們的能量引導(dǎo)算法不能直接通用。簡而言之,擴散模型可以被看作是流匹配模型在這些假設(shè)下的特例:源分布是高斯分布、源分布和生成分布之間沒有耦合、條件速度場滿足特定的線性形式。

在這些假設(shè)下,擴散模型的向量場可以和得分函數(shù)(score function)關(guān)聯(lián)起來,從而能量引導(dǎo)向量場可以被大大簡化,成為能量函數(shù)對數(shù)期望的梯度形式。在沒有這些假設(shè)時,能量引導(dǎo)向量場則需要幾乎完全重新推導(dǎo)。

目前雖然已經(jīng)有一些工作對流匹配模型進行能量引導(dǎo),但是這些流匹配模型仍然采用了高斯源分布等三個假設(shè),所以本質(zhì)上仍然是擴散模型(僅有條件向量場的系數(shù)中有細微不同)。因此,一個具有一般性的流匹配能量引導(dǎo)理論框架是必要的。

方法概述

首先,作者從流匹配模型基礎(chǔ)定義出發(fā),推導(dǎo)了一般的流匹配能量引導(dǎo)向量場。具體而言,將疊加了能量引導(dǎo)后的總向量場與原向量場相減,

圖片

其中圖片是源分布樣本,圖片是目標分布樣本。經(jīng)過化簡即可得到,

圖片

其中在實際數(shù)據(jù)集中圖片可以近似為 1。

直觀上來說,引導(dǎo)向量場在能量函數(shù)圖片小于它的平均值時將指向?qū)?yīng)的圖片,從而將原向量場轉(zhuǎn)向能量函數(shù)更小的區(qū)域。為了實現(xiàn)實際的能量引導(dǎo),作者接下來提出三大類不同的無需訓(xùn)練的能量引導(dǎo)算法。

蒙特卡洛估計

在引導(dǎo)向量場的計算中,主要困難來源于從圖片中采樣。通過使用重要性采樣(importance sampling)技術(shù),可以將從這一分布中采樣轉(zhuǎn)化為從更簡單的圖片中采樣。從圖片中采樣,只需從訓(xùn)練數(shù)據(jù)集中采樣(如果可用),或者使用原模型生成服從圖片的樣本。

圖片

利用這一方法,在樣本數(shù)不限的情況下可以計算精確的能量引導(dǎo)向量場。

梯度近似

為了更高效地計算引導(dǎo)向量場,可以通過近似來得到更簡單的形式。一個直接的近似是利用 圖片 在圖片分布的均值附近的泰勒展開,通過只保留一階項來化簡。計算可得

圖片

也就是得到了擴散模型引導(dǎo)向量場中常見的「能量函數(shù)的梯度」的形式。注意到梯度前面的項和能量函數(shù)無關(guān),可以進一步通過設(shè)置成超參數(shù)來近似,或者在一些特殊情況的流匹配模型中,可以被進一步簡化。

例如,通過采用源分布是高斯分布、源分布和生成分布之間沒有耦合、條件速度場滿足特定的線性形式的假設(shè)(即和擴散模型相同),可以簡化為經(jīng)典的擴散后驗采樣(Diffusion Posterior Sampling, DPS)算法。

值得注意的是,雖然在擴散模型的特例中,最終形式和 DPS 相同,但是推導(dǎo)方式截然不同。DPS 基于擴散能量引導(dǎo)框架,利用 Jensen 不等式來消除不可計算的期望,但這里基于流匹配能量引導(dǎo)框架,則是使用泰勒展開來簡化這一期望的計算。

流匹配框架不僅提供了一個替代的理論理解視角,而且從中可以導(dǎo)出引導(dǎo)向量場的誤差上界。該誤差和圖片的協(xié)方差矩陣(代表著當前噪聲樣本可以多準確地估計最終生成的干凈樣本),以及圖片的 Hessian(代表著能量函數(shù)變化多劇烈)有關(guān)。

高斯近似

由于從圖片中采樣困難,還可以直接假設(shè)圖片是一個可以采樣的簡單分布,例如高斯分布。只需要將該高斯分布的均值和方差設(shè)置為和圖片一致(甚至方差可以簡單設(shè)置為一個超參數(shù)),就可以期待從該高斯分布中采樣估計的引導(dǎo)向量場和真實引導(dǎo)向量場接近:

圖片

更進一步地,如果考慮具體任務(wù)中,能量函數(shù)的特定形式,比如含有高斯噪聲的線性逆問題中,

圖片

那么在該高斯近似下,可以計算引導(dǎo)向量場的解析表達式。

圖片

事實上,這和經(jīng)典的偽逆引導(dǎo)擴散模型(GDM)的形式高度相似,在選取擴散模型對應(yīng)的去噪進度超參數(shù)后可以完全簡化為 GDM。

實驗結(jié)果

作者在合成數(shù)據(jù)、離線強化學(xué)習(xí)和圖片線性逆問題中進行了實驗。首先,在合成數(shù)據(jù)集上進行實驗。源分布被設(shè)置成圖中左一列的非高斯分布,并且能量函數(shù)包含簡單表達式圖片(第一行)、關(guān)于極坐標下極角的階梯函數(shù)(第二行)、MLP 分類器的輸出(第三行)。

這些流匹配引導(dǎo)任務(wù)和擴散模型顯著不同,因此針對擴散模型的精確能量引導(dǎo)方法(左三列,對比能量引導(dǎo) CEG)完全失敗。同時基于蒙特卡洛采樣的引導(dǎo)算法取得了最接近真實(ground truth)分布的結(jié)果,佐證了它是漸進精確的和流匹配引導(dǎo)框架的正確性。

圖片

此外,為了從實驗上比較各個引導(dǎo)算法優(yōu)劣,作者還在離線強化學(xué)習(xí)(offline RL)和圖片線性逆問題任務(wù)中測試了各個引導(dǎo)生成算法的效果,結(jié)果如表所示。

圖片

總體來說,在離線強化學(xué)習(xí)任務(wù)中,蒙特卡洛采樣引導(dǎo)有最佳性能。這可能由于離線強化學(xué)習(xí)任務(wù)中需要同一個引導(dǎo)算法在不同時間步的條件下都產(chǎn)生穩(wěn)定的引導(dǎo)采樣樣本,因此理論保證的能量引導(dǎo)算法具有最佳性能;而圖片逆問題中,針對此逆問題形式設(shè)計的高斯近似引導(dǎo)和 GDM 有最佳性能,而蒙特卡洛采樣引導(dǎo)由于問題維度較高不能產(chǎn)生合理的引導(dǎo)向量場。

結(jié)論

本工作針對流匹配模型中能量引導(dǎo)算法的空白,提出了一種新的能量引導(dǎo)的理論框架,并且提出幾類各有優(yōu)劣的實用引導(dǎo)算法,適用于一般的流匹配模型。此外,通過理論分析和實驗對各個引導(dǎo)算法進行了比較,提供了實際應(yīng)用指導(dǎo)。本工作希望為流匹配引導(dǎo)采樣和為生成模型的進一步應(yīng)用提供理論基礎(chǔ)。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-07-02 09:21:30

2025-05-07 13:49:19

模型AI架構(gòu)

2025-05-21 08:47:00

2025-08-04 08:34:00

2025-05-19 08:45:00

2025-07-17 09:28:09

2025-06-03 09:08:00

2025-07-14 09:12:00

2025-05-14 09:17:00

2025-07-09 09:05:00

模型AI訓(xùn)練

2025-05-16 08:44:01

2025-05-07 13:48:48

AIGC生成機器人

2025-07-23 10:07:31

2025-07-07 08:49:00

2025-06-03 08:26:00

智能體LLM開發(fā)

2025-04-03 09:27:44

2025-05-19 08:35:00

2025-06-19 08:55:00

LLMAI模型

2025-06-11 13:44:44

自動化模型智能體

2025-05-19 08:30:00

點贊
收藏

51CTO技術(shù)棧公眾號