偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<nav id="cw3zl"></nav>

<var id="cw3zl"><fieldset id="cw3zl"></fieldset></var>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

ICML 2025 Spotlight | 新理論框架解鎖流匹配模型的引導(dǎo)生成

2025-06-30 08:36:00

人工智能新聞

作者從理論上推導(dǎo)得到全新能量引導(dǎo)理論框架，并進一步提出多樣的實際能量引導(dǎo)算法，可以根據(jù)任務(wù)特性進行靈活選擇。

本文第一作者是西湖大學(xué)博士生馮睿騏，通訊作者為西湖大學(xué)人工智能系助理教授吳泰霖。吳泰霖實驗室專注于解決 AI 和科學(xué)交叉的核心問題，包含科學(xué)仿真、控制、科學(xué)發(fā)現(xiàn)。

在解決離線強化學(xué)習(xí)、圖片逆問題等任務(wù)中，對生成模型的能量引導(dǎo)（energy guidance）是一種可控的生成方法，它構(gòu)造靈活，適用于各種任務(wù)，且允許無額外訓(xùn)練條件生成模型。同時流匹配（flow matching）框架作為一種生成模型，近期在分子生成、圖片生成等領(lǐng)域中已經(jīng)展現(xiàn)出巨大潛力。

然而，作為比擴散模型更一般的框架，流匹配允許從幾乎任意的源分布以及耦合分布中生成樣本。這在使得它更靈活的同時，也使得能量引導(dǎo)的實現(xiàn)與擴散模型有根本不同且更加復(fù)雜。因此，對于流匹配來說，如何得到具有理論保證的能量引導(dǎo)算法仍然是一個挑戰(zhàn)。

針對這一問題，作者從理論上推導(dǎo)得到全新能量引導(dǎo)理論框架，并進一步提出多樣的實際能量引導(dǎo)算法，可以根據(jù)任務(wù)特性進行靈活選擇。本工作的主要貢獻如下：

本工作首次提出了流匹配能量引導(dǎo)理論框架。
在本框架指導(dǎo)下，本工作提出三大類無需訓(xùn)練的實用流匹配能量引導(dǎo)算法，并可將經(jīng)典擴散模型能量引導(dǎo)算法包含為特例。
本工作給出了各個流匹配能量引導(dǎo)算法性能的理論分析和實驗比較，為實際應(yīng)用提供指導(dǎo)。

論文標題：On the Guidance of Flow Matching
論文鏈接：https://arxiv.org/abs/2502.02150
項目地址：https://github.com/AI4Science-WestlakeU/flow_guidance

目前，本工作已被接受為 ICML 2025 spotlight poster，代碼已經(jīng)開源。

研究背景

在生成模型的應(yīng)用中，能量引導(dǎo)是一種重要的技術(shù)。理想情況下，它通過在模型已有的向量場中加上一個引導(dǎo)向量場，使生成的樣本服從的分布從訓(xùn)練集分布改變?yōu)楸荒硞€能量函數(shù)加權(quán)后的分布。這樣一來，通過將能量函數(shù)設(shè)置為可控生成中的目標函數(shù)，即可使生成的樣本同時符合訓(xùn)練集和滿足目標。

已有的能量引導(dǎo)算法集中于擴散模型，但是流匹配模型和擴散模型相比有本質(zhì)上的差別，使得它們的能量引導(dǎo)算法不能直接通用。簡而言之，擴散模型可以被看作是流匹配模型在這些假設(shè)下的特例：源分布是高斯分布、源分布和生成分布之間沒有耦合、條件速度場滿足特定的線性形式。

在這些假設(shè)下，擴散模型的向量場可以和得分函數(shù)（score function）關(guān)聯(lián)起來，從而能量引導(dǎo)向量場可以被大大簡化，成為能量函數(shù)對數(shù)期望的梯度形式。在沒有這些假設(shè)時，能量引導(dǎo)向量場則需要幾乎完全重新推導(dǎo)。

目前雖然已經(jīng)有一些工作對流匹配模型進行能量引導(dǎo)，但是這些流匹配模型仍然采用了高斯源分布等三個假設(shè)，所以本質(zhì)上仍然是擴散模型（僅有條件向量場的系數(shù)中有細微不同）。因此，一個具有一般性的流匹配能量引導(dǎo)理論框架是必要的。

方法概述

首先，作者從流匹配模型基礎(chǔ)定義出發(fā)，推導(dǎo)了一般的流匹配能量引導(dǎo)向量場。具體而言，將疊加了能量引導(dǎo)后的總向量場與原向量場相減，

其中是源分布樣本，是目標分布樣本。經(jīng)過化簡即可得到，

其中在實際數(shù)據(jù)集中可以近似為 1。

直觀上來說，引導(dǎo)向量場在能量函數(shù)小于它的平均值時將指向?qū)?yīng)的，從而將原向量場轉(zhuǎn)向能量函數(shù)更小的區(qū)域。為了實現(xiàn)實際的能量引導(dǎo)，作者接下來提出三大類不同的無需訓(xùn)練的能量引導(dǎo)算法。

蒙特卡洛估計

在引導(dǎo)向量場的計算中，主要困難來源于從中采樣。通過使用重要性采樣（importance sampling）技術(shù)，可以將從這一分布中采樣轉(zhuǎn)化為從更簡單的中采樣。從中采樣，只需從訓(xùn)練數(shù)據(jù)集中采樣（如果可用），或者使用原模型生成服從的樣本。

利用這一方法，在樣本數(shù)不限的情況下可以計算精確的能量引導(dǎo)向量場。

梯度近似

為了更高效地計算引導(dǎo)向量場，可以通過近似來得到更簡單的形式。一個直接的近似是利用在分布的均值附近的泰勒展開，通過只保留一階項來化簡。計算可得

也就是得到了擴散模型引導(dǎo)向量場中常見的「能量函數(shù)的梯度」的形式。注意到梯度前面的項和能量函數(shù)無關(guān)，可以進一步通過設(shè)置成超參數(shù)來近似，或者在一些特殊情況的流匹配模型中，可以被進一步簡化。

例如，通過采用源分布是高斯分布、源分布和生成分布之間沒有耦合、條件速度場滿足特定的線性形式的假設(shè)（即和擴散模型相同），可以簡化為經(jīng)典的擴散后驗采樣（Diffusion Posterior Sampling, DPS）算法。

值得注意的是，雖然在擴散模型的特例中，最終形式和 DPS 相同，但是推導(dǎo)方式截然不同。DPS 基于擴散能量引導(dǎo)框架，利用 Jensen 不等式來消除不可計算的期望，但這里基于流匹配能量引導(dǎo)框架，則是使用泰勒展開來簡化這一期望的計算。

流匹配框架不僅提供了一個替代的理論理解視角，而且從中可以導(dǎo)出引導(dǎo)向量場的誤差上界。該誤差和的協(xié)方差矩陣（代表著當前噪聲樣本可以多準確地估計最終生成的干凈樣本），以及的 Hessian（代表著能量函數(shù)變化多劇烈）有關(guān)。

高斯近似

由于從中采樣困難，還可以直接假設(shè)是一個可以采樣的簡單分布，例如高斯分布。只需要將該高斯分布的均值和方差設(shè)置為和一致（甚至方差可以簡單設(shè)置為一個超參數(shù)），就可以期待從該高斯分布中采樣估計的引導(dǎo)向量場和真實引導(dǎo)向量場接近：

更進一步地，如果考慮具體任務(wù)中，能量函數(shù)的特定形式，比如含有高斯噪聲的線性逆問題中，

那么在該高斯近似下，可以計算引導(dǎo)向量場的解析表達式。

事實上，這和經(jīng)典的偽逆引導(dǎo)擴散模型（GDM）的形式高度相似，在選取擴散模型對應(yīng)的去噪進度超參數(shù)后可以完全簡化為 GDM。

實驗結(jié)果

作者在合成數(shù)據(jù)、離線強化學(xué)習(xí)和圖片線性逆問題中進行了實驗。首先，在合成數(shù)據(jù)集上進行實驗。源分布被設(shè)置成圖中左一列的非高斯分布，并且能量函數(shù)包含簡單表達式（第一行）、關(guān)于極坐標下極角的階梯函數(shù)（第二行）、MLP 分類器的輸出（第三行）。

這些流匹配引導(dǎo)任務(wù)和擴散模型顯著不同，因此針對擴散模型的精確能量引導(dǎo)方法（左三列，對比能量引導(dǎo) CEG）完全失敗。同時基于蒙特卡洛采樣的引導(dǎo)算法取得了最接近真實（ground truth）分布的結(jié)果，佐證了它是漸進精確的和流匹配引導(dǎo)框架的正確性。

此外，為了從實驗上比較各個引導(dǎo)算法優(yōu)劣，作者還在離線強化學(xué)習(xí)（offline RL）和圖片線性逆問題任務(wù)中測試了各個引導(dǎo)生成算法的效果，結(jié)果如表所示。

總體來說，在離線強化學(xué)習(xí)任務(wù)中，蒙特卡洛采樣引導(dǎo)有最佳性能。這可能由于離線強化學(xué)習(xí)任務(wù)中需要同一個引導(dǎo)算法在不同時間步的條件下都產(chǎn)生穩(wěn)定的引導(dǎo)采樣樣本，因此理論保證的能量引導(dǎo)算法具有最佳性能；而圖片逆問題中，針對此逆問題形式設(shè)計的高斯近似引導(dǎo)和 GDM 有最佳性能，而蒙特卡洛采樣引導(dǎo)由于問題維度較高不能產(chǎn)生合理的引導(dǎo)向量場。

結(jié)論

本工作針對流匹配模型中能量引導(dǎo)算法的空白，提出了一種新的能量引導(dǎo)的理論框架，并且提出幾類各有優(yōu)劣的實用引導(dǎo)算法，適用于一般的流匹配模型。此外，通過理論分析和實驗對各個引導(dǎo)算法進行了比較，提供了實際應(yīng)用指導(dǎo)。本工作希望為流匹配引導(dǎo)采樣和為生成模型的進一步應(yīng)用提供理論基礎(chǔ)。

責(zé)任編輯：張燕妮來源：機器之心

AI 模型強化學(xué)習(xí)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營