偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<var id="0lshd"><fieldset id="0lshd"></fieldset></var>

<tt id="0lshd"><em id="0lshd"></em></tt>

<tt id="0lshd"><abbr id="0lshd"></abbr></tt>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!

快手技術(shù)

發(fā)布于 2025-7-3 17:27

瀏覽

0收藏

測試時擴展（Test-Time Scaling）極大提升了大語言模型的性能，涌現(xiàn)出了如OpenAI o系列模型和DeepSeek R1等眾多爆款。那么，什么是視覺領(lǐng)域的test-time scaling？又該如何定義？

?

為了回答這一問題，最近香港科技大學聯(lián)合快手可靈團隊推出Evolutionary Search （EvoSearch）方法，通過提高推理時的計算量來大幅提升模型的生成質(zhì)量，支持圖像和視頻生成，支持目前最先進的diffusion-based 和 flow-based模型。

?

EvoSearch 無需訓練，無需梯度更新，即可在一系列任務(wù)上取得顯著最優(yōu)效果，并且表現(xiàn)出良好的scaling up能力，魯棒性和泛化性。隨著測試時計算量提升，EvoSearch表明SD2.1和Flux.1-dev也有潛力媲美甚至超過GPT4o。對于視頻生成，Wan 1.3B也能超過Wan 14B和Hunyuan 13B，展現(xiàn)了了test-time scaling補充training-time scaling的潛力和研究空間。

?

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

論文標題：Scaling Image and Video Generation via Test-Time Evolutionary Search
項目主頁：??https://tinnerhrhe.github.io/evosearch/??
代碼：https://github.com/tinnerhrhe/EvoSearch-codes
論文：https://arxiv.org/abs/2505.17618

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

一、Test-Time Scaling的本質(zhì)

這里我們將測試時擴展（Test-Time Scaling）和RL post-training分開來看，我們定義前者無需參數(shù)更新，后者需要計算資源進行后訓練。Test-time scaling和 RL post-training本質(zhì)都是為了激發(fā)預訓練模型的能力，使其與人類偏好（獎勵）對齊。給定一個預訓練模型和獎勵函數(shù)，我們的目的是擬合如下的目標分布：

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

?

其中是獎勵函數(shù)代表（人類）偏好，KL距離（）防止預訓練模型的分布與目標分布偏離太遠，避免知識遺忘。該目標分布可以重新寫成如下形式：

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

其中是歸一化常數(shù)，需要遍歷整個狀態(tài)空間來計算。這是不可行的，因為diffusion和flow 模型的狀態(tài)空間都是高維的。這導致直接從目標分布采樣不可行。

二、當前方法的局限性

諸如RL的后訓練方法雖然也能從目標分布采樣，但需要構(gòu)造數(shù)據(jù)以及大量計算資源重新更新模型參數(shù)，導致代價很大并且很難scale up。

?

目前在視覺領(lǐng)域，最有效的test-time scaling方法包括Best-of-N，它基于重要性采樣（Importance Sampling）來擬合目標分布采樣。Best-of-N隨機采樣多個樣本，并篩選出獎勵最高的N個。在基于diffusion和flow模型的圖像和視頻生成任務(wù)上，Best-of-N的樣本通常是初始噪聲。

?

最近的一些工作提出了更高級的采樣方法，可以統(tǒng)一稱為Particle Sampling。這類方法將搜索空間拓展為整條去噪軌跡，在去噪過程中不斷保留好的樣本，并丟掉表現(xiàn)差的樣本（類似beam search）。這類方法雖然也能表現(xiàn)出scaling up性質(zhì)，但缺少探索新的狀態(tài)空間能力，并且會減少生成樣本的多樣性。

我們做了一個小實驗，當目標分布和預訓練分布不一致（甚至可能是o.o.d.），基于學習的RL方法會出現(xiàn)獎勵過優(yōu)化的現(xiàn)象（reward over-optimization）。諸如best-of-N和particle sampling的搜索方法也不能找到目標分布所有的模態(tài)。但我們的方法EvoSearch成功擬合了目標分布，并且取得了最高的獎勵值。

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

三、EvoSearch解讀

我們將圖像和視頻生成的test-time scaling問題重構(gòu)成演化搜索問題。具體來說，受生物的自然選擇和演化所啟發(fā)，我們將diffusion和flow模型中的去噪軌跡看成演化路徑，每個去噪步的樣本都可以進行變異演化來探索更高質(zhì)量的子代，最后得到最優(yōu)的符合目標分布的去噪樣本（圖片或者視頻）。不同于一般的演化方法，樣本空間局限于一個固定的狀態(tài)空間進行演化，我們提出的EvoSearch的演化空間沿著去噪軌跡動態(tài)前移，即起始于高斯噪聲，終止于x0。

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

EvoSearch 框架圖

?

我們的方法受如下的洞見啟發(fā)。我們發(fā)現(xiàn)在整個去噪軌跡中，高質(zhì)量的樣本往往會聚集在一起。因此，當我們搜索到高質(zhì)量的父代，我們可以在父代周圍的空間進行探索從而有效找到更高質(zhì)量的樣本。從下圖可以看到去噪軌跡中的樣本在低維空間的分布與獎勵空間具有強相關(guān)性。

?

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

?

基于此，我們設(shè)計了如下兩種變異模式：

初始噪聲變異：EvoSearch通過如下正交操作保持初始噪聲仍然符合高斯分布

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

?

其中是變異率來控制探索強度。

中間去噪狀態(tài)變異：由于中間去噪狀態(tài)的分布是復雜的且在搜索過程中不可知。我們受SDE方程啟發(fā)，設(shè)計如下變異模式：

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

其中是SDE去噪過程中的擴散系數(shù)。

這些變異方式一方面加強了對于新的狀態(tài)空間探索，另一方面又避免了偏離去噪軌跡的預訓練分布。

我們定義了evolution schedule和population size schedule來進行演化搜索，這兩種schedule的設(shè)置取決于可用的測試時計算量大小。

Evolution Schedule定義為,用于指定應該在哪些時間步驟進行EvoSearch。該調(diào)度模式避免了冗余去噪步數(shù)，節(jié)省了計算開銷。
Population Size Schedule定義為，其中代表了初始噪聲樣本的種群大小，后續(xù)每個規(guī)定了在時間步的演化子代種群大小。

EvoSearch算法偽代碼如下：

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

四、EvoSearch實驗結(jié)果

1. 對于圖片生成任務(wù)，在Stable Diffusion 2.1和Flux.1-dev上，EvoSearch展示了最優(yōu)的scaling up性質(zhì)。即使測試時計算量擴大了1e4量級，仍能保持上升勢頭。對于視頻生成任務(wù)，EvoSearch在VBench，VBench2.0以及VideoGen-Eval中的prompts上也能達到最高的reward提升幅度。

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

?

2. EvoSearch也能泛化到分布外（unseen）的評估指標，顯示了最優(yōu)的泛化性和魯棒性。

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

?

3. EvoSearch在人類評估上也達到最優(yōu)勝率。這得益于他高的生成多樣性，平衡了exploration和exploitation。

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

4. 下面是更多的可視化結(jié)果：

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

快手聯(lián)合港科大“放大招”！推出測試時擴展方法EvoSearch，1.3B視頻模型碾壓14B!-AI.x社區(qū)

更多細節(jié)請見原論文和項目網(wǎng)站。

標簽

語言大模型

贊

收藏

回復

舉報

回復

相關(guān)推薦

大模型參數(shù)量都是7B，13B和65B等背后的原因是什么？

Syrupup ? 1.3w瀏覽 ? 0回復
像俄羅斯方塊一樣生成視頻！北大聯(lián)合快手AI團隊推出新框架VideoTetris實現(xiàn)跟隨復雜指令的文生視頻！

angel ? 3330瀏覽 ? 0回復
視頻擴散模型加持，稀疏視圖重建任意場景！清華&港科大發(fā)布ReconX

angel ? 3842瀏覽 ? 0回復
Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型

NLP工作站 ? 4765瀏覽 ? 0回復
Qwen2.5：13個新模型來襲！開源通用、編碼、數(shù)學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 5628瀏覽 ? 0回復
僅1.3B！Janus 統(tǒng)一多模態(tài)理解和生成

kede96 ? 2856瀏覽 ? 0回復
騰訊放大招，超Meta！史上參數(shù)最大，開源專家混合模型

Aceryt ? 2233瀏覽 ? 0回復
DeepSeek AI發(fā)布Janus：一款擁有圖像生成能力的1.3B多模態(tài)模型

Halo咯咯 ? 6340瀏覽 ? 0回復
Qwen2.5：13個新模型來襲！開源通用、編碼、數(shù)學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4850瀏覽 ? 0回復
Qwen開源強大、多樣、實用的Qwen2.5-Coder系列（0.5B/1.5B/3B/7B/14B/32B）

Halo咯咯 ? 4557瀏覽 ? 0回復
測試時訓練(TTT)太強了！

NLP前沿1 ? 2722瀏覽 ? 0回復
小模型界o1來了：微軟推出Phi-4，數(shù)學推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷

51CTO技術(shù)棧 ? 2532瀏覽 ? 0回復
微軟 Phi-4 震撼發(fā)布：14B 參數(shù)模型性能超越一眾大模型，數(shù)學推理性能提升顯著

Syrupup ? 3098瀏覽 ? 0回復
通義實驗室放大招

NLP前沿1 ? 1922瀏覽 ? 0回復
S1：簡單高效的測試時推理能力擴展方法

上堵吟1 ? 2309瀏覽 ? 0回復
1B模型如何通過測試時優(yōu)化逆襲405B LLM？

arnoldzhw ? 2259瀏覽 ? 0回復
Meta放大招！Llama 4三大模型來襲，開源免費還超能打

Halo咯咯 ? 2607瀏覽 ? 0回復
OpenAI深夜放大招！GPT-4.1系列震撼發(fā)布：百萬token上下文+性能全面碾壓，性價比拉滿

AI博物院 ? 1401瀏覽 ? 0回復
開源代碼推理模型，32B、14B、7B各顯神通

Halo咯咯 ? 1613瀏覽 ? 0回復

快手技術(shù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

節(jié)省前端1000+pd人力成本！快手快聘「伏羲工作臺」技術(shù)實踐全解析 7天前發(fā)布
快手開源多模態(tài)大模型Kwai Keye-VL，引領(lǐng)視頻理解新紀元 7天前發(fā)布

熱門推薦

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復

上一篇：節(jié)省前端1000+pd人力成本！快手快聘「伏羲工作臺」技術(shù)實踐全解析

社區(qū)精華內(nèi)容

目錄