偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<menuitem id="cufgd"><mark id="cufgd"></mark></menuitem>

<pre id="cufgd"></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

谷歌 Fluid 顛覆共識：兩大因素被發(fā)現(xiàn)，AI 文生圖領(lǐng)域自回歸模型超越擴散模型

作者：故淵 2024-10-23 14:04:24

科技媒體 The Decoder 10 月 22 日發(fā)布博文，報道稱谷歌 DeepMind 團隊攜手麻省理工學院（MIT），推出了全新的“Fluid”模型，在規(guī)模達到 105 億參數(shù)時候，能取得最佳的文生圖效果。

10 月 23 日消息，科技媒體 The Decoder 昨日（10 月 22 日）發(fā)布博文，報道稱谷歌 DeepMind 團隊攜手麻省理工學院（MIT），推出了全新的“Fluid”模型，在規(guī)模達到 105 億參數(shù)時候，能取得最佳的文生圖效果。

目前在文生圖領(lǐng)域，行業(yè)內(nèi)的一個共識是自回歸模型（Autoregressive Models）不如擴散模型（Diffusion Models）。

IT之家簡要介紹下這兩種模型：

擴散模型 (Diffusion Models): 這是一種最近非常熱門的內(nèi)容生成技術(shù)，它模擬的是信號從噪聲中逐漸恢復的過程。擴散模型通過迭代地減少隨機噪聲來生成高質(zhì)量的圖像、文本和其他形式的數(shù)據(jù)。比如應用于圖像生成領(lǐng)域中的 DDPM（離散擴散概率模型）及其變體就有很高的關(guān)注度。
自回歸模型 (Autoregressive Models): 自回歸模型預測序列中的下一個元素時，依賴于前面的元素。在文本生成領(lǐng)域，像基于 Decoder-only 的 GPT 系列（如 GPT-3、GPT-4）就是典型的自回歸模型，它們逐詞預測下一個詞，從而生成連貫的文本段落。

谷歌 DeepMind 和 MIT 團隊通過深入研究，發(fā)現(xiàn)了使用連續(xù) tokens（非離散 tokens）和采用隨機生成順序（非固定順序）兩個關(guān)鍵設計因素，顯著提高了自回歸模型的性能和可擴展性。

團隊表示在離散 tokens 為每個圖像區(qū)域分配一個來自有限詞匯的代碼，這會導致信息丟失，而連續(xù) tokens 可以更精確地圖像信息存儲，減少信息丟失。這讓模型能夠更好地重建圖像，提高視覺質(zhì)量。

此外大多數(shù)自回歸模型以固定順序生成圖像，而 Fluid 采用隨機生成順序，讓模型能夠在每一步預測任意位置的多個像素，這種方法在理解整體圖像結(jié)構(gòu)時表現(xiàn)更為出色。

Fluid 模型結(jié)合了連續(xù)標記和隨機生成順序后，當其規(guī)模擴大到 105 億參數(shù)時，F(xiàn)luid 在重要基準測試中超越了 Stable Diffusion 3 擴散模型和谷歌此前的 Parti 自回歸模型。

與 Parti 相比，F(xiàn)luid 顯示出顯著的改進：擁有 200 億參數(shù)的 Parti 在 MS-COCO 上達到了 7.23 的 FID 分數(shù)，而僅有 3.69 億參數(shù)的小型 Fluid 模型卻達到了相同的分數(shù)。

責任編輯：龐桂玉來源： IT之家

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<nav id="ymp6k"></nav>

<abbr id="ymp6k"></abbr>

<button id="ymp6k"><nobr id="ymp6k"></nobr></button>