偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<strong id="ors6v"><tt id="ors6v"></tt></strong>

<nav id="ors6v"><strong id="ors6v"></strong></nav>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

擴散模型攻克算法難題，AGI不遠(yuǎn)了！谷歌大腦找到迷宮最短路徑

作者：新智元 2024-04-02 11:37:59

GAN、VAE、大型自回歸神經(jīng)網(wǎng)絡(luò)模型、歸一化流等方法，在樣本質(zhì)量、采樣速度、對數(shù)似然，以及訓(xùn)練穩(wěn)定性方面都各有千秋。

「擴散模型」也能攻克算法難題？

圖片

一位博士研究人員做了一個有趣的實驗，用「離散擴散」尋找用圖像表示的迷宮中的最短路徑。

圖片

作者介紹，每個迷宮都是通過反復(fù)添加水平和垂直墻生成的。

其中，起始點和目標(biāo)點隨機選取。

從起點到目標(biāo)點的最短路徑中，隨機采樣一條作為解決方案的路徑。最短路徑是通過精確算法算出來的。

圖片

然后使用離散擴散模型和U-Net。

將起點和目標(biāo)的迷宮被編碼在一個通道中，而模型在另一個通道中用解來消除迷宮的噪聲。

圖片

再難一點的迷宮，也能做的很好。

圖片

為了估算去噪步驟 p(x_{t-1} | x_t)，算法會估算 p(x_0 | x_t)。在這個過程中可視化這一估計值（底行），顯示「當(dāng)前假設(shè)」，最終聚焦在結(jié)果上。

圖片

英偉達(dá)高級科學(xué)家Jim Fan表示，這是一個有趣的實驗，擴散模型可以「渲染」算法。它可以僅從像素實現(xiàn)迷宮遍歷，甚至使用了比Transforme弱得多的U-Net。

我一直認(rèn)為擴散模型是渲染器，而Transformer是推理引擎?？雌饋?，渲染器本身也可以編碼非常復(fù)雜的順序算法。

圖片

這個實驗簡直驚呆了網(wǎng)友，「擴散模型還能做什么？！」

圖片

還有人表示，一旦有人在足夠好的數(shù)據(jù)集上訓(xùn)練擴散Transformer，AGI就解決了。

圖片

不過這項研究還未正式發(fā)布，作者表示稍后更新在arxiv上。

值得一提的是，這個實驗中，他們采用了谷歌大腦團隊曾在2021年提出的離散擴散模型。

圖片

就在最近，這項研究重新更新了一版。

離散擴散模型

「生成模型」是機器學(xué)習(xí)中的核心問題。

它既可用于衡量我們捕獲自然數(shù)據(jù)集統(tǒng)計數(shù)據(jù)的能力，也可用于需要生成圖像、文本和語音等高維數(shù)據(jù)的下游應(yīng)用程序。

GAN、VAE、大型自回歸神經(jīng)網(wǎng)絡(luò)模型、歸一化流等方法，在樣本質(zhì)量、采樣速度、對數(shù)似然，以及訓(xùn)練穩(wěn)定性方面都各有千秋。

最近，「擴散模型」已成為圖像、音頻生成，最受歡迎的替代方案。

它可以用更少的推理步驟，實現(xiàn)了與GAN相當(dāng)?shù)臉颖举|(zhì)量，以及與自回歸模型相當(dāng)?shù)膶?shù)似然。

圖片

論文地址：https://arxiv.org/pdf/2107.03006.pdf

雖然已有人提出了離散和連續(xù)狀態(tài)空間的擴散模型，但最近的研究主要集中在，連續(xù)狀態(tài)空間中運行的高斯擴散過程（如實值圖像和波形數(shù)據(jù)）。

離散狀態(tài)空間的擴散模型，已在文本和圖像分割領(lǐng)域進(jìn)行了探索，但是還沒有在文本和圖像的大規(guī)模生成任務(wù)中，證明是一個有競爭力的模型。

谷歌研究團隊提出了一種全新的離散去噪擴散概率模型（D3PM）。

研究中，作者證明了過度矩陣的選擇是一個重要的設(shè)計決策，它能改善圖像和文本領(lǐng)域的結(jié)果。

此外，他們還提出了一種新的損失函數(shù)，它結(jié)合了變分下界和輔助的交叉熵?fù)p失。

在文本方面，這個模型在字符級文本生成方面取得了很好的效果，同時可以擴展到大詞匯量的LM1B數(shù)據(jù)集上。

在CIFAR-10圖像數(shù)據(jù)集上，最新模型接近了連續(xù)空間DDPM模型的樣本質(zhì)量，并超過了連續(xù)空間 DDPM 模型的對數(shù)似然。

圖片

項目作者

Arnaud Pannatier

Arnaud Pannatier從2020年3月在導(dǎo)師Fran?ois Fleuret的機器學(xué)習(xí)小組開始攻讀博士學(xué)位。

他最近開發(fā)了HyperMixer，使用超級網(wǎng)絡(luò)讓MLPMixer能夠處理各種長度輸入。這使得模型能夠以一種排列不變的方式處理輸入，并證明了它給了模型一種隨著輸入長度線性擴展的注意力行為。

在EPFL，他先后獲得了物理學(xué)學(xué)士學(xué)位和計算機科學(xué)與工程碩士學(xué)位（CSE-MASH）。

參考資料：

https://arxiv.org/pdf/2107.03006.pdf

https://x.com/DrJimFan/status/1762888644933902681?s=20

責(zé)任編輯：武曉燕來源：新智元

AGI 網(wǎng)絡(luò)模型 GAN

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<tr id="3xhd9"></tr>

<kbd id="3xhd9"><font id="3xhd9"><tr id="3xhd9"></tr></font></kbd>