偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

AI逆向繪畫火了！一鍵重繪梵高《星空》，來自華盛頓大學

2024-10-08 14:20:21

通過學習真實藝術家的繪畫視頻，結(jié)合文本和區(qū)域理解來定義繪畫 “指令”，并使用基于擴散的渲染器更新畫布，從而生成類似于人類藝術家繪畫過程的視頻。

梵高名作也能被AI逆向破解了？！

直接喂一張原圖，AI就能化身梵高·本高一點點重繪整張圖畫（原圖可任意）。

仔細對照兩邊，AI幾乎實現(xiàn)了1:1復刻，還為我們這些繪畫小白清晰展示了整幅圖的構建過程。

這項魔法來自華盛頓大學，項目名為Inverse Painting，相關論文已入選SIGGRAPH Asia 2024，其中兩位作者還是東北大學（Bowei Chen ）和上?？萍即髮W（Yifan Wang）的校友。

圖片

項目一經(jīng)發(fā)布后即在Reddit引起熱議，最高贊更是為藝術家群體操起了心（doge）。

藝術家可能會對此感到憤怒

圖片

圖片

不過也有人表示，這對于人們學習如何繪畫非常有幫助。

圖片

甚至可以用來“破解”一些大師遺作，提取隱藏或失傳的技術。

圖片

基于擴散模型

從原圖→繪畫過程延時視頻，Inverse Painting采用基于擴散的逆繪畫方法。

通過學習真實藝術家的繪畫視頻，結(jié)合文本和區(qū)域理解來定義繪畫 “指令”，并使用基于擴散的渲染器更新畫布，從而生成類似于人類藝術家繪畫過程的視頻。

圖片

進一步拆解，這一過程主要包括以下步驟：

學習藝術家的繪畫過程。收集了294個丙烯酸風景畫繪畫過程視頻（平均時長9分鐘），并進行視頻幀分割、裁剪和篩選等預處理操作，讓模型學習繪畫過程；
定義繪畫指令。基于對畫作不同元素（比如天空、樹木、人物等）以及元素相互關系的理解，模型會生成一組“繪畫指令”，告訴模型應該先畫什么，后畫什么；
使用擴散模型。用擴散模型生成逼真圖像，并逐步在畫布上添加細節(jié)，就像藝術家繪畫時一樣；
文本和區(qū)域理解。模型還會生成文本指令和區(qū)域掩碼，前者告訴模型要繪制的內(nèi)容，后者用來指定內(nèi)容的確切位置；
逐步渲染。從一個空白畫布開始，逐步生成完整繪畫過程；
時間控制。為了模擬真實世界中藝術家的繪畫速度，模型還會考慮每步之間的時間間隔；

這些步驟整體可歸為兩階段訓練+測試，如下所示：

圖片

第一階段：指令生成（Instruction Generation）

這個階段主要生成兩個關鍵指令集，文本指令生成器（Text Instruction Generator）和區(qū)域掩碼生成器（Mask Instruction Generator）。

前者通過比較目標畫作和當前畫布的狀態(tài)，生成一個簡短的文本指令，比如“畫天空”或“加花朵”，以此決定下一步應該添加哪些元素。

后者是一個二進制圖像，指明了畫布上應該更新哪些部分。

兩者一結(jié)合，確保模型只在畫布上合適的區(qū)域進行繪制。

△生成的文本指令

第二階段：畫布渲染（Canvas Rendering）

接下來使用第一階段生成的指令來更新畫布。

利用文本指令和區(qū)域掩碼，以及當前畫布的圖像和目標畫作，一個基于擴散的渲染器被用來更新畫布。

這個渲染器采用了一種叫做“去噪擴散概率模型”的技術，它逐步從噪聲圖像中去除噪音，以生成連續(xù)的圖像幀。

總之，渲染器在更新畫布時會考慮多種條件信號，包括文本指令、區(qū)域掩碼、時間間隔，以及目標畫作和當前畫作的特征。

這些條件信號幫助渲染器更準確地模擬人類藝術家的繪畫風格和過程。

圖片

測試（Test-Time Generation）

在測試階段，模型使用訓練好的管道從頭開始生成一幅畫作。

這里主要有兩個關鍵：

自回歸過程。每一步都依賴于前一步生成的結(jié)果，以此生成一個連貫的繪畫過程；
固定時間間隔。在每一步之間采用固定時間來更新畫布，模擬真實繪畫過程中的時間流逝；

最終，與三個基線方法（Timecraft、Paint Transformer、Stable Video Diffusion）相比，其生成結(jié)果明顯更優(yōu)。

圖片

同時，相關變體也取得了SOTA結(jié)果。

圖片

其中兩位作者為華人

簡單介紹下項目作者，一共5位，其中兩位是華人。

圖片

Bowei Chen （陳柏維），本科就讀于國內(nèi)東北大學軟件工程專業(yè)（2016年入學），后分別在卡內(nèi)基梅隆大學機器人研究所和華盛頓大學攻讀碩博。

研究興趣為計算機視覺和圖形學的交叉點，重點是圖像和視頻生成。

圖片

Yifan Wang，本科就讀于上海科技大學計算機專業(yè)，今年剛獲得華盛頓大學CS博士學位。

個人主頁顯示了多段工作經(jīng)歷（含字節(jié)、谷歌、Adobe等），目前是Meta Reality Labs Research的一名研究科學家。

圖片

實際上，這個團隊進行的AI逆向繪畫之前也有，網(wǎng)友們還提到了Paints Undo這個項目。

當時主要應用于動漫領域，短短3個月已在GitHub攬星3.3K。

圖片

對于這事兒，人們一直褒貶不一，最大爭議在于人們擔心有人會利用AI謊稱作者。

畢竟通過講解藝術思路是作者證明作品原創(chuàng)性的手段之一。

圖片

甚至對于它能教人們學繪畫這事兒，也有網(wǎng)友以自身經(jīng)歷出來反駁：

目前不太符合真實繪畫過程

圖片

圖片

所以，有了解繪畫的童鞋來說說看嗎？

參考鏈接：
[1]https://inversepainting.github.io/[2]https://www.reddit.com/r/singularity/comments/1fybddi/inverse_painting_can_generate_timelapse_videos_of/

責任編輯：武曉燕來源：量子位

AI 逆向繪畫

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sub id="wf5fi"><p id="wf5fi"></p></sub>

^{<sub id="wf5fi"></sub>}