偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet

發(fā)布于 2024-5-10 09:55
瀏覽
0收藏

一、概述

PowerPaint 是一種圖像修復模型,它能夠實現(xiàn)多種內繪圖任務,包括文本引導的對象內繪圖、上下文感知圖像內繪圖、可控形狀擬合的對象內繪圖以及外繪圖。如果單純從這篇文章來看,并不能達到最好的效果,但是作者受 BrushNet 啟發(fā),重新訓練了一版,也是 github 里面的 PowerPaint v2,效果應該算是當前的最優(yōu)解了。


項目地址:PowerPaint項目頁面(https://powerpaint.github.io/)

論文地址:A Task is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting(https://arxiv.org/pdf/2312.03594)

代碼地址:https://github.com/open-mmlab/PowerPaint(https://github.com/open-mmlab/PowerPaint)

效果:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

二、原理

核心點:

  • 學習任務提示(Task Prompts):通過引入可學習的任務提示和針對性的微調策略,指導模型明確關注不同的內繪圖目標。
  • 負提示(Negative Prompt):展示任務提示在 PowerPaint 中的多功能性,作為負提示用于有效的對象移除。
  • 提示插值技術(Prompt Interpolation Techniques):利用該技術實現(xiàn)可控的形狀引導對象內繪圖。

細節(jié)解釋:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

  • 問題設定:在圖像中填充用戶指定區(qū)域,根據用戶意圖填充合理的內容。
  • PowerPaint架構


1.任務提示 :引入可學習的任務提示,專門為上下文感知圖像內繪圖(Context-aware Image Inpainting)設計的任務提示。它引導模型填充圖像中的缺失區(qū)域,同時保持與周圍圖像內容的一致性。在訓練中通常與隨機掩碼一起使用,目的是讓模型學會如何根據圖像的上下文信息來填充缺失的部分,而不是依賴于文本描述。

2.對象移除:通過結合分類器自由引導采樣策略,使用作為正提示,作為負提示,有效防止在區(qū)域內生成對象,提高對象移除的成功率。

3.形狀引導對象內繪圖:通過隨機擴張對象分割掩碼,并使用和之間的插值作為訓練的任務提示,建立兩種內繪圖目標之間的權衡。為了實現(xiàn)形狀引導的對象內繪圖中的可控性,通過插值和來平衡形狀擬合和上下文感知。將和作為后綴添加到文本描述中,并將它們分別輸入到CLIP文本編碼器中,通過根據的值對兩個 Text Embedding 進行線性插值,我們得到了最終的文本嵌入,記為:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

其中這里的值為了防止模型過度擬合掩模的形狀,而不考慮物體的整體形狀,做了如下設置:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

局限性:

  • 基礎模型限制:合成質量可能受到底層文本到圖像擴散模型能力的約束。
  • 小區(qū)域擬合挑戰(zhàn):在訓練中,對象占據極小區(qū)域的實例稀疏,導致實現(xiàn)極小值擬合度有一定挑戰(zhàn)。

三、PowerPaint + BrushNet

主要重點說下PowerPaint + BrushNet,前面我寫過一篇 BrushNet 的文章 grooter:【AIGC圖像理論篇11】BrushNet —— 插件式圖像修復inpainting 模型(??https://zhuanlan.zhihu.com/p/695197835??) ,BrushNet 使用了一個分支來更好的提取遮

罩圖像特征的優(yōu)勢,但是因為其刪除了此分支的文本提示的交叉注意力,所以其內容的控制依靠原擴散模型的prompt。而PowerPaint主要創(chuàng)新點在于引入可學習的任務提示和針對性的微調策略,所以 PowerPaint 作者結合兩者的優(yōu)勢,保留被 BrushNet 刪除的交叉注意力層用于任務提示輸入,重新訓練了新的 PowerPaint,得到了PowerPaint + BrushNet模型??偨Y下就是在BrushNet的單獨的分支上用PowerPaint 針對性微調的方式訓練了一個新的BrushNet模型


我實際部署后做了下對比,效果確實會好一些,尤其是outpainting,效果圖如下:

inpainting:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

outpainting:

當前 inpainting/outpainting 最優(yōu)解:PowerPaint + BrushNet-AI.x社區(qū)

四、總結

PowerPaint作為一種多功能的圖像內繪圖模型,通過學習任務提示和負提示,以及利用提示插值技術,實現(xiàn)了在多種內繪圖任務中的優(yōu)異性能。而 PowerPaint + BrushNet 更好的結合了兩者的優(yōu)點,也輸出了較好的效果,但是不能和sd webui結合是一個推廣瓶頸。


本文轉自 AI生成未來 ,作者:grooter


原文鏈接:??https://mp.weixin.qq.com/s/mHWlzR4cVqOQyXF0T1LX4w??

收藏
回復
舉報
回復
相關推薦