“請(qǐng)給我一個(gè)五彩斑斕的黑”,只需一行命令就能讓AI畫畫
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
OpenAI今年1月公布的Dall-E可謂艷驚四座,只需輸入一段話,就能根據(jù)內(nèi)容輸出一幅畫。連吳恩達(dá)老師都不禁點(diǎn)贊。
比如讓它設(shè)計(jì)一個(gè)“像牛油果一樣的座椅”。
但是,OpenAI只在官網(wǎng)設(shè)置了幾種固定模板,代碼也沒有開源,用戶無法用AI設(shè)計(jì)出更多的圖片。
不過現(xiàn)在有個(gè)好消息,一位華人小哥Philip Wang已經(jīng)復(fù)現(xiàn)了一個(gè)PyTorch版Dall-E,叫做Deep Daze。
他使用了OpenAI的CLIP以及斯坦福大學(xué)的Siren,可以在個(gè)人電腦上運(yùn)行。
只需輸入在命令行中輸入一段描述,這個(gè)AI就能畫出各式圖片。
比如在綠色山丘上的薄霧(mist over green hills):
或者是“草地上的碎盤子”(shattered plates on the grass):
你覺得實(shí)際效果如何?
開發(fā)該項(xiàng)目的Philip Wang,就是在今年年初公布要復(fù)現(xiàn)Dall-E的那位大神,沒想到不到3個(gè)月的時(shí)間,這個(gè)項(xiàng)目已經(jīng)如此強(qiáng)大,在GitHub上已收獲1.1k星。
安裝與使用
Deep Daze可直接通過pip安裝:
- pip install deep-daze
安裝完成后,輸入以下命令運(yùn)行。
- imagine TEXT <flags>
其中imagine是命令,TEXT必須是一段不超過77個(gè)字符的英文描述,<flags>為可選參數(shù),可加可不加。
如果我們想生成文章開始那張山中薄霧的圖片,就輸入以下命令:
- imagine mist over green hills
<flags>中可加入的參數(shù)有:—deeper,獲取更高的圖像質(zhì)量;—num-layers,指定網(wǎng)絡(luò)的層數(shù)……更多用法可以去GitHub項(xiàng)目主頁(yè)查詢。
如果擔(dān)心AI的想象力過于天馬行空,可以指定一張圖片,讓AI在此圖像基礎(chǔ)上想象。這樣就能保證圖像不至于太過離譜。
具體的命令如下:
- imagine ‘description’ —start-image-path /path/to/picture.jpg
假設(shè)我們給AI一張披薩的圖片,讓它想象“上面鋪滿青椒的樣子”。
那么我們將上述命令中的描述改成“A pizza with green pepper”。
你以為這就是Deep Daze的全部?其實(shí),它還有一個(gè)更強(qiáng)大的完全體——故事模式。
只需設(shè)置—create_story=True,就可以解鎖該模式,取消77個(gè)字符的限制,項(xiàng)目作者將美國(guó)詩(shī)人羅伯特·弗羅斯特的詩(shī)《雪夜林邊歇馬》輸入其中,得到了一段mp4視頻。
到這里我有點(diǎn)想讓AI畫一下“五彩斑斕的黑”,但貧窮限制了我的操作。
因?yàn)槭褂肈eep Daze必須要安裝CUDA,而且最好在不小于8GB顯存的GPU上,才能獲得不錯(cuò)的效果。而我現(xiàn)在根本買不起英偉達(dá)顯卡。
項(xiàng)目地址:
https://github.com/lucidrains/deep-daze