安卓手機(jī)「跑」Stable Diffusion創(chuàng)新紀(jì)錄,15秒內(nèi)出圖
我們知道,Stable Diffusion 是一種非常流行的文本到圖像生成式 AI 模型,它能夠在幾十秒內(nèi)為任何給定的輸入文本創(chuàng)建逼真的圖像。Stable Diffusion 的參數(shù)超過(guò)了 10 億,直到現(xiàn)在,該模型主要在云端運(yùn)行。
因此,如何在移動(dòng)設(shè)備端運(yùn)行 Stable Diffusion 吸引了圈內(nèi)人士的極大興趣。此前,有位作者開(kāi)發(fā)了一個(gè)應(yīng)用程序,通過(guò) Stable Diffusion 來(lái)生成圖像,然后按喜歡的方式編輯。該應(yīng)用在最新的 iPhone 14 Pro 上生成圖片僅需一分鐘,使用大約 2GiB 的應(yīng)用內(nèi)存。
甚至蘋(píng)果親自下場(chǎng)優(yōu)化,在 iPhone、iPad、Mac 等設(shè)備上以驚人速度運(yùn)行 Stable Diffusion,在半分鐘生成一張分辨率 512x512 的圖像。如下為蘋(píng)果設(shè)備上運(yùn)行 Stable Diffusion 和 Core ML + diffusers 生成的圖像。
Stable Diffusion 實(shí)現(xiàn)最快安卓端運(yùn)行
那么安卓手機(jī)上能不能也運(yùn)行 Stable Diffusion 并快速出圖呢?今日,高通的一則 Demo 視頻演示了:安卓手機(jī)端使用 Stable Diffusion 實(shí)現(xiàn)了最快本地 AI 圖像生成。
在如下 Demo 視頻中,Stable Diffusion v1.5 在不到 15 秒的時(shí)間內(nèi)生成分辨率 512x512 的圖像。高通雖然沒(méi)有明確說(shuō)明是哪款手機(jī),但表示該手機(jī)搭載了最新的驍龍 8 Gen2 旗艦芯片組。通過(guò)在軟件層面進(jìn)行各種自定義優(yōu)化,使得 Stable Diffusion 以最佳方式實(shí)現(xiàn)了運(yùn)行。
高通在其測(cè)試設(shè)備上生成的一些示例圖像如下所示,如「穿著盔甲的、超級(jí)可愛(ài)的、毛茸茸的貓武士」。
在智能手機(jī)端以如此快的速度運(yùn)行 Stable Diffusion,這要?dú)w功于高通的全棧 AI 優(yōu)化方案。該方案顯著降低了運(yùn)行時(shí)延遲和能耗,最終實(shí)現(xiàn) Stable Diffusion 安全高效的運(yùn)行。
其實(shí),在高通發(fā)布 Demo 視頻之前,已經(jīng)有開(kāi)發(fā)者展示了在搭載高通驍龍 865 的 8G RAM 索尼 Xperia 5 II 上運(yùn)行 Stable Diffusion。這位開(kāi)發(fā)者名為 Ivon Huang,其博客中詳細(xì)介紹了相關(guān)教程。不過(guò),生成一張分辨率 512x512 的圖像需要 1 個(gè)小時(shí)。與之相比,高通出圖的速度實(shí)現(xiàn)了巨大的提升。
博客地址:
?https://ivonblog.com/en-us/posts/android-stable-diffusion/?