OpenAI內(nèi)測(cè)Sora圖像生成器,代號(hào)「papaya」,DALL-E 4即將推出?
一則非常重要的消息:除了已有的視頻生成功能,OpenAI 似乎還在為 Sora 推出圖像生成功能做準(zhǔn)備。
OpenAI 正在內(nèi)部測(cè)試這些圖像生成功能:包括一個(gè)新的隱藏切換按鈕,能允許用戶在提示欄中直接在視頻和圖像生成之間切換。如果切換到圖像,提示欄的描述會(huì)提示你描述一幅圖像。

OpenAI 還對(duì) Sora 的視頻推送進(jìn)行了改版,將其分為「Best」和「Top」兩個(gè)類別?!窧est」很可能與目前的特色頻道類似。不過(guò),「Top」類別可能允許按某個(gè)時(shí)間段進(jìn)行篩選,并可能根據(jù)點(diǎn)贊數(shù)或其他標(biāo)準(zhǔn)對(duì)視頻進(jìn)行排名。
OpenAI 的這個(gè)動(dòng)作讓很多人重新興奮起來(lái),因?yàn)楝F(xiàn)有的 DALL-E 3 已經(jīng)非常過(guò)時(shí)了 —— 至少和 Midjourney 比起來(lái)是這樣。

該功能目前還未投入使用,但左側(cè)導(dǎo)航欄上還有一個(gè)「Images Internal」類別。目前,它打開的是視頻推送。不過(guò),將來(lái)用戶也有可能在這里找到圖片推送。目前還不清楚 OpenAI 將添加何種圖像生成功能,也不清楚將由哪款模型提供。
有人猜測(cè)我們可能會(huì)「在某個(gè)時(shí)候看到 DALL-E 4」,但 OpenAI 官方?jīng)]有對(duì)此進(jìn)行確認(rèn)。

但 Sora 中的圖像生成模型應(yīng)該不是 DALL-E 4。OpenAI 在去年首次發(fā)布 Sora 時(shí)就提到了圖像生成功能,所以一種可能是:它將由現(xiàn)有的「sora-turbo」模型驅(qū)動(dòng)。

此外,有人突然想起:我們還沒(méi)有在 ChatGPT 上看到來(lái)自 GPT-4o 的多模態(tài)圖像生成功能。

還有消息說(shuō),Sora 中的文本到圖像生成器代號(hào)為「papaya」:

回想起來(lái),OpenAI 發(fā)布 DALL-E 3 距今也有一年半了,下一代模型會(huì)有怎樣的創(chuàng)新?你有何期待?
參考鏈接:https://x.com/testingcatalog/status/1888256244063838527















 
 
 

















 
 
 
 