偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

谷歌版Sora升級(jí)4K高清!一句話(huà)控制鏡頭運(yùn)動(dòng),跑分叫板可靈海螺

人工智能 新聞
除了顯而易見(jiàn)的清晰度的提升——最高可達(dá)4K分辨率,它能夠忠實(shí)地遵循簡(jiǎn)單和復(fù)雜的指令Prompt,并令人信服地模擬現(xiàn)實(shí)世界的物理以及各種視覺(jué)風(fēng)格。

OpenAI直播劃水的一天,谷歌版Sora迎來(lái)了它的2.0——

Veo 2,根據(jù)文本或圖像生成更為高質(zhì)量的視頻。

從官方介紹中看,此次主要有三個(gè)方面的升級(jí)。

比如分辨率能達(dá)到4K。

能夠理解有關(guān)鏡頭控制的Prompt。

更注重現(xiàn)實(shí)物理世界與人類(lèi)表情的理解和展示。

在官方賬號(hào)底下,大家都對(duì)這些效果表示了驚嘆:

我真的想谷歌輸?shù)舯荣?,但是谷歌沒(méi)有輸。

圖片

另外,圖像生成模型Imagen 3也有進(jìn)一步的改進(jìn)。

圖片

谷歌版Sora2.0:重新定義質(zhì)量和控制

質(zhì)量和控制,是此次視頻模型升級(jí)的關(guān)鍵詞。

除了顯而易見(jiàn)的清晰度的提升——最高可達(dá)4K分辨率,它能夠忠實(shí)地遵循簡(jiǎn)單和復(fù)雜的指令Prompt,并令人信服地模擬現(xiàn)實(shí)世界的物理以及各種視覺(jué)風(fēng)格。

具體體現(xiàn)在它的真實(shí)感和保真度上,比如細(xì)節(jié)、偽影減少等方面都有顯著改進(jìn)。

還有高級(jí)的運(yùn)動(dòng)功能,基于對(duì)物理學(xué)的理解,能夠更高精度的表示運(yùn)動(dòng)。

還能準(zhǔn)確地遵循各種鏡頭控制類(lèi)的Prompt,比如拍攝風(fēng)格、角度、動(dòng)作以及所有這些的組合。

那么接下來(lái)直觀地感受一下效果。

Prompt:特寫(xiě)鏡頭聚焦于一位女 DJ 的臉部,她美麗、濃密的黑色卷發(fā)勾勒出她的五官,她完全沉浸在音樂(lè)中。她閉上雙眼,沉浸在節(jié)奏中,嘴角掛著一絲微笑。當(dāng)她隨著節(jié)拍點(diǎn)頭和搖擺時(shí),相機(jī)捕捉到了她頭部的細(xì)微動(dòng)作,她的身體本能地隨著耳機(jī)中傳出的音樂(lè)而做出反應(yīng),傳到人群中。淺景深使背景變得模糊。她被鮮艷的霓虹色包圍著。特寫(xiě)鏡頭強(qiáng)調(diào)了她迷人的氣質(zhì)以及音樂(lè)傳遞和超越的力量。

還有是這種集體的蜂群也能刻畫(huà)出來(lái)。

Prompt:鏡頭輕輕飄過(guò)一排排粉刷過(guò)的木制蜂箱,嗡嗡作響的蜜蜂在畫(huà)面中進(jìn)進(jìn)出出。鏡頭落在站在畫(huà)面中央的優(yōu)雅農(nóng)民身上,他潔白的養(yǎng)蜂服在金色的午后陽(yáng)光下閃閃發(fā)光。他舉起一罐蜂蜜,稍微傾斜以捕捉光線(xiàn)。在他身后,高大的向日葵在微風(fēng)中有節(jié)奏地?fù)u曳,花瓣在溫暖的陽(yáng)光下閃閃發(fā)光。鏡頭向上傾斜,露出一座復(fù)古的農(nóng)舍,百葉窗是薄荷綠色的,搖曳的樹(shù)木在墻上投下斑駁的陰影。用 35 毫米鏡頭在柯達(dá) Portra 400 膠片上拍攝,金色的光線(xiàn)在農(nóng)民的手套、果醬罐和蜂箱的風(fēng)化木材上形成了豐富的紋理。

還可以切換鏡頭,從近景到遠(yuǎn)景,而在鏡頭之下,不管是蜂蜜還是咖啡的泡沫細(xì)節(jié)都有精確地刻畫(huà)。

Prompt:太陽(yáng)在一盤(pán)擺放整齊的早餐場(chǎng)景后緩緩升起。濃稠的金色楓糖漿以慢動(dòng)作倒在松軟的煎餅上,每一塊煎餅都散發(fā)出柔軟溫暖的蒸汽云。特寫(xiě)鏡頭中,脆培根發(fā)出嘶嘶聲,金色油脂的細(xì)小余燼在空中飛舞。咖啡以順滑的旋轉(zhuǎn)動(dòng)作倒入水晶般透明的杯子中,杯子里充滿(mǎn)了深棕色的咖啡油層。場(chǎng)景結(jié)束時(shí),相機(jī)俯沖到新鮮切好的橙子上,以令人驚嘆的微距細(xì)節(jié)展示出它明亮多汁的果肉。

那么在根據(jù)人類(lèi)對(duì)其性能的評(píng)估中,Veo 2 的表現(xiàn)優(yōu)于其他領(lǐng)先的視頻生成模型

在Meta基準(zhǔn)數(shù)據(jù)集 MovieGenBench上,人類(lèi)參與者觀看了1003個(gè)提示和響應(yīng)的視頻。

結(jié)果顯示,跟市面上的主流視頻生成模型相比,Veo2.0在整體偏好、Prompt指令準(zhǔn)確遵循方面都表現(xiàn)最佳。

值得一提的是,這里除了Sora,國(guó)產(chǎn)模型可靈、MiniMax都上桌了。

圖片

所有的比較都在720P分辨率下進(jìn)行,Veo 采樣時(shí)長(zhǎng)為 8 秒,VideoGen 采樣時(shí)長(zhǎng)為 10 秒,其他型號(hào)采樣時(shí)長(zhǎng)為 5 秒。我們向評(píng)分者展示完整視頻時(shí)長(zhǎng)。

圖片

最后,他們表示,創(chuàng)建逼真、動(dòng)態(tài)或復(fù)雜的視頻,并在復(fù)雜場(chǎng)景或復(fù)雜運(yùn)動(dòng)的場(chǎng)景中保持完全一致性仍然是一項(xiàng)挑戰(zhàn)。他們將繼續(xù)開(kāi)發(fā)和改進(jìn)這些領(lǐng)域的性能。

圖像模型Imagen 3也增強(qiáng)了

除此之外,還增強(qiáng)了他們的圖像生成模型Imagen 3。

可以生成更多樣化的藝術(shù)風(fēng)格,如現(xiàn)實(shí)主義、夢(mèng)幻、肖像畫(huà)等等。

圖片
圖片

生成的圖像會(huì)更忠實(shí)于Prompt,哪怕這個(gè)Prompt有多么地離譜。(Doge)

圖片

而從各種生成的圖像來(lái)看,視覺(jué)效果也比之前更明亮,構(gòu)圖也更加平衡。

圖片

好了,感興趣的朋友可戳下方鏈接了解更多詳情。

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2015-08-03 10:21:04

設(shè)計(jì)模式表達(dá)

2020-11-27 09:57:11

Python代碼PyPy

2023-09-05 23:34:52

Kubernetes云原生

2025-03-19 13:12:14

2023-09-06 15:23:30

Docker容器K8S

2024-02-08 09:33:37

蘋(píng)果AI

2023-11-03 11:03:10

AIGen-2

2010-03-29 11:55:12

無(wú)線(xiàn)上網(wǎng)報(bào)錯(cuò)

2023-05-08 15:44:23

3D數(shù)字人

2019-03-27 09:31:36

互聯(lián)網(wǎng)面試技術(shù)

2014-05-07 10:47:51

移動(dòng)金融互聯(lián)網(wǎng)金融GMIC

2020-12-16 10:43:44

PythonPyPy代碼

2018-01-15 10:45:43

社交網(wǎng)絡(luò)互聯(lián)網(wǎng)巨頭百度

2019-08-15 11:42:56

程序員電腦軟件

2023-02-10 15:45:05

ChatGPTAIGPT-3

2023-05-12 14:13:23

3D建模OpenAI

2014-12-16 08:58:17

甲骨文Oracle數(shù)據(jù)庫(kù)選件

2023-12-13 21:50:59

騰訊AI模型

2025-05-12 01:22:00

2011-06-03 16:42:47

SEO
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)