偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

全球AI視頻大戰(zhàn)升級(jí)!「中國版Sora」Vidu Q2參考生月底發(fā)布,能力對(duì)標(biāo)Sora 2

人工智能
三天登頂美區(qū)App Store,Sora 2用「Cameo客串」再造狂潮;可別忘了,更早提出「Reference參考生」的國產(chǎn)AI視頻Vidu也即將在本月底升級(jí)Vidu Q2參考生功能。在一致性、運(yùn)鏡理解、動(dòng)作連貫三大維度上,看看誰才是下一代AI視頻的領(lǐng)航者?

OpenAI再掀全球狂歡,Sora 2三天登頂美區(qū)App Store,再造一個(gè)ChatGPT時(shí)刻。

用戶只需要輸入文字提示,Sora就能生成幾乎任何你能想象到的視頻片段。

特別是,Sora 2 Cameo功能讓奧特曼客串各種梗圖,全網(wǎng)徹底玩瘋了奧特曼。

圖片圖片

圖片圖片

圖片圖片

奧特曼表示雖然信息流里出現(xiàn)的自己的梗圖,沒想象中奇怪,但仍有些迷惑。

圖片圖片

盡管看起來這場(chǎng)讓國外狂歡的盛宴來得突然,實(shí)際上類似Sora 2 Cameo功能,則在國內(nèi)并不鮮見,以中國版「Sora」Vidu為例,作為全球「參考生」功能概念的首個(gè)提出者,它與Cameo如出一轍。

幾乎同時(shí),Vidu也被曝「參考生視頻」功能,將在本月底迎來Q2版本的重大更新。

不過,該功能目前仍處于保密內(nèi)測(cè)階段。基于拿到的第一手內(nèi)測(cè),我們嘗試進(jìn)行同樣內(nèi)容制作,比如,參考奧特曼形象,Vidu Q2可生成奧特曼在工業(yè)風(fēng)閣樓中作畫的場(chǎng)景——

此前,Vidu AI在Vidu Q2圖生視頻發(fā)布時(shí)表示,新版本將AI視頻帶入了下個(gè)階段——不僅生成視頻,還能生成演技。

AI演戲時(shí)代已開啟:表情更豐富,運(yùn)鏡更靈活,速度更快,理解更深入。

圖片

相比前一代,Vidu Q2圖生視頻已全球上線,在時(shí)長選擇、鏡頭語言和語義理解上取得了明顯提升。

而這一次的Vidu Q2「參考生視頻」不僅是功能的迭代,更預(yù)示著在下一代AI視頻生成路徑上,全球已全面展開正面交鋒。

Vidu:推動(dòng)「視頻生成」走向「演技生成」時(shí)代到來

先看一下Vidu Q2在官方示例上的表現(xiàn):

圖片圖片

圖片圖片

圖片圖片

據(jù)悉,Vidu Q2參考生視頻與圖生視頻一樣,將在價(jià)格、時(shí)長選擇、鏡頭語言支持和語義理解給予用戶更多選擇。

內(nèi)測(cè)發(fā)現(xiàn),Vidu Q2 參考生視頻支持2-8秒不同時(shí)長自由選擇、支持1080p高清晰度、3種寬高比。

圖片圖片

我們先看一下為什么說Vidu才是讓奧特曼火出圈的「Cameo客串」功能的開創(chuàng)者,為什么說Vidu在類似功能「Reference參考生」上比OpenAI領(lǐng)先。

Vidu:參考生視頻領(lǐng)先OpenAI

「參考生視頻」并不是Vidu Q2推出的新功能,早在去年9月Vidu 1.0版本就已推出,而且Vidu是全球最早推出參考生視頻功能的,并首個(gè)做到支持7個(gè)主體參考。

簡單而言,「參考生視頻」是引用角色、道具、場(chǎng)景等更多素材內(nèi)容來生成視頻,從而更好地控制生成效果,而且直接從素材到視頻,省去了中間的分鏡腳本制作環(huán)節(jié)。

視頻為Vidu Q1參考生視頻的功能展示

此外,Vidu 的「參考生視頻」起步更早,覆蓋范疇也更廣。

所謂的Sora 2 Cameo其實(shí)是類似于Vidu 參考生功能——

均可用「@」調(diào)用不同形象,并基于所選形象進(jìn)行二次創(chuàng)作。

圖片圖片

從行業(yè)角度看,Sora 2 Cameo就是一種「參考人物生成視頻」的形式。

Vidu最多同時(shí)參考7張圖片,而且萬物皆可參考。

相比Vidu Q2,Sora 2有明顯的局限:目前不支持對(duì)物體進(jìn)行@調(diào)用;當(dāng)直接上傳物體圖片作為參考時(shí),最多僅能參考一個(gè)物體;最多支持三個(gè)人物客串演出。

而且Vidu不僅是引用角色,更是引用一切素材(道具、場(chǎng)景、物體等) 來生成視頻,為創(chuàng)作者提供了更高的自由度和控制力,同時(shí)Vidu還可以最多支持7張參考圖片,可以是7個(gè)角色,也可以是人物、道具、場(chǎng)景等的不同排列組合。

在Vidu中上傳圖片并添加描述即可創(chuàng)建「主體」,之后在主體庫中勾選;或直接在提示詞輸入框中輸入@上傳的圖片素材即可。

此外,還可以在Vidu首頁「主體」廣場(chǎng)中使用其他用戶投稿的公開主體,例如可以直接使用網(wǎng)友「caelum mo」投稿的小男孩主體。這種用戶間主體庫的分享不僅降低了用戶的使用門檻,而且更具互動(dòng)社交屬性,可玩性更高。

圖片圖片

為了提升主體的一致性,上傳圖片時(shí),可上傳三視圖(正面、側(cè)面、背面)到【主體庫】,也可上傳多角度圖片,或者立體感的圖片;而提示詞描述可以直接打開提示詞框下面的【專業(yè)模式】,讓AI直接將你的自然語言轉(zhuǎn)換為更準(zhǔn)確的提示詞描述,提升識(shí)別準(zhǔn)確性。

比如,「星辰研究所-微BT_buding」投稿的「黑暗巨龍飛行狀態(tài)」,上傳了三張不同角度的圖片。

圖片圖片

基于此主體,制作的「飛龍?jiān)谔臁挂曨l:

圖片圖片

除了人物等角色之外,創(chuàng)作者冰皓利用主體,一鍵復(fù)制特效:

據(jù)透露,本月底Vidu的「參考生視頻」迎來更新,一致性更好,價(jià)格更優(yōu)惠,速度更快,依舊全球領(lǐng)先。

核心技術(shù)指標(biāo)正面PK:誰更勝一籌

OpenAI的Sora 2的確有不少亮點(diǎn),比如:

可自動(dòng)補(bǔ)充大量不同分鏡;實(shí)現(xiàn)了音視頻直出,并且可以控制語音內(nèi)容;

在核心技術(shù)指標(biāo),比如一致性、語義理解、動(dòng)作自然度上,Vidu相對(duì)優(yōu)勢(shì)更大。

讓我們一睹這兩大AI視頻工具在多項(xiàng)技術(shù)上的正面交鋒吧!

一致性:Vidu生成內(nèi)容更可控

從內(nèi)測(cè)效果來看,一致性方面,Vidu Q2參考生比Sora 2表現(xiàn)更佳。

先請(qǐng)奧特曼客串一下。下面的案例中,Sora 2直接改變了皇冠的樣式,而Vidu Q2則能完全保持皇冠的細(xì)節(jié)特點(diǎn)。

Prompt:@Sam 介紹 @皇冠

圖片圖片

圖片圖片

圖片圖片

沒用@cameo功能時(shí),Sora2圖生視頻里的人臉一致性明顯較差。Sora2用了@引用功能時(shí),一致性依舊略差于Vidu。

案例2中,輸入圖片:

圖片圖片

Prompt:女孩閉上眼睛,身后的云朵飛舞,發(fā)出金光

圖片圖片

語義理解:Sora 2對(duì)于運(yùn)鏡理解一般

綜合而言,Sora 2與Vidu Q2在語義理解能力上差不多,多數(shù)提示詞都能正確理解。

但一些常見的內(nèi)容, Sora 2卻無法正確理解。

例如,下列提示詞Vidu Q2處理的直升飛機(jī)較好,而Sora 2遜色不少。

圖片圖片

圖片圖片

Prompt: 海面上空環(huán)繞著數(shù)十架直升機(jī),遠(yuǎn)景

實(shí)際上,在運(yùn)鏡理解方面,Sora 2表現(xiàn)并不穩(wěn)定,多數(shù)案例下都沒能正確理解運(yùn)鏡指令。

比如,鏡頭右移,Vidu Q2(下圖左)完全無壓力,而Sora 2卻并沒有理解鏡頭右移的意思。

Prompt: 鏡頭右移

Vidu Q2 參考生

Sora 2Sora 2

鏡頭拉遠(yuǎn)同樣如此:

Vidu Q2 參考生Vidu Q2 參考生

Sora 2Sora 2

Prompt:行進(jìn)中的列車?yán)?,右邊的男人回頭向后看,鏡頭拉遠(yuǎn)

動(dòng)態(tài)自然度:Vidu更連貫

相對(duì)而言,大部分情況下Vidu Q2生成的視頻動(dòng)作比Sora 2更加連貫。

例如,水晶酒杯掉地板,突然爆裂的瞬間的視頻中,Sora 2生成的動(dòng)作連貫性不如Vidu Q2。

圖片圖片

圖片圖片

在舞蹈房內(nèi),Sora 2生成的視頻跳到一半靜止了,而Vidu Q2生成的視頻(下圖左)則流暢許多。

圖片圖片

圖片圖片

Prompt: 四周都是鏡子的舞蹈房內(nèi),女生牽著男生的手優(yōu)雅旋轉(zhuǎn)翩翩起舞,動(dòng)作流暢一致,衣裙隨舞步輕盈擺動(dòng),鏡面反射出舞蹈全景,鏡頭緩慢環(huán)繞捕捉舞蹈細(xì)節(jié)。

Sora 2經(jīng)常會(huì)出現(xiàn)畫面內(nèi)元素靜止、不動(dòng)的bug。

對(duì)下列演唱會(huì)場(chǎng)景的視頻中,Vidu Q2生成的視頻比較流暢,而Sora 2生成的視頻有點(diǎn)像PPT。

圖片圖片

圖片圖片

Prompt:激動(dòng)得滿臉通紅,眼睛瞪得極大,雙手捂住臉,不敢相信,隨后又瘋狂地?fù)]舞手中的熒光棒。

特效畫面中,Vidu Q2生成的巨龍?jiān)诳罩袊娀?,特效非常真?shí),相比之下Sora 2生成的視頻只有火在動(dòng),不夠流暢自然。

圖片圖片

圖片圖片

Prompt:特寫鏡頭緊緊聚焦在一條龍的下顎上。熱氣明顯地扭曲了周圍的空氣,它的喉嚨開始發(fā)出強(qiáng)烈的鈷藍(lán)色光芒。它呼氣,一股閃爍著、富含粒子的藍(lán)色火焰集中噴射而出,填滿了整個(gè)畫面。鏡頭跟隨火焰,看著它猛擊在一座城堡墻壁粗糙、風(fēng)化的石頭上。我們看到石頭在熱沖擊下瞬間裂開,閃爍的藍(lán)色能量在裂縫中飛速蔓延。石頭表面起泡、爆裂,變成濃稠、黏滯的巖漿,像糖漿般沉甸甸地滴落下來。那聲音是噴氣發(fā)動(dòng)機(jī)的轟鳴聲與巖石熔化成液體時(shí)的嘶嘶聲和爆裂聲的恐怖混合。

在另一個(gè)真實(shí)案例中,面對(duì)一個(gè)流水的水龍頭,Sora 的鏡頭從水流特寫快速切換至水管開關(guān),并以一個(gè)短暫的靜止畫面作結(jié)。

而Vidu Q2則采用了更為平穩(wěn)的運(yùn)鏡,讓鏡頭徐徐拉進(jìn),整體觀感更為貼近日常,顯得十分自然。

圖片圖片

圖片圖片

Prompt:水管里水在流動(dòng),鏡頭推進(jìn)對(duì)焦到水管開關(guān)上

同時(shí),Sora表情、微動(dòng)態(tài)不如Vidu層次豐富,Vidu更能滿足對(duì)于表情演繹有較高要求的影視、動(dòng)漫行業(yè)的需求。

圖片圖片

圖片圖片

Prompt:二維扁平動(dòng)畫風(fēng)格,主角神色慌張,嘴中冒出冷氣,同時(shí)回頭張望,看向鏡頭后朝鏡頭方向跑出畫面

最后,看一下Vidu生成的豐富表情和微動(dòng)態(tài)在動(dòng)漫行業(yè)的應(yīng)用,表情變化層次豐富,非常自然。

Prompt: 過山車在軌道上飛馳,情侶坐在第一排,女生緊緊抓住安全桿,男生試圖轉(zhuǎn)頭看她卻被慣性甩回;鏡頭切換到兩人的面部特寫,女生張大嘴巴尖叫,眼淚被風(fēng)吹得貼在臉頰,男生則笑著大喊,牙齒咬得緊緊的,雙手比出勝利的手勢(shì)。

創(chuàng)作者也開始將Vidu Q2「參考生」功能玩出了花。國內(nèi)創(chuàng)作者@陳暢用Vidu Q2「參考生」功能做了一個(gè)非常驚艷的短片:細(xì)節(jié)豐富、運(yùn)鏡流暢,完成度非常高。

就連鋼鐵俠本尊,也有了全新戰(zhàn)甲。

參考圖:

圖1;圖2圖1;圖2

生成的視頻:

圖片圖片

提示詞:

[@圖1][@圖2]

圖1機(jī)器盔甲和圖2的人一樣大,圖1貼合在它里面的圖2的人

圖1機(jī)器盔甲機(jī)甲外形保持不變,頭盔掀起露出圖2人的臉

胸甲從中間收縮打開露出人的上半身

手臂部機(jī)甲從手臂中間收縮打開露出人的手臂

腿部機(jī)甲從腿部中間收縮打開露出人的腿

除了打開的部分,機(jī)甲其他部分保持連接在一起不斷開,機(jī)甲后背不變

圖2人物的手臂從機(jī)甲手臂里出來,腿從機(jī)甲的腿出來,人物整體從機(jī)甲里面走出來

鏡頭全景

所有變形都通過機(jī)械傳動(dòng)裝置

有創(chuàng)作者還讓黑暗游俠NPC出場(chǎng),Vidu Q2直出視頻,三個(gè)鏡頭流暢連貫,令人驚嘆。

將主角三視圖輸入到Vidu參考生功能的主體庫中:

正面;側(cè)面;近照側(cè)面正面;側(cè)面;近照側(cè)面

生成的視頻:

Prompt:

[@黑暗游俠]

0-1s鏡頭1,頭發(fā)飄揚(yáng),拉開弓,超近特寫,背景是黑暗森林閃著奇幻的光,箭射出去。切鏡頭

1-6s鏡頭2,黑暗游拿著弓在黑暗森林里快速跑動(dòng)跳躍,鏡頭自由跟隨,特寫全身自由切換,在樹林中穿梭,急速大幅度不斷跳躍,閃爍。切鏡頭

6-8s鏡頭3,一個(gè)旋轉(zhuǎn)鏡頭環(huán)繞人臉慢動(dòng)作特寫,露出邪魅的笑容

月底突襲,Sora 2真正挑戰(zhàn)者來了

如今,AI視頻生成領(lǐng)域,已成為科技巨頭們「打得不可開交」的又一大主戰(zhàn)場(chǎng)。

谷歌Veo 3、OpenAI Sora 2,以及馬斯克xAI最新放出的Imagine v0.9,均在音畫同步、人物一致性等方面,掀起一波又一波的創(chuàng)新狂潮。

圖片圖片

圖片圖片

圖片圖片

反觀國內(nèi),以Vidu、Wan2.5、Kling AI等自主研發(fā)的模型強(qiáng)勢(shì)出擊,不僅在技術(shù)指標(biāo)上緊咬對(duì)手,更在開放性、成本控制、應(yīng)用普惠上實(shí)現(xiàn)彎道超車。

就在本月底,Vidu Q2將重新定義「參考生視頻」,該功能模型即將迎來一次重大升級(jí)。

這無疑是2025年視頻生成領(lǐng)域,最值得期待的更新之一。

憑借更高的創(chuàng)作自由度、更精細(xì)的控制力、更豐富的應(yīng)用,Vidu在表情變化、推拉運(yùn)鏡、生成速度,語義理解,視頻延長方面取得突破性進(jìn)展。

這場(chǎng)逆襲,再次證明了國產(chǎn)AI的全球競(jìng)爭力——從跟跑走向領(lǐng)跑,正重塑AI版圖。

這一次,我們將見證全球視頻AI「大戰(zhàn)」的下一個(gè)關(guān)鍵節(jié)點(diǎn)。

讓我們拭目以待。

責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2024-02-22 07:29:31

OpenAIKarpathy分詞器

2024-02-28 16:14:28

2024-07-31 10:44:54

2012-08-01 14:32:15

2013-09-18 10:23:41

HPC低端業(yè)務(wù)高性能計(jì)算

2024-02-29 15:39:00

AI研究算力

2024-09-25 15:00:25

2011-08-12 10:20:12

IDC數(shù)據(jù)中心

2025-06-03 13:26:52

Sora視頻OpenAI

2021-08-18 17:40:14

騰訊云視頻云

2009-07-28 19:21:57

Intel六核處理器

2020-08-10 14:17:41

搜狗2

2024-12-18 07:15:00

2013-09-09 09:46:10

浪潮服務(wù)器

2024-03-22 13:05:23

數(shù)據(jù)訓(xùn)練

2024-02-19 09:10:46

OpenAISora功能

2012-08-29 10:28:25

91無線移動(dòng)應(yīng)用發(fā)展趨勢(shì)報(bào)告

2024-02-23 15:53:13

OpenAISora人工智能

2009-02-09 09:20:57

Q2財(cái)報(bào)09財(cái)年Sun

2012-04-17 10:58:37

麗訊投影機(jī)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)