偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

谷歌發(fā)布 Mirasol:30 億參數(shù),將多模態(tài)理解擴(kuò)展到長視頻

人工智能
谷歌公司近日發(fā)布新聞稿,介紹了小型人工智能模型 Mirasol,可以回答有關(guān)視頻的問題并創(chuàng)造新的記錄。

11 月 16 日消息,谷歌公司近日發(fā)布新聞稿,介紹了小型人工智能模型 Mirasol,可以回答有關(guān)視頻的問題并創(chuàng)造新的記錄。

AI 模型目前很難處理不同的數(shù)據(jù)流,如果要讓 AI 理解視頻,需要整合視頻、音頻和文本等不同模態(tài)的信息,這大大增加了難度。

谷歌和谷歌 Deepmind 的研究人員提出了新的方法,將多模態(tài)理解擴(kuò)展到長視頻領(lǐng)域。

借助 Mirasol AI 模型,該團(tuán)隊(duì)試圖解決兩個(gè)關(guān)鍵挑戰(zhàn):

  • 需要以高頻采樣同步視頻和音頻,但要異步處理標(biāo)題和視頻描述。
  • 視頻和音頻會(huì)生成大量數(shù)據(jù),這會(huì)讓模型的容量緊張。

谷歌在 Mirasol 中使用合路器(combiners)和自回歸轉(zhuǎn)換器(autoregressive transformer)模型。

該模型組件會(huì)處理時(shí)間同步的視頻和音頻信號(hào),然后再將視頻拆分為單獨(dú)的片段。

轉(zhuǎn)換器處理每個(gè)片段,并學(xué)習(xí)每個(gè)片段之間的聯(lián)系,然后使用另一個(gè)轉(zhuǎn)換器處理上下文文本,這兩個(gè)組件交換有關(guān)其各自輸入的信息。

名為 Combiner 的新穎轉(zhuǎn)換模塊從每個(gè)片段中提取通用表示,并通過降維來壓縮數(shù)據(jù)。每個(gè)段包含 4 到 64 幀,該模型當(dāng)前共有 30 億個(gè)參數(shù),可以處理 128 到 512 幀的視頻。

在測(cè)試中,Mirasol3B 在視頻問題分析方面達(dá)到了新的基準(zhǔn),體積明顯更小,并且可以處理更長的視頻。使用包含內(nèi)存的組合器變體,該團(tuán)隊(duì)可以將所需的計(jì)算能力進(jìn)一步降低 18%。

IT之家在此附上 Mirasol 的官方新聞稿,感興趣的用戶可以深入閱讀。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2023-07-07 09:55:23

互聯(lián)網(wǎng)論文

2013-02-21 09:41:49

CitusData數(shù)據(jù)庫Postgres

2024-01-23 12:57:00

模型數(shù)據(jù)

2023-05-24 09:36:43

模型架構(gòu)

2015-08-13 13:44:21

優(yōu)化多核

2009-11-12 15:30:44

2023-03-08 14:14:51

微軟ChatGPT

2009-11-12 15:19:54

2009-02-26 10:50:04

NetApp虛擬化VMware ESX

2022-03-23 16:28:18

微軟NVIDIAGPU

2017-05-26 23:09:47

2022-08-11 13:37:41

多模態(tài)算法多模態(tài)網(wǎng)絡(luò)

2009-02-25 16:50:00

2021-01-01 09:46:43

微軟Windows 10Windows

2022-11-10 08:02:41

GitOpsDevOpsKubernetes

2020-06-05 14:30:03

CephCPU 線程

2023-03-03 14:08:51

網(wǎng)絡(luò)安全首席信息安全官

2022-11-01 08:00:00

2023-04-17 07:39:58

2023-07-18 09:54:43

模型語言
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)