偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<kbd id="mqjqz"></kbd>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線(xiàn)教育平臺(tái)

字節(jié)屠榜！最強(qiáng)多模態(tài)大模型發(fā)布：20 B參數(shù)橫掃38項(xiàng)第一！

算家計(jì)算

發(fā)布于 2025-5-14 19:23

瀏覽

0收藏

5月13日，火山引擎FORCE LINK AI創(chuàng)新巡展上，Seed團(tuán)隊(duì)推出的視覺(jué)-語(yǔ)言多模態(tài)大模型Seed1.5-VL，以?xún)H20B激活參數(shù)的架構(gòu)，橫掃60個(gè)評(píng)測(cè)基準(zhǔn)中的38項(xiàng)SOTA，在視頻理解、GUI智能體等關(guān)鍵指標(biāo)上直接叫板谷歌Gemini 2.5 Pro，而推理成本僅為對(duì)方的1/3。

字節(jié)屠榜！最強(qiáng)多模態(tài)大模型發(fā)布：20 B參數(shù)橫掃38項(xiàng)第一！ -AI.x社區(qū)

Seed1.5-VL的顛覆性首先體現(xiàn)在全能戰(zhàn)士般的多模態(tài)理解力。上傳一張畫(huà)作，它能全面分析畫(huà)面元素，自動(dòng)識(shí)別出作品的作者、藝術(shù)風(fēng)格、畫(huà)面元素、思想內(nèi)涵等。

面對(duì)包含多個(gè)人物的圖片，Seed1.5-VL 能精準(zhǔn)識(shí)別觀(guān)眾、棒球、座椅、圍欄等畫(huà)面元素，并給出正確坐標(biāo)；

而在視頻理解領(lǐng)域，Seed1.5-VL則展現(xiàn)出偵探般的敏銳度。
輸入一段監(jiān)控視頻詢(xún)問(wèn)「小貓今天干了哪些壞事」，它能快速標(biāo)記出抓撓沙發(fā)、打翻水杯等現(xiàn)場(chǎng)，并生成帶時(shí)間戳的“案情報(bào)告”。

而Seed1.5-VL的殺手锏多模態(tài)智能體功能，可以讓AI能像人類(lèi)一樣操作PC界面：在測(cè)試中成功完成點(diǎn)擊點(diǎn)贊按鈕、填寫(xiě)表單等GUI交互任務(wù)，可以為自動(dòng)化測(cè)試、智能客服等場(chǎng)景打開(kāi)新的可能。

Seed1.5-VL采用三件套設(shè)計(jì)：
532M參數(shù)的SeedViT視覺(jué)編碼器處理任意比例圖像，MLP適配器對(duì)齊多模態(tài)表征；
20B參數(shù)的MoE架構(gòu)語(yǔ)言模型專(zhuān)注復(fù)雜推理。這種模塊化組合既保證性能，又將推理成本壓至每千token輸入0.003元，輸出僅0.009元，比同類(lèi)模型降低67%；
訓(xùn)練策略上獨(dú)創(chuàng)漸進(jìn)式解鎖：先凍結(jié)視覺(jué)編碼器訓(xùn)練MLP對(duì)齊特征，再解凍所有參數(shù)進(jìn)行大規(guī)模預(yù)訓(xùn)練，最后引入強(qiáng)化學(xué)習(xí)優(yōu)化長(zhǎng)鏈推理。

這種精細(xì)調(diào)優(yōu)，讓模型在3T token的多模態(tài)數(shù)據(jù)中提煉出了極致效率。

據(jù)透露，該模型已開(kāi)始在抖音內(nèi)容審核、飛書(shū)智能助手等場(chǎng)景試點(diǎn)，預(yù)計(jì)半年內(nèi)接入全線(xiàn)產(chǎn)品。

標(biāo)簽

字節(jié)多模態(tài)大模型

租算力，到算家云

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

抱抱臉團(tuán)隊(duì)（HF）發(fā)布多模態(tài)大模型Idefics2，8B參數(shù)

AIGC最前線(xiàn) ? 3935瀏覽 ? 0回復(fù)
大模型參數(shù)量都是7B，13B和65B等背后的原因是什么？

Syrupup ? 1.3w瀏覽 ? 0回復(fù)
字節(jié)豆包、武大提出 CAL：通過(guò)視覺(jué)相關(guān)的 token 增強(qiáng)多模態(tài)對(duì)齊效果

輕薄滴假象 ? 3011瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)發(fā)布統(tǒng)一多模態(tài)大模型 Show-o!

AI論文解讀 ? 4642瀏覽 ? 0回復(fù)
Aria: 第一個(gè)多模態(tài)MoE | Pixtral 12B | AI教學(xué)新突破：DataEnvGym讓模型自我進(jìn)化

sbf_2000 ? 2627瀏覽 ? 0回復(fù)
超GPT-4o，1240億參數(shù)！最強(qiáng)開(kāi)源多模態(tài)模型 Pixtral Large！

Aceryt ? 2622瀏覽 ? 0回復(fù)
Pixtral Large：124B的最強(qiáng)開(kāi)源多模態(tài)大模型

kede96 ? 3269瀏覽 ? 0回復(fù)
微軟 Phi-4 震撼發(fā)布：14B 參數(shù)模型性能超越一眾大模型，數(shù)學(xué)推理性能提升顯著

Syrupup ? 3104瀏覽 ? 0回復(fù)
微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

Aceryt ? 2344瀏覽 ? 0回復(fù)
Hugging Face 發(fā)布 SmolVLM：用于設(shè)備端推理的 2B 參數(shù)視覺(jué)語(yǔ)言模型

Halo咯咯 ? 3087瀏覽 ? 0回復(fù)
Infinigence AI 發(fā)布 Megrez-3B-Omni：3B 設(shè)備上開(kāi)源多模態(tài)大語(yǔ)言模型 MLLM

Halo咯咯 ? 2492瀏覽 ? 0回復(fù)
參數(shù)減少99.5%，媲美全精度FLUX！字節(jié)跳動(dòng)等發(fā)布首個(gè)1.58-bit FLUX量化模型

angel ? 3252瀏覽 ? 0回復(fù)
OpenBMB 剛剛發(fā)布 MiniCPM-o 2.6：新的 8B 參數(shù)、Any-to-Any 多模態(tài)模型

Halo咯咯 ? 4392瀏覽 ? 0回復(fù)
世界第一位AI程序員Devin：20項(xiàng)任務(wù)只完成了3項(xiàng)！14項(xiàng)任務(wù)徹底失敗！

51CTO技術(shù)棧 ? 2100瀏覽 ? 0回復(fù)
GIFNet實(shí)現(xiàn)多模態(tài)融合通用模型，單一框架橫掃多任務(wù)場(chǎng)景

angel ? 7828瀏覽 ? 0回復(fù)
Mistral發(fā)布最強(qiáng)多模態(tài)文檔理解模型Mistral OCR！可免費(fèi)試用！

51CTO技術(shù)棧 ? 2566瀏覽 ? 0回復(fù)
地表最強(qiáng)，全面第一！可靈2.0多模態(tài)編輯震撼全場(chǎng)！開(kāi)辟視頻模型的“新語(yǔ)言”，Prompt的門(mén)檻被砍沒(méi)了！

51CTO技術(shù)棧 ? 2014瀏覽 ? 0回復(fù)
騰訊屠榜MTEB，嵌入模型告別BERT，擁抱LLM

CourseAI ? 1956瀏覽 ? 0回復(fù)
Seed1.5-VL 問(wèn)世：字節(jié)跳動(dòng)的視覺(jué)語(yǔ)言新突破，60項(xiàng)測(cè)試奪38冠

穿越時(shí)空111 ? 1418瀏覽 ? 0回復(fù)

算家計(jì)算

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

華人占AI半壁江山！全球AI頂尖人才榜揭曉，何愷明領(lǐng)銜多位華人科學(xué)家 14h前發(fā)布
智譜開(kāi)源多模態(tài)推理新王者！9B參數(shù)挑戰(zhàn)72B巨頭 1天前發(fā)布

熱門(mén)推薦

圖像編輯革命！FLUX.1 Kontext [dev]震撼開(kāi)源：挑戰(zhàn)GPT-4o的圖像編輯 0回復(fù)

國(guó)產(chǎn)視頻大模型霸榜全球！海螺02特效炸裂，好萊塢級(jí)大片10秒生成 0回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線(xiàn)性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

AI Agents開(kāi)源工具棧全解析~ 0回復(fù)

上一篇：席卷全球！世界首個(gè)設(shè)計(jì)Agent Lovart發(fā)布，對(duì)傳統(tǒng)設(shè)計(jì)行業(yè)將產(chǎn)生什么影響？

下一篇：中國(guó)醫(yī)療AI殺出黑馬！全球首個(gè)女性腫瘤 AI 大模型 “木蘭” 上線(xiàn)，手機(jī)端免費(fèi)用

社區(qū)精華內(nèi)容

目錄