偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Llama 4 凌晨震撼發(fā)布:Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型,1000萬(wàn)上下文碾壓行業(yè)! 原創(chuàng)

發(fā)布于 2025-4-7 06:35
瀏覽
0收藏

就在4月6日凌晨,Meta 毫無(wú)預(yù)兆地發(fā)布了 Llama 4,這是其開(kāi)源大模型 Llama 系列的最新成員,也是迄今為止 最強(qiáng)的開(kāi)源多模態(tài)大模型!

此次發(fā)布的 Llama 4 系列包括 Scout、Maverick 和 Behemoth 三個(gè)版本,其中 Scout 和 Maverick 已開(kāi)放下載,而 Behemoth 仍在訓(xùn)練中,預(yù)計(jì)未來(lái)幾個(gè)月正式亮相。

Meta 首席執(zhí)行官 馬克·扎克伯格 在官方公告中激動(dòng)地表示:

“我們的目標(biāo)是打造世界領(lǐng)先的 AI,并將其開(kāi)源,讓全球受益。今天,Llama 4 讓這一愿景更進(jìn)一步!”

下載地址:  llama.com/llama-downloads

Llama 4 凌晨震撼發(fā)布:Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型,1000萬(wàn)上下文碾壓行業(yè)!-AI.x社區(qū)

三大版本解析

1. Llama 4 Scout(170億激活參數(shù),16專家)

  • 1000萬(wàn)token上下文窗口(行業(yè)最長(zhǎng)!相當(dāng)于15000頁(yè)文本)
  • 單張H100 GPU即可運(yùn)行(Int4量化后)
  • 專為長(zhǎng)文檔摘要、代碼庫(kù)推理優(yōu)化,性能超越Gemma 3、Gemini 2.0 Flash

2. Llama 4 Maverick(170億激活參數(shù),128專家)

  • 4000億總參數(shù),但僅激活170億(MoE架構(gòu)高效推理)
  • 競(jìng)技場(chǎng)(Arena)得分1417,超越DeepSeek V3,在編程、數(shù)學(xué)、創(chuàng)意寫作等任務(wù)中排名第一
  • 成本極低:推理僅需0.49/百萬(wàn)token,遠(yuǎn)低于GPT-4o($4.38/百萬(wàn)token)

3. Llama 4 Behemoth(2880億激活參數(shù),2萬(wàn)億總參數(shù))

  • 仍在訓(xùn)練中,但已超越GPT-4.5、Claude 3.7 Sonnet
  • 目標(biāo):全球最強(qiáng)AI模型,未來(lái)將作為“教師模型”指導(dǎo)Scout和Maverick


Llama 4 凌晨震撼發(fā)布:Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型,1000萬(wàn)上下文碾壓行業(yè)!-AI.x社區(qū)


技術(shù)突破

1. 首次采用MoE架構(gòu),計(jì)算效率飆升

Llama 4 是 Meta 首個(gè)混合專家(Mixture of Experts, MoE)模型,每個(gè) token 僅激活部分參數(shù),大幅降低計(jì)算成本。例如:

  • Maverick 有4000億參數(shù),但僅激活170億,可在單臺(tái)H100上運(yùn)行。

2. 原生多模態(tài),視覺(jué)理解能力一流

  • 早期融合技術(shù):文本、圖像、視頻統(tǒng)一訓(xùn)練,支持48張圖像輸入
  • 精準(zhǔn)圖像定位:可錨定圖像特定區(qū)域進(jìn)行問(wèn)答

3. 超長(zhǎng)上下文支持,1000萬(wàn)token創(chuàng)紀(jì)錄

  • Scout 支持1000萬(wàn)token,可處理20小時(shí)視頻或7500頁(yè)文檔
  • iRoPE架構(gòu):無(wú)位置嵌入+交錯(cuò)注意力層,增強(qiáng)長(zhǎng)文本泛化能力

4. 訓(xùn)練數(shù)據(jù)翻倍,多語(yǔ)言能力更強(qiáng)

  • 30萬(wàn)億token訓(xùn)練數(shù)據(jù)(Llama 3的兩倍)
  • 支持200種語(yǔ)言,其中100+語(yǔ)言數(shù)據(jù)超10億token

性能實(shí)測(cè)

Meta 官方測(cè)試顯示:? Maverick 在 DocVQA(94.4)超越 DeepSeek V3(92.8)Behemoth 在 MATH-500(95.0)擊敗 GPT-4.5Scout 在長(zhǎng)文本檢索任務(wù)中碾壓 OpenAI 模型


Llama 4 凌晨震撼發(fā)布:Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型,1000萬(wàn)上下文碾壓行業(yè)!-AI.x社區(qū)

開(kāi)源生態(tài)可能的影響

Llama 4 的發(fā)布,讓 開(kāi)源大模型競(jìng)爭(zhēng)開(kāi)始進(jìn)入白熱化

  • DeepSeek V3 剛發(fā)布不久,就被Llama 4超越,傳聞DeepSeek R2 可能提前發(fā)布
  • Mistral 3.1、Gemma 3 面臨壓力,Scout 在多項(xiàng)基準(zhǔn)測(cè)試中領(lǐng)先


本文轉(zhuǎn)載自公眾號(hào)AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/6UMydJZGZ58tA9YeoUgsBg??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-4-7 11:25:25修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦