偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<blockquote id="nxvxr"></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Llama 4 凌晨震撼發(fā)布：Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型，1000萬(wàn)上下文碾壓行業(yè)！原創(chuàng)

發(fā)布于 2025-4-7 06:35

瀏覽

0收藏

就在4月6日凌晨，Meta 毫無(wú)預(yù)兆地發(fā)布了 Llama 4，這是其開(kāi)源大模型 Llama 系列的最新成員，也是迄今為止最強(qiáng)的開(kāi)源多模態(tài)大模型！

此次發(fā)布的 Llama 4 系列包括 Scout、Maverick 和 Behemoth 三個(gè)版本，其中 Scout 和 Maverick 已開(kāi)放下載，而 Behemoth 仍在訓(xùn)練中，預(yù)計(jì)未來(lái)幾個(gè)月正式亮相。

Meta 首席執(zhí)行官 馬克·扎克伯格 在官方公告中激動(dòng)地表示：

“我們的目標(biāo)是打造世界領(lǐng)先的 AI，并將其開(kāi)源，讓全球受益。今天，Llama 4 讓這一愿景更進(jìn)一步！”

下載地址： llama.com/llama-downloads

Llama 4 凌晨震撼發(fā)布：Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型，1000萬(wàn)上下文碾壓行業(yè)！-AI.x社區(qū)

三大版本解析

1. Llama 4 Scout（170億激活參數(shù)，16專家）

1000萬(wàn)token上下文窗口（行業(yè)最長(zhǎng)！相當(dāng)于15000頁(yè)文本）
單張H100 GPU即可運(yùn)行（Int4量化后）
專為長(zhǎng)文檔摘要、代碼庫(kù)推理優(yōu)化，性能超越Gemma 3、Gemini 2.0 Flash

2. Llama 4 Maverick（170億激活參數(shù)，128專家）

4000億總參數(shù)，但僅激活170億（MoE架構(gòu)高效推理）
競(jìng)技場(chǎng)（Arena）得分1417，超越DeepSeek V3，在編程、數(shù)學(xué)、創(chuàng)意寫作等任務(wù)中排名第一
成本極低：推理僅需0.49/百萬(wàn)token，遠(yuǎn)低于GPT-4o（$4.38/百萬(wàn)token）

3. Llama 4 Behemoth（2880億激活參數(shù)，2萬(wàn)億總參數(shù)）

仍在訓(xùn)練中，但已超越GPT-4.5、Claude 3.7 Sonnet
目標(biāo)：全球最強(qiáng)AI模型，未來(lái)將作為“教師模型”指導(dǎo)Scout和Maverick

Llama 4 凌晨震撼發(fā)布：Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型，1000萬(wàn)上下文碾壓行業(yè)！-AI.x社區(qū)

技術(shù)突破

1. 首次采用MoE架構(gòu)，計(jì)算效率飆升

Llama 4 是 Meta 首個(gè)混合專家（Mixture of Experts, MoE）模型，每個(gè) token 僅激活部分參數(shù)，大幅降低計(jì)算成本。例如：

Maverick 有4000億參數(shù)，但僅激活170億，可在單臺(tái)H100上運(yùn)行。

2. 原生多模態(tài)，視覺(jué)理解能力一流

早期融合技術(shù)：文本、圖像、視頻統(tǒng)一訓(xùn)練，支持48張圖像輸入
精準(zhǔn)圖像定位：可錨定圖像特定區(qū)域進(jìn)行問(wèn)答

3. 超長(zhǎng)上下文支持，1000萬(wàn)token創(chuàng)紀(jì)錄

Scout 支持1000萬(wàn)token，可處理20小時(shí)視頻或7500頁(yè)文檔
iRoPE架構(gòu)：無(wú)位置嵌入+交錯(cuò)注意力層，增強(qiáng)長(zhǎng)文本泛化能力

4. 訓(xùn)練數(shù)據(jù)翻倍，多語(yǔ)言能力更強(qiáng)

30萬(wàn)億token訓(xùn)練數(shù)據(jù)（Llama 3的兩倍）
支持200種語(yǔ)言，其中100+語(yǔ)言數(shù)據(jù)超10億token

性能實(shí)測(cè)

Meta 官方測(cè)試顯示：? Maverick 在 DocVQA（94.4）超越 DeepSeek V3（92.8）? Behemoth 在 MATH-500（95.0）擊敗 GPT-4.5? Scout 在長(zhǎng)文本檢索任務(wù)中碾壓 OpenAI 模型

Llama 4 凌晨震撼發(fā)布：Meta開(kāi)源最強(qiáng)MoE多模態(tài)模型，1000萬(wàn)上下文碾壓行業(yè)！-AI.x社區(qū)

開(kāi)源生態(tài)可能的影響

Llama 4 的發(fā)布，讓 開(kāi)源大模型競(jìng)爭(zhēng)開(kāi)始進(jìn)入白熱化：

DeepSeek V3 剛發(fā)布不久，就被Llama 4超越，傳聞DeepSeek R2 可能提前發(fā)布
Mistral 3.1、Gemma 3 面臨壓力，Scout 在多項(xiàng)基準(zhǔn)測(cè)試中領(lǐng)先

本文轉(zhuǎn)載自公眾號(hào)AI 博物院作者：longyunfeigu

原文鏈接：??https://mp.weixin.qq.com/s/6UMydJZGZ58tA9YeoUgsBg??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-4-7 11:25:25修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

首個(gè)開(kāi)源世界模型！百萬(wàn)級(jí)上下文，長(zhǎng)視頻理解吊打GPT-4，UC伯克利華人一作

duhorse ? 3379瀏覽 ? 0回復(fù)
「有效上下文」提升20倍！DeepMind發(fā)布ReadAgent框架

duhorse ? 3467瀏覽 ? 0回復(fù)
谷歌最強(qiáng)大模型免費(fèi)開(kāi)放了！長(zhǎng)音頻理解功能獨(dú)一份，100萬(wàn)上下文敞開(kāi)用

Crystalcxt ? 3092瀏覽 ? 0回復(fù)
無(wú)限上下文處理，2萬(wàn)億token碾壓Llama 2

duhorse ? 3040瀏覽 ? 0回復(fù)
Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開(kāi)源大模型水位

51CTO技術(shù)棧 ? 4464瀏覽 ? 0回復(fù)
LLM上下文窗口突破200萬(wàn)！無(wú)需架構(gòu)變化+復(fù)雜微調(diào)，輕松擴(kuò)展8倍

duhorse ? 3657瀏覽 ? 0回復(fù)
LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)

ermulong ? 3077瀏覽 ? 0回復(fù)
長(zhǎng)上下文能力只是吹牛？最強(qiáng)GPT-4o正確率僅55.8%，開(kāi)源模型不如瞎蒙

duhorse ? 3308瀏覽 ? 0回復(fù)
長(zhǎng)上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2517瀏覽 ? 0回復(fù)
Meta剛開(kāi)源llama 3.2多模態(tài)，就被打敗了！

NLP前沿1 ? 3086瀏覽 ? 0回復(fù)
Meta開(kāi)源多模態(tài)模型——Llama 3.2

Aceryt ? 3114瀏覽 ? 0回復(fù)
超GPT-4o，1240億參數(shù)！最強(qiáng)開(kāi)源多模態(tài)模型 Pixtral Large！

Aceryt ? 2598瀏覽 ? 0回復(fù)
長(zhǎng)上下文語(yǔ)言模型評(píng)估體系探析

Baihai_IDP ? 2967瀏覽 ? 0回復(fù)
Claude的MCP（模型上下文協(xié)議）簡(jiǎn)介

Halo咯咯 ? 5452瀏覽 ? 0回復(fù)
基于多模態(tài)大語(yǔ)言模型的上下文目標(biāo)檢測(cè)

AIRoobt ? 2601瀏覽 ? 0回復(fù)
模型上下文協(xié)議（MCP）開(kāi)發(fā)實(shí)戰(zhàn)——構(gòu)建LangChain代理客戶端

51CTO內(nèi)容精選 ? 4462瀏覽 ? 0回復(fù)
Meta放大招！Llama 4三大模型來(lái)襲，開(kāi)源免費(fèi)還超能打

Halo咯咯 ? 2588瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布GPT-4.1，性能暴漲、100萬(wàn)上下文

Aceryt ? 1287瀏覽 ? 0回復(fù)
GPT-4.1系列震撼發(fā)布：百萬(wàn)token上下文+性能全面碾壓，性價(jià)比拉滿

AI博物院 ? 1380瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Dify 迎來(lái)重大更新！工作流調(diào)試工具也太實(shí)用了 13h前發(fā)布
九大GraphRAG方法深度對(duì)比：選擇最適合你的圖檢索增強(qiáng)生成方案 13h前發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

谷歌Gemini 2.5家族全面升級(jí)：Pro、Flash與Flash-Lite正式發(fā)布，AI推理能力再進(jìn)化 0回復(fù)

三大框架 Dify/RAGFlow/n8n怎么選？企業(yè)低成本落地AI的最優(yōu)解 0回復(fù)

超越FastGPT、Dify！Agentic CoT 架構(gòu)實(shí)現(xiàn)RAG回答準(zhǔn)確率突破94%大關(guān) 0回復(fù)

MCP Server怎么做權(quán)限控制？5分鐘教會(huì)你快速給MCP 服務(wù)成功添加授權(quán) 0回復(fù)

上一篇： Dify從入門到高階系列一：詳解各種工作流節(jié)點(diǎn)，如何降低LLM開(kāi)發(fā)門檻？

下一篇： Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略

社區(qū)精華內(nèi)容

目錄