偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<thead id="jd0cf"></thead>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型

發(fā)布于 2024-9-27 13:22

瀏覽

0收藏

早上起來(lái)發(fā)現(xiàn)，Meta AI又開源模型，文本模型開源了端側(cè)小模型1B和3B模型，也是首次開源了多模態(tài)大模型11B和90B兩個(gè)版本；同時(shí)還開源了一個(gè) Llama Stack項(xiàng)目。

Blog: https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
HF: https://huggingface.co/collections/meta-llama/llama-32-66f448ffc8c32f949b04c8cf

其中Llama3.2多模態(tài)模型在圖像識(shí)別和一系列視覺理解任務(wù)方面效果優(yōu)于Claude 3 Haiku 和 GPT4o-mini。文本模型-Llama3.2-3B模型在循指令、總結(jié)、提示重寫和工具使用等任務(wù)上優(yōu)于 Gemma 2 2.6B 和 Phi 3.5-mini 模型。

Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型-AI.x社區(qū)

多模態(tài)模型效果

Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型-AI.x社區(qū)

端側(cè)模型效果

多模態(tài)模型

Llama3.2的11B和90B模型多模態(tài)是基于Llama3.1-8B、70B文本模型上，增量增加圖像模型。

pretrain階段：

文本模塊由Llama3.1模型初始化，并初始化圖像編碼器，利用大規(guī)模噪聲（圖像、文本、6B數(shù)據(jù)對(duì)）對(duì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練
再用中等規(guī)模的高質(zhì)量的領(lǐng)域、知識(shí)增強(qiáng)的（圖像、文本、3M數(shù)據(jù)對(duì)）數(shù)據(jù)預(yù)訓(xùn)練。

posting-train階段：

通過監(jiān)督微調(diào)、拒絕采樣和直接偏好優(yōu)化進(jìn)行多輪對(duì)齊
使用 Llama 3.1 模型過濾和增強(qiáng) 圖像上的問題和答案，利用合成數(shù)據(jù)生成和獎(jiǎng)勵(lì)模型對(duì)所有候選答案打分排序，獲取高質(zhì)量的微調(diào)數(shù)據(jù)
還添加了安全數(shù)據(jù)

端側(cè)小模型

1B和3B模型都是基于8B模型裁剪后進(jìn)行模型初始化，并且利用8B和70B模型進(jìn)行模型蒸餾，9T數(shù)據(jù)預(yù)訓(xùn)練。

特別注意，這里蒸餾不是那種通過更大模型進(jìn)行數(shù)據(jù)生成的蒸餾，而是再模型訓(xùn)練階段，利用8B 和 70B 模型輸出的 logits 影響模型loss，也就是傳統(tǒng)的蒸餾方法。

Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型-AI.x社區(qū)

在post-traning階段，訓(xùn)練方式語(yǔ)Llama3.1一致，采樣監(jiān)督微調(diào)、拒絕采樣和直接偏好優(yōu)化模型。

最后模型支持上下文擴(kuò)展到 128K 個(gè)，同時(shí)也針對(duì)性優(yōu)化了模型的多種能力，例如摘要、重寫、指令遵循、語(yǔ)言推理和工具使用。

Llama Stack項(xiàng)目

Github: https://github.com/meta-llama/llama-stack

定義并標(biāo)準(zhǔn)化了將生成式 AI 應(yīng)用程序推向市場(chǎng)所需的構(gòu)建模塊，跨越整個(gè)開發(fā)生命周期：從模型訓(xùn)練和微調(diào)，到評(píng)估，再到在生產(chǎn)環(huán)境中構(gòu)建和運(yùn)行AI Agent。

主要是為了簡(jiǎn)化開發(fā)人員在不同環(huán)境（包括單節(jié)點(diǎn)、本地、云和設(shè)備上）中使用 Llama 模型的方式，幫助快速實(shí)現(xiàn)檢索增強(qiáng)生成、工具使用等能力的快速部署。

本文轉(zhuǎn)載自 ??NLP工作站??，作者：劉聰NLP

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

端側(cè)實(shí)時(shí)運(yùn)行、3B媲美7B！美團(tuán)、浙大等提出MobileVLM V2：更快、更強(qiáng)的端側(cè)視覺語(yǔ)言模型

kcoufee ? 8187瀏覽 ? 0回復(fù)
集體出走的Stability AI 發(fā)布全新代碼大模型，3B以下性能最優(yōu)，超越Code Llama和DeepSeek-Coder

pangguiyu ? 5833瀏覽 ? 0回復(fù)
大模型參數(shù)量都是7B，13B和65B等背后的原因是什么？

Syrupup ? 1.7w瀏覽 ? 0回復(fù)
Llama 3來(lái)了！首批開源 8B 和 70B兩個(gè)版本，未來(lái)有望開源400B大模型！

AIGC最前線 ? 1.4w瀏覽 ? 0回復(fù)
將端側(cè)大模型進(jìn)行到底-MiniCPM3-4B開源

NLP工作站 ? 4626瀏覽 ? 0回復(fù)
Llama 3.2 強(qiáng)勢(shì)震撼登場(chǎng)：從 1B 純文本躍至 90B 多模態(tài)，成就端側(cè) AI 巔峰杰作

穿越時(shí)空111 ? 5067瀏覽 ? 0回復(fù)
Meta開源多模態(tài)模型——Llama 3.2

Aceryt ? 4175瀏覽 ? 0回復(fù)
Mistral AI 發(fā)布革命性邊緣模型 Ministral 3B 和8B：性能與隱私雙料俱佳

Syrupup ? 3570瀏覽 ? 0回復(fù)
Meta AI發(fā)布全新量化版本Llama 3.2（1B & 3B）：推理速度提升2-4倍，模型大小減少56%

Halo咯咯 ? 4302瀏覽 ? 0回復(fù)
不只是更快：Ministral 3B和8B如何保障您的數(shù)據(jù)安全與隱私？

Halo咯咯 ? 3089瀏覽 ? 0回復(fù)
AMD 開源 AMD OLMo：完全開源的 1B 語(yǔ)言模型系列

Halo咯咯 ? 3660瀏覽 ? 0回復(fù)
Qwen開源強(qiáng)大、多樣、實(shí)用的Qwen2.5-Coder系列（0.5B/1.5B/3B/7B/14B/32B）

Halo咯咯 ? 7083瀏覽 ? 0回復(fù)
最新端側(cè)全模態(tài)大模型Megrez-3B-Omni

NLP工作站 ? 5136瀏覽 ? 0回復(fù)
Infinigence AI 發(fā)布 Megrez-3B-Omni：3B 設(shè)備上開源多模態(tài)大語(yǔ)言模型 MLLM

Halo咯咯 ? 3640瀏覽 ? 0回復(fù)
Megrez-3B-Omni：無(wú)問芯穹端側(cè)全模態(tài)大模型技術(shù)剖析與應(yīng)用指南

穿越時(shí)空111 ? 4140瀏覽 ? 0回復(fù)
Good Fire AI 針對(duì) Llama 3.1 8B 和 Llama 3.3 70B 的開源稀疏自動(dòng)編碼器 (SAE)

Halo咯咯 ? 3396瀏覽 ? 0回復(fù)
1B模型如何通過測(cè)試時(shí)優(yōu)化逆襲405B LLM？

arnoldzhw ? 3673瀏覽 ? 0回復(fù)
Kimi開源Moonlight-16B-A3B的MoE模型?。?/a>

NLP工作站 ? 4085瀏覽 ? 0回復(fù)
Liquid AI 推出 LFM2-VL-3B：3B 參數(shù)多模態(tài)模型，讓視覺語(yǔ)言推理落地邊緣設(shè)備

Halo咯咯 ? 910瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

再談DeepSeek-OCR的信息壓縮論！附DeepSeek-OCR與PaddleOCR實(shí)測(cè)對(duì)比！ 16h前發(fā)布
DeepSeek又開源，這次是OCR模型！附論文解讀！ 2025-10-21 00:36:13發(fā)布

熱門推薦

DeepSeek又開源，這次是OCR模型！附論文解讀！ 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

上一篇： Qwen2.5系列模型開源，你值得擁有?。?！

下一篇： GLM4模型開源，意料之中的尺寸，意料之外的效果

社區(qū)精華內(nèi)容

目錄

<rt id="vbozv"></rt>

<u id="vbozv"><button id="vbozv"></button></u>