偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<output id="nocz5"></output>

<p id="nocz5"></p>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B

發(fā)布于 2024-4-10 10:04

瀏覽

0收藏

4月9日，著名大模型開(kāi)源平臺(tái)Stability.ai在官網(wǎng)開(kāi)源了，全新類ChatGPT模型Stable LM 2 12B。

據(jù)悉，Stable LM 2 12B有120億參數(shù)，使用了英語(yǔ)、西班牙語(yǔ)、德語(yǔ)等7種語(yǔ)言2萬(wàn)億tokens的訓(xùn)練數(shù)據(jù)。一共有基礎(chǔ)模型和指令微調(diào)兩個(gè)版本，能生成文本、代碼等內(nèi)容，還能作為RAG的核心來(lái)使用。

同時(shí)，Stability.ai還對(duì)之前發(fā)布的模型Stable LM 2 1.6B進(jìn)行了更新，尤其是在硬件需求方面進(jìn)行了大幅度優(yōu)化。所以，這兩款模型非常適合小企業(yè)、個(gè)人開(kāi)發(fā)者使用。其性能也超過(guò)了Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2等知名開(kāi)源同類小參數(shù)模型。

12B開(kāi)源地址：??https://huggingface.co/stabilityai/stablelm-2-12b??

1.6B新版本：??https://huggingface.co/stabilityai/stablelm-2-1_6b-chat??

技術(shù)報(bào)告：??https://arxiv.org/abs/2402.17834??

在線demo：https://huggingface.co/spaces/stabilityai/stablelm-2-chat

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B-AI.x社區(qū)

StableLM 2架構(gòu)介紹

?

Stable LM 2 12B/1.6B皆使用的是Transformer架構(gòu)，一共24層、32個(gè)自注意力頭，并使用大量公開(kāi)且多樣化大約2萬(wàn)億tokens的數(shù)據(jù)集進(jìn)行了預(yù)訓(xùn)練。

這些數(shù)據(jù)包括Arxiv、PubMed、S2ORC、PhilPapers等學(xué)術(shù)論文數(shù)據(jù)集，以及BookCorpusOpen、PG-19、FanFics等圖書(shū)和小說(shuō)數(shù)據(jù)集。

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B-AI.x社區(qū)

Stability.ai還使用了來(lái)自Web的數(shù)據(jù)集，如Cultura-X、OpenWebText2、RefinedWeb等，以及來(lái)自社交媒體和法律領(lǐng)域的數(shù)據(jù)集。

此外，每個(gè)數(shù)據(jù)集都有相應(yīng)的權(quán)重，為每個(gè)數(shù)據(jù)集提供了詳細(xì)的統(tǒng)計(jì)信息，包括標(biāo)記數(shù)量、訓(xùn)練時(shí)長(zhǎng)等。還使用了一種創(chuàng)新的分詞技術(shù)，對(duì)原始分詞器進(jìn)行了擴(kuò)展，以便更好地壓縮代碼和非英文語(yǔ)言數(shù)據(jù)。

訓(xùn)練策略方面，Stability.ai使用了一種稱為“FlashAttention-2”的高效序列并行優(yōu)化技術(shù)，以4096的上下文長(zhǎng)度從頭開(kāi)始訓(xùn)練StableLM 2。同時(shí)訓(xùn)練過(guò)程中采用BFloat16混合精度，并使用標(biāo)準(zhǔn)的AdamW優(yōu)化器進(jìn)行訓(xùn)練。

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B-AI.x社區(qū)

模型微調(diào)階段，Stability.ai使用了監(jiān)督微調(diào)（SFT）、直接偏好優(yōu)化（DPO）和自我知識(shí)學(xué)習(xí)三種方法，對(duì)生成的文本進(jìn)行排序，然后使用排序結(jié)果來(lái)調(diào)整模型的參數(shù)，使其生成更符合人類偏好的文本。

StableLM 2測(cè)試數(shù)據(jù)

?

Stability.ai將兩款StableLM 2 模型在ARC、HellaSwag、MMLU、TriviaQA、Winograd、GSM8K等知名測(cè)試平臺(tái)上進(jìn)行了綜合測(cè)試。

零樣本和少樣本基準(zhǔn)測(cè)試方面，StableLM 2 1.6B在綜合平均分?jǐn)?shù)上獲得45.3分,在1.6B以下模型中名列前茅,但仍低于一些更大的模型如phi-2和stablelm-3b-4e1t。

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B-AI.x社區(qū)

而Stable LM 2 12B的性能超過(guò)了Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2等模型，略低于mistralai/Mixtral-8x7B-Instruct-v0.1。

多語(yǔ)言基準(zhǔn)測(cè)試：StableLM 2 1.6B在不同語(yǔ)種任務(wù)上的表現(xiàn)都很出色，在所有語(yǔ)種的綜合分?jǐn)?shù)為40.5分,在英語(yǔ)任務(wù)上得分48.7分、德語(yǔ)39.1分、西班牙語(yǔ)39.0分等。

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B-AI.x社區(qū)

多輪對(duì)話基準(zhǔn)測(cè)試：StableLM 2 1.6B與其他模型在MT-Bench多輪對(duì)話任務(wù)上進(jìn)行了深度對(duì)比。StableLM 2 1.6B的綜合得分與規(guī)模明顯更大的模型如Mistral-7B和MPT-30B不相上下,在某些指標(biāo)上甚至獲得了更高的分?jǐn)?shù)。

本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū) ，作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/2CV1qK1po0lD7MAQA3vhfw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

Stable Diffusion 3將在6月12日正式開(kāi)源

Aceryt ? 3400瀏覽 ? 0回復(fù)
大語(yǔ)言模型llama-2-7b推理服務(wù)實(shí)戰(zhàn)

zhcs333 ? 7838瀏覽 ? 1回復(fù)
用大模型開(kāi)卡車，還融了2億美元

Aceryt ? 3556瀏覽 ? 0回復(fù)
Meta 開(kāi)源最強(qiáng)大模型Llama 3.1，參數(shù)多達(dá) 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費(fèi)！小扎：堅(jiān)定開(kāi)源不動(dòng)搖！

51CTO技術(shù)棧 ? 5485瀏覽 ? 0回復(fù)
比Stable Diffusion便宜118倍！1890美元訓(xùn)出11.6億參數(shù)高質(zhì)量文生圖模型

duhorse ? 3301瀏覽 ? 0回復(fù)
LG開(kāi)源韓語(yǔ)大模型Exaone 3.0，8萬(wàn)億token訓(xùn)練數(shù)據(jù)

Aceryt ? 3490瀏覽 ? 0回復(fù)
專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)

Aceryt ? 4502瀏覽 ? 0回復(fù)
Mistral開(kāi)源首個(gè)多模態(tài)大模型—Pixtral 12B

Aceryt ? 4025瀏覽 ? 0回復(fù)
Qwen2-VL (2B、7B、72B)：迄今為止最好的開(kāi)源視覺(jué)模型！?。〒魯?Claude 和 GPT-4o）

老蛀蟲(chóng) ? 7358瀏覽 ? 0回復(fù)
Ai2開(kāi)源OLMo 2：數(shù)據(jù)集、訓(xùn)練方法、權(quán)重大放送

Aceryt ? 3540瀏覽 ? 0回復(fù)
艾倫人工智能研究所 (AI2) 發(fā)布 OLMo 2：在多達(dá) 5T 代幣上訓(xùn)練的新系列開(kāi)源 7B 和 13B 語(yǔ)言模型

Halo咯咯 ? 5610瀏覽 ? 0回復(fù)
Hugging Face 發(fā)布 SmolVLM：用于設(shè)備端推理的 2B 參數(shù)視覺(jué)語(yǔ)言模型

Halo咯咯 ? 5403瀏覽 ? 0回復(fù)
9B參數(shù)吊打GPT-4V！NVIDIA開(kāi)源新模型（Eagle 2），竟靠“透明數(shù)據(jù)”逆襲？

Halo咯咯 ? 3589瀏覽 ? 0回復(fù)
【AI 界大地震】AMD 開(kāi)源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓(xùn)練成本暴跌 80%？

Halo咯咯 ? 3155瀏覽 ? 0回復(fù)
Llama 4開(kāi)源王者歸來(lái)！推理、編碼打平DeepSeek V3但參數(shù)減一半，一張H100就能跑，還有巨獸2萬(wàn)億參數(shù)模型！

51CTO技術(shù)棧 ? 2951瀏覽 ? 0回復(fù)
Kimi K2發(fā)布：1萬(wàn)億參數(shù)，128K上下文，還能跑17個(gè)工具流程？

Halo咯咯 ? 8738瀏覽 ? 0回復(fù)
Kimi K2深度解析：萬(wàn)億參數(shù)大模型的開(kāi)源標(biāo)桿？

Halo咯咯 ? 5899瀏覽 ? 0回復(fù)
全球首個(gè)去中心化訓(xùn)練的32B參數(shù)大模型：INTELLECT-2如何重塑AI訓(xùn)練范式

頓數(shù)AI ? 3488瀏覽 ? 0回復(fù)
小模型，大推理：MBZUAI 開(kāi)源 K2 Think，32B 模型超越超大體量對(duì)手

Halo咯咯 ? 2991瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門(mén)推薦

別再怪AI“聽(tīng)不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問(wèn)題改寫(xiě)(優(yōu)化)方法—使用歷史記錄改寫(xiě)問(wèn)題 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

上一篇：谷歌重磅發(fā)布Gemini 1.5 Pro：能自動(dòng)寫(xiě)影評(píng)，理解視頻！

下一篇：音樂(lè)版Sora！文生超逼真歌曲，可自定義歌詞、時(shí)間延長(zhǎng)

社區(qū)精華內(nèi)容

目錄

<sub id="fp9gr"></sub>