偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

^{<blockquote id="7y6i1"></blockquote>}

<var id="7y6i1"></var>

<thead id="7y6i1"></thead>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

首個開源MoE大模型發(fā)布！7Bx8個專家，離GPT-4最近的一集

2023-12-09 13:32:21

MoE架構(gòu)全稱專家混合（Mixture-of-Experts），也就是傳聞中GPT-4采用的方案，可以說這是開源大模型離GPT-4最近的一集了。

“取消今晚所有計劃！”，許多AI開發(fā)者決定不睡了。

只因首個開源MoE大模型剛剛由Mistral AI發(fā)布。

MoE架構(gòu)全稱專家混合（Mixture-of-Experts），也就是傳聞中GPT-4采用的方案，可以說這是開源大模型離GPT-4最近的一集了。

沒有發(fā)布會、沒有宣傳視頻，只靠一個磁力鏈接，就產(chǎn)生如此轟動效果。

具體參數(shù)還得是網(wǎng)速快的人下載完之后，從配置文件里截圖發(fā)出來的：

7B參數(shù)x8個專家，對每個token選擇前兩個最相關的專家來處理。

以至于OpenAI創(chuàng)始成員Karpathy都吐槽，是不是少了點什么？

怎么缺了一個那種排練很多次的專業(yè)范視頻，大談特談AI變革啊。

至于吐槽的是誰，懂得都懂了。

以及他還解釋了為什么AI社區(qū)這幾天如此活躍：最大的深度學習會議NeurIPS即將在下周開啟。

MoE，開源大模型新階段？

為何這款開源MoE模型如此受關注？

因為其前身Mistral-7B本來就是開源基礎模型里最強的那一檔，經(jīng)常可以越級挑戰(zhàn)13B、34B。

并且Mistral-7B以寬松的Apache-2.0開源協(xié)議發(fā)布，可免費商用，這次新模型很可能沿用這個協(xié)議。

在多個評測排行榜上，基于Mistral-7B微調(diào)的Zephyr-7B-beta都是前排唯一的7B模型，前后都是規(guī)模比他大得多的模型。

LLMSYS Chatbot Arena上，Zephry-7B-beta目前排第12。

AlpacaEval上，也排到第15。

目前這個新的MoE模型連個正式名字都還沒有，社區(qū)一般稱呼它為Mistral-7Bx8 MoE。

但在大家期待的期待中，新MoE模型對比單體Mistral-7B的提升幅度，就應該像GPT-4對比GPT-3.5那樣。

但是注意了，有人提醒大家MoE對于本地運行來說不是太友好，因為更占內(nèi)存

但更適合部署在云端，跨設備專家并行，給公司處理并發(fā)需求帶來成本優(yōu)勢。

行動比較快的公司是前PyTorch成員出走創(chuàng)辦的fireworks.ai。

第一次嘗試、沒有任何優(yōu)化的情況下，需要兩張80GB內(nèi)存的卡，優(yōu)化版本即將推出。

Replicate上也有了可試玩版本，簡單試用發(fā)現(xiàn)中文水平也不錯。

其實Mistral AI也為大家準備了官方配套代碼，使用了斯坦福去年發(fā)布的輕量級MoE庫Megablocks。

創(chuàng)始人：小模型支持更多有意思的應用

Mistral AI由前DeepMind、前Meta科學家創(chuàng)辦。

剛剛完成一輪4.87億美元的新融資，最新估值逼近20億美元，已晉升獨角獸。

三位聯(lián)合創(chuàng)始人中，CEO Arthur Mensch此前在DeepMind巴黎工作。

CTO Timothée Lacroix和首席科學家Guillaume Lample則在Meta共同參與過Llama系列的研發(fā)，Lample是通訊作者之一。

Arthur Mensch曾在接受采訪時談到，讓模型變小是支持Agent發(fā)展的路徑之一。

如果能把計算成本降低100倍，就能構(gòu)建起更多有意思的應用。

Mistral AI成立于今年5月，種子輪融資1.13億美元。

9月底，Mistral AI以磁力鏈接的形式發(fā)布第一個開源模型Mistral-7B，當時很多開發(fā)者試用后都覺得Llama-2不香了。

12月初，Mistral AI再次甩出開源MoE模型磁力鏈接，再次掀起一波熱潮。

這就是公司官號僅有的幾次發(fā)言。

不少人都拿來和最近谷歌的過度宣傳做對比。

最新的梗圖：磁力鏈接就是新的arXiv。

參考鏈接：
[1]https://x.com/MistralAI/status/1733150512395038967?s=20。
[2]https://github.com/mistralai/megablocks-public。
[3]https://replicate.com/nateraw/mixtral-8x7b-32kseqlen。

責任編輯：姜華來源：量子位

GPT-4 MoE架構(gòu)開源大模型

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<em id="7fbpr"></em>