偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

國產(chǎn)大模型全陣容，中文大模型競技場推出！

2024-05-31 14:23:15

近日，上海人工智能實(shí)驗(yàn)室聯(lián)合魔搭社區(qū)推出中國大語言模型評(píng)測競技場Compass Arena，首度集齊國內(nèi)主流大模型全陣容，阿里通義千問、百度文心一言、騰訊混元、訊飛星火、字節(jié)跳動(dòng)豆包、智譜AI、百川智能、零一萬物、月之暗面、Minimax、深度求索、書生·浦語等20款國產(chǎn)大模型出戰(zhàn)，角逐中國大模型“最強(qiáng)王者”。

LMSYS Org推出的大模型競技場Chatbot Arena，已成為海外最具公信力的大模型榜單之一，但該榜單中文化程度相對(duì)不足。近日，上海人工智能實(shí)驗(yàn)室聯(lián)合魔搭社區(qū)推出中國大語言模型評(píng)測競技場Compass Arena，首度集齊國內(nèi)主流大模型全陣容，阿里通義千問、百度文心一言、騰訊混元、訊飛星火、字節(jié)跳動(dòng)豆包、智譜AI、百川智能、零一萬物、月之暗面、Minimax、深度求索、書生·浦語等20款國產(chǎn)大模型出戰(zhàn)，角逐中國大模型“最強(qiáng)王者”。

相比考題固定的傳統(tǒng)測評(píng)，大模型競技場采用盲測、開放的測評(píng)模式，可以更全面地檢驗(yàn)?zāi)Ｐ蛯?shí)力。Compass Arena設(shè)置了隨機(jī)、匿名對(duì)戰(zhàn)，大模型選手們成為“蒙面唱將”，模型信息隱去后，由系統(tǒng)隨機(jī)匹配進(jìn)行PK，用戶可以天馬行空自由出題，并作為評(píng)委主觀評(píng)判和投票。如果大模型不小心“自報(bào)家門”，則對(duì)話被過濾，不計(jì)入成績。通過成千上萬輪PK挑戰(zhàn)和用戶投票，系統(tǒng)將對(duì)大模型進(jìn)行自動(dòng)排名。

魔搭社區(qū)直播時(shí)，網(wǎng)友腦洞大開在線出題

Compass Arena由上海人工智能實(shí)驗(yàn)室OpenCompass司南評(píng)測體系與魔搭社區(qū)聯(lián)合建設(shè)，前者負(fù)責(zé)組織評(píng)測，后者負(fù)責(zé)開源模型引入及社區(qū)打造。據(jù)上海人工智能實(shí)驗(yàn)室OpenCompass團(tuán)隊(duì)介紹，Compass Arena力求體現(xiàn)社區(qū)用戶的真實(shí)反饋，評(píng)測機(jī)制借鑒Chatbot Arena，采用Elo評(píng)分系統(tǒng)，即國際象棋等對(duì)弈活動(dòng)評(píng)估的權(quán)威標(biāo)準(zhǔn)。在這種模式下，大模型競技類似“在游戲中打排位”，勝率成為評(píng)估模型水平的關(guān)鍵指標(biāo)，同時(shí)隨著排位變高，系統(tǒng)也會(huì)自動(dòng)匹配高段位選手進(jìn)行對(duì)戰(zhàn)。

與Chatbot Arena相比，Compass Arena更聚焦中文大模型，主流國產(chǎn)大模型全覆蓋，同時(shí)評(píng)測用戶大多使用中文，可以充分評(píng)估國產(chǎn)大模型的性能。

目前，Compass Arena已匯聚超20款商業(yè)及社區(qū)模型，包括Qwen-Max、ERNIE-4.0-8K、Spark3.5 Max、Abab6.5、GLM4等國內(nèi)頭部廠商的旗艦款大模型，并引入了Llama3、Mixtral等海外標(biāo)桿模型進(jìn)行參照。更多模型及廠商還在不斷加入中。

上線不到一周，已有上萬人訪問魔搭Compass Arena頁面。魔搭社區(qū)表示，歡迎廣大開發(fā)者和網(wǎng)友參與大模型排位賽的投票，共同促進(jìn)國產(chǎn)大模型的進(jìn)步和趕超。后續(xù)，Compass Arena首期排行榜將揭曉，并將定期公布更新。

魔搭社區(qū)Compass Arena鏈接：https://www.modelscope.cn/studios/opencompass/CompassArena

Compass Arena首批大模型名單：

Abab6.5-Chat (MiniMax)

Baichuan 4 (百川智能)

C4AI Command R+ (Cohere)

DBRX-Instruct (DataBricks)

Deepseek-LLM-67B-Chat（深度求索）

Deepseek-MoE-16B-Chat（深度求索）

Doubao-Pro-4K (字節(jié)豆包)

ERNIE-4.0-8K (百度文心一言)

GLM4 (智譜AI)

Hunyuan-Pro (騰訊混元)

InternLM2系列（上海AILab書生·浦語）

Llama3系列（Meta）

Mixtral 8x22B Instruct (Mistral)

MoonShot-V1-32K (月之暗面)

Qwen1.5系列 (阿里通義千問)

Qwen-Max (阿里通義千問)

Spark3.5-Max (訊飛星火)

Yi-34B-Chat (零一萬物)

Yi-Large (零一萬物)

責(zé)任編輯：鳶瑋

大模型魔搭

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<tt id="fvqfq"></tt>

<ruby id="fvqfq"><samp id="fvqfq"></samp></ruby>