偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

編碼數(shù)學(xué)擊敗GPT4-Turbo!DeepSeek-Coder-v2登頂競技場最強(qiáng)開源編碼模型

人工智能 新聞
在編碼領(lǐng)域的整體性能評估中,DeepSeek-Coder-v2的評分和穩(wěn)定性均位于前10,超越智譜GLM-4、Llama-3等一眾知名開源模型。

就在剛剛,競技場排名再次刷新:

深度求索DeepSeek-Coder-v2成競技場最強(qiáng)開源編碼模型!

圖片

它在Coding Arena中已攀升至第4名,水平接近GPT-4-Turbo。

在編碼領(lǐng)域的整體性能評估中,DeepSeek-Coder-v2的評分和穩(wěn)定性均位于前10,超越智譜GLM-4、Llama-3等一眾知名開源模型。

圖片

據(jù)了解,完全開源的DeepSeek-Coder-v2現(xiàn)提供236B16B兩種參數(shù)規(guī)模,支持338種編程語言128K上下文長度。

圖片

而且就在Claude 3.5 Sonnet發(fā)布同日,深度求索官網(wǎng)的代碼助手也第一時間上線了和“Artifacts”類似的功能(自動生成代碼并直接在瀏覽器上運行)

比如由DeepSeek-Coder-v2直接生成經(jīng)典游戲——掃雷。

(提示詞:用html實現(xiàn)復(fù)雜一點的掃雷游戲,數(shù)字顏色分明,有計時,有重啟按鈕)

圖片

再比如設(shè)計網(wǎng)頁:

圖片

總之,DeepSeek-Coder-v2尤為擅長編碼和數(shù)學(xué)。

編碼、數(shù)學(xué)擊敗GPT4-Turbo

深度求索于上周發(fā)布了DeepSeek-Coder-v2,它在編碼和數(shù)學(xué)方面擊敗了GPT4-Turbo

圖片

在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超過了Yi-large、Claude3-Opus、GLM-4 和Qwen2-72B。

圖片

同時,DeepSeek-Coder-v2還具有良好的通用性能,在推理和中英通用能力上位列國內(nèi)第一梯隊。

圖片

當(dāng)時甚至有網(wǎng)友怒贊:

DeepSeek-Coder-v2目前位居Aider代碼編輯排行榜榜首(僅用了4天),領(lǐng)先于GPT-4o和Opus。
它的基準(zhǔn)測試結(jié)果甚至比DeepSeek官方圖表中顯示的更好。

圖片
圖片

而現(xiàn)在,僅過去一周時間,DeepSeek-Coder-v2正式登頂競技場最強(qiáng)開源編碼模型。

隨著這一登頂,其背后的公司深度求索再次引人關(guān)注。

老實說,這家公司一直很有看點。

與月之暗面、智譜AI、Minimax、百川智能等獲得大廠投資的AI初創(chuàng)公司不同,深度求索由一家搞私募量化的投資基金發(fā)起。

當(dāng)同行都在尋找AI應(yīng)用落地時,深度求索卻喊出了“不做應(yīng)用做研究”的口號。

短短半年時間,它發(fā)布并開源了多個百億級參數(shù)的大模型。

甚至僅憑一己之力點燃了大模型價格戰(zhàn)的第一把火。

具體啥情況?接下來一起扒一扒。

“價格戰(zhàn)導(dǎo)火索”深度求索

深度求索由知名私募巨頭幻方量化于2023年4月創(chuàng)立。

早在2019年,幻方就發(fā)布了自研深度學(xué)習(xí)訓(xùn)練平臺“螢火一號”。

據(jù)稱該項目總投資近2億元,共搭載了1100塊GPU。

后來“螢火一號”升級為“二號”,搭載的GPU數(shù)則達(dá)到了約1萬張

這意味著,單從算力看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場券。

去年11月,深度求索發(fā)布第一代大模型DeepSeek Coder,免費商用,完全開源。

緊接著12月,它又發(fā)布了參數(shù)670億的DeepSeek,主打發(fā)布即開源。

今年5月初,深度求索宣布開源第二代MoE大模型DeepSeek-V2。

沒錯,就是那個“性能比肩GPT-4 Turbo,價格卻只有GPT-4僅百分之一”的模型。

圖片

DeepSeek-V2推出后,深度求索一度被AI圈稱作“價格屠夫”,被認(rèn)為是引爆大模型價格戰(zhàn)的導(dǎo)火索之一。

此外,它還推出了專為視覺與語言理解應(yīng)用設(shè)計的DeepSeek-VL系列大模型。

總之,這家公司一直被視為一匹可能改變國內(nèi)AI市場格局的“黑馬”。

Anthropic聯(lián)合創(chuàng)始人Jack Clark曾表示:

DeepSeek組建了一支團(tuán)隊,他們對訓(xùn)練雄心勃勃的模型所需的基礎(chǔ)設(shè)施有著深刻的理解。中國制造也將成為AI模型的發(fā)展趨勢。

最后,面對競技場最新排名,網(wǎng)友們紛紛猜測新王Claude 3.5 Sonnet在編碼上究竟表現(xiàn)如何?

圖片

競技場:在更了!在更了!

開源地址:https://huggingface.co/collections/deepseek-ai/deepseekcoder-v2-666bf4b274a5f556827ceeca

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-02-17 12:24:43

2024-12-31 12:35:46

2024-07-24 12:40:44

2024-04-22 08:40:00

LLM模型開源

2024-11-12 14:00:00

AI編程

2025-07-03 14:57:51

DeepSeek模型AI

2024-03-27 15:37:24

2024-07-29 15:37:17

AI訓(xùn)練

2025-04-14 09:17:00

2025-04-07 09:35:00

Meta模型開源

2012-05-31 14:20:14

2025-03-26 08:39:03

2024-05-31 14:23:15

2023-07-22 13:09:51

模型開源

2025-04-08 04:20:00

2025-02-18 15:09:07

2024-10-16 15:07:57

2024-10-29 14:25:00

模型訓(xùn)練

2024-04-10 12:35:50

2024-05-07 11:42:54

MoE模型GPT-4
點贊
收藏

51CTO技術(shù)棧公眾號