偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

深夜突襲!DeepSeek-R1 重磅升級(jí):媲美 OpenAl 最高 o3 模型,編碼能力直逼 Claude 4

人工智能
官方稱這是一次“minor update”,但社區(qū)反饋卻指向另一種結(jié)論:在代碼生成、長(zhǎng)時(shí)推理、格式控制等任務(wù)上,這個(gè)版本的 R1 的能力已經(jīng)“近乎o3級(jí)別”。

5月28日凌晨,DeepSeek 在 Hugging Face 上開源了其更新版的 R1 模型。

此次更新并未更改名稱,只在模型路徑中標(biāo)注“0528”以作區(qū)分。

圖源deepseek圖源deepseek

官方稱這是一次“minor update”,但社區(qū)反饋卻指向另一種結(jié)論:在代碼生成、長(zhǎng)時(shí)推理、格式控制等任務(wù)上,這個(gè)版本的 R1 的能力已經(jīng)“近乎o3級(jí)別”。

而官方的口風(fēng)是:“DeepSeek-R1 的性能據(jù)稱已對(duì)齊 OpenAI 的 o1 正式版本,其蒸餾出的輕量模型甚至在多個(gè)任務(wù)上超越了 o1-mini。”


圖片圖片

圖注:推特網(wǎng)友在經(jīng)典物理模擬測(cè)試中,對(duì)DeepSeek-R1新舊版本的對(duì)比

經(jīng)國(guó)內(nèi)微博用戶實(shí)測(cè):編碼能力已經(jīng)可以和Claude 4 掰手腕了。

圖片圖片

此外,此次發(fā)布不僅涵蓋了權(quán)重、配置與模型文檔,也同步上線了 App、官網(wǎng)及 API 調(diào)用服務(wù),接口對(duì)開發(fā)者開放。R1 使用 MIT 許可證發(fā)布,允許商用,也允許使用其輸出結(jié)果進(jìn)行模型蒸餾。


圖片圖片

圖注:官方稱,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。圖源deepseek

這是中國(guó)大模型廠商中,少數(shù)同時(shí)在算法、產(chǎn)品與授權(quán)層面做“全棧開源”的公司之一。

從 R1 到 R1-0528:推理能力的重點(diǎn)優(yōu)化

據(jù)官方信息,此次更新的 R1 模型(標(biāo)注版本為0528)參數(shù)規(guī)模約為660B,在訓(xùn)練后期大量采用強(qiáng)化學(xué)習(xí)技術(shù),以少量標(biāo)注數(shù)據(jù)優(yōu)化模型在數(shù)學(xué)、編程和語(yǔ)言推理等任務(wù)上的表現(xiàn)。

雖然官方并未披露系統(tǒng)性基準(zhǔn)測(cè)試結(jié)果,但多個(gè)國(guó)內(nèi)外開發(fā)者社區(qū)實(shí)測(cè)顯示,R1-0528 在代碼生成和復(fù)雜推理任務(wù)中具備穩(wěn)定輸出能力。

根據(jù)用戶測(cè)試,在 LiveCodeBench 編程測(cè)試環(huán)境中,R1-0528 在多個(gè)任務(wù)上表現(xiàn)接近 OpenAI o3-mini(High 模式)和 o4-mini(Medium 模式)。不過,目前尚無(wú)該基準(zhǔn)的官方排行榜對(duì)這一說法予以印證。

圖注:推特用戶測(cè)試圖注:推特用戶測(cè)試

尤其在長(zhǎng)鏈條邏輯題中,開發(fā)者觀察到模型可進(jìn)行多達(dá)20余步的符號(hào)化推理,且過程中結(jié)構(gòu)一致性較好。在部分測(cè)試場(chǎng)景中,模型思考處理時(shí)間可持續(xù)數(shù)十分鐘。

與多數(shù)開源模型不同,DeepSeek-R1 的另一特征在于其明確允許并鼓勵(lì)“模型蒸餾”。

官方同步開源了兩個(gè)660B規(guī)模的大模型(DeepSeek-R1 與 DeepSeek-R1-Zero),并基于其推理輸出訓(xùn)練了6個(gè)不同規(guī)模的子模型,其中 32B 與 70B 兩個(gè)中型版本,在多個(gè)通用能力維度上據(jù)稱“可對(duì)標(biāo) OpenAI o1-mini”。不過相關(guān)測(cè)試細(xì)節(jié)與完整評(píng)估方法尚未公開,仍待進(jìn)一步驗(yàn)證。


開源了6個(gè)小模型。圖源deepseek開源了6個(gè)小模型。圖源deepseek

對(duì)比之下,這種“從大模型生成小模型”的思路,也讓 DeepSeek 的開源策略更貼近“可部署”的實(shí)際場(chǎng)景,而非僅停留在評(píng)測(cè)表現(xiàn)層。

目前,這些模型均已上傳至 Hugging Face,且標(biāo)注為 MIT License,意味著任何企業(yè)與開發(fā)者均可在不經(jīng)授權(quán)的前提下用于商用或二次開發(fā)。

圖片圖片

論文鏈接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

在產(chǎn)品層面,用戶可通過“深度思考”模式直接體驗(yàn) R1 推理能力,在 App 或網(wǎng)頁(yè)端完成任務(wù)調(diào)用。API 接入方式為 model='deepseek-reasoner',并提供明確定價(jià)策略:百萬(wàn) tokens 的輸入成本為 1 元(緩存命中)至 4 元(未命中),輸出成本為每百萬(wàn) tokens 16 元。

圖片圖片

抱抱臉鏈接:https://huggingface.co/deepseek-ai

關(guān)于Deepseek:爭(zhēng)氣的國(guó)產(chǎn)AI

今年,DeepSeek突然登上全球AI舞臺(tái)。

它的聊天應(yīng)用一度沖上蘋果和安卓商店的榜首,背后的模型在多個(gè)基準(zhǔn)測(cè)試中超越Meta Llama和OpenAI GPT-4o,吸引了華爾街分析師和硅谷技術(shù)官員的罕見一致關(guān)注。微軟將其接入Azure,英偉達(dá)CEO稱其“創(chuàng)新出色”。

DeepSeek起初并不做 AI 模型,它的母公司是量化基金“九坤投資”,創(chuàng)始人梁文鋒是浙江大學(xué)出身的 AI 愛好者。2015年開始試水交易系統(tǒng),2019年正式設(shè)立對(duì)沖基金。在量化交易中摸索多年的算法團(tuán)隊(duì),成為日后DeepSeek模型訓(xùn)練的基礎(chǔ)。

DeepSeek Founder Liang WenfengDeepSeek Founder Liang Wenfeng

2023年,九坤成立DeepSeek Lab,作為科研獨(dú)立體。彼時(shí)正值中國(guó)AI創(chuàng)業(yè)熱潮復(fù)燃,百度、字節(jié)、阿里、MiniMax、月之暗面先后發(fā)布通用大模型。DeepSeek一開始就選了一條不一樣的路:自建數(shù)據(jù)中心、強(qiáng)調(diào)計(jì)算效率,并迅速在一年內(nèi)迭代三代模型。

DeepSeek V2于2024年春天發(fā)布,以“推理能力”突出出圈。相比同行更重堆參數(shù)、跑分的路徑,DeepSeek強(qiáng)調(diào)模型在復(fù)雜任務(wù)下的“思考能力”——數(shù)學(xué)、物理、代碼,正是V2和后續(xù)R1模型發(fā)力的重點(diǎn)。

V3版本上線于2024年末,DeepSeek宣稱它在內(nèi)測(cè)中超越了OpenAI的GPT-4o。2025年1月,DeepSeek-R1問世,定位為“reasoning model”。它在 Hugging Face 上以MIT協(xié)議發(fā)布,成為業(yè)內(nèi)少見能商業(yè)化改造的高性能模型之一。

一方面,DeepSeek通過模型架構(gòu)優(yōu)化和訓(xùn)練效率提升,大幅壓縮了推理成本。另一方面,它在市場(chǎng)價(jià)格上極為激進(jìn):不少模型免費(fèi)開放、接口調(diào)用價(jià)格低于行業(yè)平均值,甚至迫使阿里、字節(jié)等國(guó)內(nèi)玩家降價(jià)或免費(fèi)開放部分模型。

這也引發(fā)了對(duì)其商業(yè)模式的質(zhì)疑。截至目前,DeepSeek并未公開融資輪次,也尚未啟動(dòng)商業(yè)化路徑。據(jù)接近公司人士透露,其運(yùn)營(yíng)主要依賴母公司九坤提供的算力和資金資源。相比依靠云廠商和VC支持的AI創(chuàng)業(yè)者,DeepSeek的路線更像是“實(shí)驗(yàn)室模式”。

這種不以盈利為目的的打法,引發(fā)了一系列連鎖反應(yīng):2025年1月,受DeepSeek影響,英偉達(dá)股價(jià)單日下跌近18%;3月,美國(guó)政府多次點(diǎn)名DeepSeek,建議封禁;5月,微軟在參議院聽證會(huì)上明確禁止員工使用DeepSeek產(chǎn)品,理由是“數(shù)據(jù)安全”和“宣傳內(nèi)容風(fēng)險(xiǎn)”。

圖注:來(lái)自抱抱臉聯(lián)合創(chuàng)始人的認(rèn)可圖注:來(lái)自抱抱臉聯(lián)合創(chuàng)始人的認(rèn)可

從社區(qū)反饋來(lái)看,DeepSeek模型的可用性極高。截至今年5月,開發(fā)者基于R1模型創(chuàng)建的“衍生模型”已超過500個(gè),總下載量突破250萬(wàn)次。這種“實(shí)用主義開源”反而提升了模型影響力。

責(zé)任編輯:武曉燕 來(lái)源: 大數(shù)據(jù)文摘
相關(guān)推薦

2025-05-29 09:07:37

2025-06-17 15:16:15

DeepSeekClaude 4AI

2025-03-06 09:55:49

2025-04-22 09:12:00

AI模型數(shù)據(jù)

2025-04-29 09:06:00

2025-02-18 08:15:03

2025-06-17 09:09:00

2025-03-26 09:12:59

DeepSeek VChat2BISQL

2025-04-29 10:39:46

2025-03-10 08:10:00

AI研究安全

2025-02-03 14:17:27

2025-02-19 08:00:00

2025-02-13 08:51:23

DeepSeek大模型

2025-02-13 01:00:00

2025-06-17 17:14:01

DeepSeekSOTA開源

2025-04-29 08:14:14

2025-03-25 09:48:22

2025-02-08 09:44:11

DeepSeekAI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)