偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

深夜突襲！DeepSeek-R1 重磅升級(jí)：媲美 OpenAl 最高 o3 模型，編碼能力直逼 Claude 4

2025-05-30 01:00:00

官方稱這是一次“minor update”，但社區(qū)反饋卻指向另一種結(jié)論：在代碼生成、長(zhǎng)時(shí)推理、格式控制等任務(wù)上，這個(gè)版本的 R1 的能力已經(jīng)“近乎o3級(jí)別”。

5月28日凌晨，DeepSeek 在 Hugging Face 上開源了其更新版的 R1 模型。

此次更新并未更改名稱，只在模型路徑中標(biāo)注“0528”以作區(qū)分。

圖源deepseek

官方稱這是一次“minor update”，但社區(qū)反饋卻指向另一種結(jié)論：在代碼生成、長(zhǎng)時(shí)推理、格式控制等任務(wù)上，這個(gè)版本的 R1 的能力已經(jīng)“近乎o3級(jí)別”。

而官方的口風(fēng)是：“DeepSeek-R1 的性能據(jù)稱已對(duì)齊 OpenAI 的 o1 正式版本，其蒸餾出的輕量模型甚至在多個(gè)任務(wù)上超越了 o1-mini?！?/span>

圖片

圖注：推特網(wǎng)友在經(jīng)典物理模擬測(cè)試中，對(duì)DeepSeek-R1新舊版本的對(duì)比

經(jīng)國內(nèi)微博用戶實(shí)測(cè)：編碼能力已經(jīng)可以和Claude 4 掰手腕了。

圖片

此外，此次發(fā)布不僅涵蓋了權(quán)重、配置與模型文檔，也同步上線了 App、官網(wǎng)及 API 調(diào)用服務(wù)，接口對(duì)開發(fā)者開放。R1 使用 MIT 許可證發(fā)布，允許商用，也允許使用其輸出結(jié)果進(jìn)行模型蒸餾。

圖片

圖注：官方稱，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，性能比肩 OpenAI o1 正式版。圖源deepseek

這是中國大模型廠商中，少數(shù)同時(shí)在算法、產(chǎn)品與授權(quán)層面做“全棧開源”的公司之一。

從 R1 到 R1-0528：推理能力的重點(diǎn)優(yōu)化

據(jù)官方信息，此次更新的 R1 模型（標(biāo)注版本為0528）參數(shù)規(guī)模約為660B，在訓(xùn)練后期大量采用強(qiáng)化學(xué)習(xí)技術(shù)，以少量標(biāo)注數(shù)據(jù)優(yōu)化模型在數(shù)學(xué)、編程和語言推理等任務(wù)上的表現(xiàn)。

雖然官方并未披露系統(tǒng)性基準(zhǔn)測(cè)試結(jié)果，但多個(gè)國內(nèi)外開發(fā)者社區(qū)實(shí)測(cè)顯示，R1-0528 在代碼生成和復(fù)雜推理任務(wù)中具備穩(wěn)定輸出能力。

根據(jù)用戶測(cè)試，在 LiveCodeBench 編程測(cè)試環(huán)境中，R1-0528 在多個(gè)任務(wù)上表現(xiàn)接近 OpenAI o3-mini（High 模式）和 o4-mini（Medium 模式）。不過，目前尚無該基準(zhǔn)的官方排行榜對(duì)這一說法予以印證。

圖注：推特用戶測(cè)試

尤其在長(zhǎng)鏈條邏輯題中，開發(fā)者觀察到模型可進(jìn)行多達(dá)20余步的符號(hào)化推理，且過程中結(jié)構(gòu)一致性較好。在部分測(cè)試場(chǎng)景中，模型思考處理時(shí)間可持續(xù)數(shù)十分鐘。

與多數(shù)開源模型不同，DeepSeek-R1 的另一特征在于其明確允許并鼓勵(lì)“模型蒸餾”。

官方同步開源了兩個(gè)660B規(guī)模的大模型（DeepSeek-R1 與 DeepSeek-R1-Zero），并基于其推理輸出訓(xùn)練了6個(gè)不同規(guī)模的子模型，其中 32B 與 70B 兩個(gè)中型版本，在多個(gè)通用能力維度上據(jù)稱“可對(duì)標(biāo) OpenAI o1-mini”。不過相關(guān)測(cè)試細(xì)節(jié)與完整評(píng)估方法尚未公開，仍待進(jìn)一步驗(yàn)證。

開源了6個(gè)小模型。圖源deepseek

對(duì)比之下，這種“從大模型生成小模型”的思路，也讓 DeepSeek 的開源策略更貼近“可部署”的實(shí)際場(chǎng)景，而非僅停留在評(píng)測(cè)表現(xiàn)層。

目前，這些模型均已上傳至 Hugging Face，且標(biāo)注為 MIT License，意味著任何企業(yè)與開發(fā)者均可在不經(jīng)授權(quán)的前提下用于商用或二次開發(fā)。

圖片

論文鏈接：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

在產(chǎn)品層面，用戶可通過“深度思考”模式直接體驗(yàn) R1 推理能力，在 App 或網(wǎng)頁端完成任務(wù)調(diào)用。API 接入方式為 model='deepseek-reasoner'，并提供明確定價(jià)策略：百萬 tokens 的輸入成本為 1 元（緩存命中）至 4 元（未命中），輸出成本為每百萬 tokens 16 元。

圖片

抱抱臉鏈接：https://huggingface.co/deepseek-ai

關(guān)于Deepseek：爭(zhēng)氣的國產(chǎn)AI

今年，DeepSeek突然登上全球AI舞臺(tái)。

它的聊天應(yīng)用一度沖上蘋果和安卓商店的榜首，背后的模型在多個(gè)基準(zhǔn)測(cè)試中超越Meta Llama和OpenAI GPT-4o，吸引了華爾街分析師和硅谷技術(shù)官員的罕見一致關(guān)注。微軟將其接入Azure，英偉達(dá)CEO稱其“創(chuàng)新出色”。

DeepSeek起初并不做 AI 模型，它的母公司是量化基金“九坤投資”，創(chuàng)始人梁文鋒是浙江大學(xué)出身的 AI 愛好者。2015年開始試水交易系統(tǒng)，2019年正式設(shè)立對(duì)沖基金。在量化交易中摸索多年的算法團(tuán)隊(duì)，成為日后DeepSeek模型訓(xùn)練的基礎(chǔ)。

DeepSeek Founder Liang Wenfeng

2023年，九坤成立DeepSeek Lab，作為科研獨(dú)立體。彼時(shí)正值中國AI創(chuàng)業(yè)熱潮復(fù)燃，百度、字節(jié)、阿里、MiniMax、月之暗面先后發(fā)布通用大模型。DeepSeek一開始就選了一條不一樣的路：自建數(shù)據(jù)中心、強(qiáng)調(diào)計(jì)算效率，并迅速在一年內(nèi)迭代三代模型。

DeepSeek V2于2024年春天發(fā)布，以“推理能力”突出出圈。相比同行更重堆參數(shù)、跑分的路徑，DeepSeek強(qiáng)調(diào)模型在復(fù)雜任務(wù)下的“思考能力”——數(shù)學(xué)、物理、代碼，正是V2和后續(xù)R1模型發(fā)力的重點(diǎn)。

V3版本上線于2024年末，DeepSeek宣稱它在內(nèi)測(cè)中超越了OpenAI的GPT-4o。2025年1月，DeepSeek-R1問世，定位為“reasoning model”。它在 Hugging Face 上以MIT協(xié)議發(fā)布，成為業(yè)內(nèi)少見能商業(yè)化改造的高性能模型之一。

一方面，DeepSeek通過模型架構(gòu)優(yōu)化和訓(xùn)練效率提升，大幅壓縮了推理成本。另一方面，它在市場(chǎng)價(jià)格上極為激進(jìn)：不少模型免費(fèi)開放、接口調(diào)用價(jià)格低于行業(yè)平均值，甚至迫使阿里、字節(jié)等國內(nèi)玩家降價(jià)或免費(fèi)開放部分模型。

這也引發(fā)了對(duì)其商業(yè)模式的質(zhì)疑。截至目前，DeepSeek并未公開融資輪次，也尚未啟動(dòng)商業(yè)化路徑。據(jù)接近公司人士透露，其運(yùn)營主要依賴母公司九坤提供的算力和資金資源。相比依靠云廠商和VC支持的AI創(chuàng)業(yè)者，DeepSeek的路線更像是“實(shí)驗(yàn)室模式”。

這種不以盈利為目的的打法，引發(fā)了一系列連鎖反應(yīng)：2025年1月，受DeepSeek影響，英偉達(dá)股價(jià)單日下跌近18%；3月，美國政府多次點(diǎn)名DeepSeek，建議封禁；5月，微軟在參議院聽證會(huì)上明確禁止員工使用DeepSeek產(chǎn)品，理由是“數(shù)據(jù)安全”和“宣傳內(nèi)容風(fēng)險(xiǎn)”。

圖注：來自抱抱臉聯(lián)合創(chuàng)始人的認(rèn)可

從社區(qū)反饋來看，DeepSeek模型的可用性極高。截至今年5月，開發(fā)者基于R1模型創(chuàng)建的“衍生模型”已超過500個(gè)，總下載量突破250萬次。這種“實(shí)用主義開源”反而提升了模型影響力。

責(zé)任編輯：武曉燕來源：大數(shù)據(jù)文摘

DeepSeek-R OpenAl o3 模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<big id="wcfpy"></big>

<button id="wcfpy"><mark id="wcfpy"></mark></button>

<blockquote id="wcfpy"><tfoot id="wcfpy"><source id="wcfpy"></source></tfoot></blockquote>

<blockquote id="wcfpy"></blockquote>

<wbr id="wcfpy"><menu id="wcfpy"></menu></wbr>