DeepSeek 新模型 R1-0528 悄悄開源,與o3 相當,實測來了 精華
Hi,這里是Aitrainee,歡迎閱讀本期新文章。
DeepSeek 團隊悄無聲息地放出了他們推理模型的新升級版:DeepSeek R1。
更準確地說,是 DeepSeek R1-0528。
這新模型是今天凌晨在 Hugging Face 上出現(xiàn)的,連個正經(jīng)官宣都沒有,直接 MIT 協(xié)議開源。
Hugging Face 頁面上,社區(qū)已經(jīng)開始幫忙補 Readme、提調(diào)整了,官方的博客估計也快了。
項目地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
但從初步的反饋看,這模型挺猛,比原來的 DeepSeek 在長期推理、智能程度和真實世界應用方面都有提升。
更詳細的,扒扒它的配置,大概是這么回事:
- 還是基于他們DeepSeek-V3-0324模型。
- 核心還是那個“思維鏈 (Chain of Thought)”推理,一步步展示邏輯過程,比較透明。
- 主攻方向沒變:數(shù)學問題、編程挑戰(zhàn)、科學研究。
- 架構進化了,但沒大改:還是混合專家 (MoE) 設計,671B 總參數(shù),每次只激活 37B,效率高。
- 訓練方法有改進:用了大規(guī)模強化學習 + 冷啟動數(shù)據(jù),解決了之前 R1 模型的一些毛病,比如無限重復、可讀性差。
從社區(qū)曝出的LiveCodeBench基準測試成績來看
新的 Deepseek R1-0528 的性能幾乎與 LiveCodeBench 基準測試中的 o3 (High) 相當。
有網(wǎng)友做了一個精簡版的總結,說它:
能像谷歌模型一樣深度推理。
文本生成優(yōu)化了,更自然,格式更好。
推理風格獨特:不求快,但更嚴謹周密。
支持長時間思考:單任務處理時長能達到 30-60 分鐘。
上手實測:
官方說這新模型能在復雜問題上花更長時間思考。
我們來直接上Prompt
第一個測試提示詞如下:
效果:
挺不錯的。
提供一組簡單的數(shù)據(jù)(例如,過去一周每天的AI工具使用時長),要求模型用D3.js或Chart.js生成一個交互式的柱狀圖或折線圖,鼠標懸停時顯示具體數(shù)值,并帶有簡單的動畫效果和自定義顏色方案。
這個一步到位,效果很不錯。
下面90年代早期個人主頁:
我想用 HTML 和 CSS 創(chuàng)建一個具有“90年代早期個人主頁”風格的“訪客留言板”區(qū)域的靜態(tài)模擬。
風格要求:
背景顏色可以考慮使用亮色或帶有簡單圖案的平鋪背景(如果能用 CSS 實現(xiàn))。
字體選擇:使用像素字體或類似 Comic Sans, Times New Roman 的復古字體。
邊框:元素邊框可以使用明顯的 3D 浮雕效果 (inset/outset) 或簡單的粗線條。
顏色:可以使用飽和度較高的、略顯“刺眼”的顏色組合。
包含元素:一個標題 "Guestbook!",一個“提交留言”按鈕。這些都是靜態(tài)展示,不需要真實功能。
請用 HTML, CSS, 和 JavaScript 實現(xiàn)一個簡單的圖片輪播/幻燈片組件。
魯迅文筆仿寫:
根據(jù)部分信息進行推斷和補全 (故事補全):
這是一個故事的開頭:
“偵探哈里森站在空蕩蕩的畫廊中央,價值連城的鉆石項鏈‘深海之星’不翼而飛。唯一的線索是地板上散落的幾片奇異的藍色羽毛,以及一個被強行撬開的保險柜,旁邊放著一杯還冒著熱氣的紅茶……”
請你根據(jù)這個開頭,繼續(xù)把這個故事寫下去,嘗試推斷竊賊可能的作案手法、身份特征,并最終揭開謎底。
故事需要包含懸念、推理過程和合理的結局。字數(shù)在 800-1200 字左右。
請注意細節(jié)的邏輯性和一致性。
網(wǎng)友:這是唯一一個能持續(xù)正確做對「9.9 - 9.11是多少」的模型。
與Claude4對比:不管是光線照射在墻上形成的漫反射,還是球在撞擊后的運動方向,R1勝:
怎么用上這新模型?
可以通過 DeepSeek 官方 API,或者去 OpenRouter 搞個免費 API (也有付費版,沒速率限制)。
本文轉載自?????AI進修生?????,作者:Aitrainee
