還記得前陣子的 DeepSeek-V3.1 嗎?那一版已經(jīng)把上下文記憶力拉到 128K,相當于“過目不忘”的小強記憶。
現(xiàn)在,DeepSeek 團隊又放大招了 —— DeepSeek-V3.2-Exp。這次升級,不光能打,還特別“省電”。

?? 1. DSA:AI 的“共享 WiFi”模式
新版本的核心黑科技,叫 DSA(Distributed Shared Attention)。
簡單理解:
以前,每個 Query(問題)都要單獨配一套 Key-Value(答案線索),就像宿舍里每個人都得裝一個路由器,麻煩還浪費電。
現(xiàn)在,DSA 讓多個 Query 共享同一套 Key-Value,相當于整棟宿舍都能用一個大功率 WiFi,速度還更快。
好處是啥?
算力更?。荷僭熘貜?fù)連接。
效率更高:一次計算,大家共享。
更穩(wěn):模型在處理長文本時不卡頓。
?? 2. 評測結(jié)果:又快又穩(wěn)
來看官方放出的評測圖??
訓(xùn)練更穩(wěn)(圖 2):

DeepSeek-V3.2 在兩個任務(wù)(BrowseComp & SWE Verified)上的曲線更平滑,表現(xiàn)穩(wěn)步上升,就像心電圖一樣——不亂跳,說明學(xué)得很扎實。
省電更猛(圖 3):


以前模型的算力消耗是 平方級 O(L2),L 越長,計算壓力爆炸。
V3.2 換成 O(Lk),壓力直降。結(jié)果是:
預(yù)填充更快:丟進長文檔,不卡;
解碼更省電:輸出大段內(nèi)容,更輕松。
實戰(zhàn)還在驗證中:
團隊說了,內(nèi)部測試沒問題,但接下來要在真實業(yè)務(wù)場景里繼續(xù)跑,看看在復(fù)雜環(huán)境下還能不能保持穩(wěn)定。
?? 3. 開發(fā)者福利:API 價格砍半!
不僅模型更省電,API 價格也大跳水??
輸入(Input):
Cache hit:從 $0.07 → $0.028
Cache miss:從 $0.56 → $0.28
輸出(Output):
從 $1.68 → $0.42
簡單說,就是 成本腰斬。對開發(fā)者來說,這波升級不僅更快更穩(wěn),還更省錢。
?? 4. 總結(jié)一句
DeepSeek-V3.2 = 聰明 + 省電 + 穩(wěn)定 + 便宜。

既提升了算力效率,又保證了長文本處理能力,還把 API 價格打下來。對個人開發(fā)者和企業(yè)來說,幾乎就是“真香”升級。
?? 小問題拋給你:
你覺得 AI 的價格降到什么程度,才算真正“普及”?































