DeepSeek 火爆了,主打高性能低價(jià)格!
大家好,我是君哥。春節(jié)快樂!
春節(jié)這幾天,DeepSeek 可以說是火爆了,鋪天蓋地都是 DeepSeek 的報(bào)道。今天,我們一起學(xué)習(xí)一下 DeepSeek。
1.DeepSeek 是什么?
下面是 DeepSeek 給出的回答:
圖片
可以看到,DeepSeek 成立時(shí)間并不長,但是成績真的很好。
2.DeepSeek 為什么牛?
DeepSeek 橫空出世,一下子受到全球關(guān)注,1 月 27 日美股閃崩,AI 第一股英偉達(dá)最高跌幅達(dá) 17%,國內(nèi) AI 用戶這個(gè)春節(jié)都在體驗(yàn) DeepSeek,DeepSeek 服務(wù)器甚至卡到宕機(jī)。這到底是什么力量在推動(dòng)呢?
2.1 國產(chǎn)
國內(nèi)的 AI 用戶群體非常大,但我們使用 ChatGPT 并不方便,購買賬號,翻墻,經(jīng)常有被封號的危險(xiǎn)。
有了 DeepSeek,我們使用非常便捷,手機(jī)上下載一個(gè) APP,我們就可以使用 DeepSeek 的 AI 服務(wù)了。
2.2 便宜
ChatGPT o1 完成一次訓(xùn)練,成本要上億美刀,而 DeepSeek 完成一次訓(xùn)練只要不到 600 萬美刀。這真的太便宜了,成本低就是一個(gè)巨大的優(yōu)勢。
DeepSeek 成本優(yōu)勢大大超過了硅谷科技巨頭,所以英偉達(dá)股價(jià)大跌是可以理解的。
那 DeepSeek 給用戶的價(jià)格怎么樣呢?官網(wǎng)價(jià)格見下圖:
deepseek-chat 百萬 tokens 緩存命中的情況下,輸入價(jià)格只要 0.1 元人民幣,而知名的 Claude 3.5 百萬 tokens 輸入價(jià)格則需要 3 美元。這差距太大了。
2.3 技術(shù)優(yōu)勢
其實(shí),在 2022 年,中國已經(jīng)被美過禁止高端 GPU 的出口,這對國內(nèi)訓(xùn)練大模型是非常不利的。
DeepSeek 只能靠自主創(chuàng)新,研發(fā)出 DeepSeek-R1(智能助手,擅長復(fù)雜推理與多輪對話)和 DeepSeek-V2(MoE混合專家模型,兼顧高性能與低成本)。
DeepSeek 大模型架構(gòu)則采用 MoE 技術(shù),較同類模型推理成本降低 80%,而且支持長上下文。那什么是 MoE 架構(gòu)呢?我們看一下 DeepSeek 的回答:
圖片
總結(jié)一下,就是多個(gè)專家共同來回答一個(gè)問題,這個(gè)問題會根據(jù)領(lǐng)域知識分配不同的權(quán)重給各個(gè)專家,然后把每個(gè)專家的答案進(jìn)行匯總后輸出。
2.4 性能優(yōu)勢
DeepSeek 發(fā)布的 DeepSeek-R1 性能對標(biāo) OpenAI o1 正式版,這的確是一個(gè)了不起的成績。
圖片
2.5 開源
我們平時(shí)做 Java 應(yīng)用開發(fā),使用的框架多數(shù)是開源的,都很好用,生態(tài)也很完備。開源對生態(tài)的發(fā)展作用太大了。
一方面,開源可以讓更多優(yōu)秀的開發(fā)者加入進(jìn)來,貢獻(xiàn)自己的力量。另一方面,可以讓自己的開發(fā)人員釋放出來,更多地關(guān)注創(chuàng)新、方向等重要的事情,降低開發(fā)成本。
諷刺的是,從 ChatGPT 3.0 開始,“OpenAI” 變?yōu)榱?“CloseAI”,從開源變成閉源了。主要原因應(yīng)該還是訓(xùn)練模型的成本太高了,如果開源,自己付出的這些成本都免費(fèi)給了別人,要我自己負(fù)責(zé)這件事,可能也不太愿意開源。
但是 DeepSeek 不一樣,它的成本低了很多,選擇開源,正好可以彌補(bǔ)公司內(nèi)部研發(fā)資源有限的問題。相信 DeepSeek 的生態(tài)會很快發(fā)展起來,而且會發(fā)展很好。
當(dāng)然,可能有人會覺得 DeepSeek 如果開源了自己的大模型,怎么賺錢?
如果在公司用過阿里云的服務(wù),就會發(fā)現(xiàn),雖然好多技術(shù)是開源的,比如 Nacos,RocketMQ,但企業(yè)交的維護(hù)費(fèi)用并不低。比如定制化開發(fā)、技術(shù)問題支持等。只要 DeepSeek 把生態(tài)建立起來,提供企業(yè)級應(yīng)用,賺錢的途徑還是很多的。
3.是國運(yùn)級嗎?
《黑神話:悟空》制作人馮驥點(diǎn)評 DeepSeek 是一款國運(yùn)級的科技成果,當(dāng)然 DeepSeek 官方還找到馮驥,建議對博文的措辭做一些修改。
看下 DeepSeek 的回答:
圖片
我覺得說 DeepSeek 是一款國運(yùn)級的科技成果,并不浮夸。當(dāng)下各個(gè)國家都在發(fā)力 AI,能早先實(shí)現(xiàn) AGI(通用人工智能),對國家各個(gè)領(lǐng)域都會有大的幫助,比如軍事、醫(yī)療、生物等
4.美國控訴?
1 月 27 日,Deepseek 應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi) APP 下載排行榜,甚至在美區(qū)下載榜上超越了 ChatGPT。
這樣大的一個(gè)動(dòng)靜,美國肯定關(guān)注到了,何況他們都不過春節(jié)。
據(jù)參考消息援引美媒報(bào)道,美國海軍基于“潛在安全和道德問題”,已要求人員避免以任何形式使用 DeepSeek 模型。
美國多名官員回應(yīng) DeepSeek 對美國的影響,蔑稱 DeepSeek 是“偷竊”,正對其影響開展國家安全調(diào)查。
1月27日、1月28日,DeepSeek 官網(wǎng)顯示,其線上服務(wù)受到大規(guī)模惡意攻擊,奇安信安全專家透露攻擊 IP 均來自美國。
5.總結(jié)
無論如何,DeepSeek 在春節(jié)假期火爆了,它的發(fā)展值得更大期待。