偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<var id="guf9n"><optgroup id="guf9n"></optgroup></var>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

DeepSeek新模型再次引爆外網(wǎng)！“省錢省token”背后，揭示了智能的本質(zhì) 原創(chuàng)

算家計(jì)算

發(fā)布于 2025-10-21 18:43

瀏覽

0收藏

?

昨天，DeepSeek開源了全新的DeepSeek-OCR模型，采用“上下文光學(xué)壓縮”技術(shù)，為解決長(zhǎng)文本處理中的算力瓶頸提供了全新的思路。

?

DeepSeek新模型再次引爆外網(wǎng)！“省錢省token”背后，揭示了智能的本質(zhì)-AI.x社區(qū)

?

DeepSeek-OCR的核心創(chuàng)新在于它驗(yàn)證了一個(gè)直觀卻從未被系統(tǒng)論證過的假設(shè)：一張包含文檔文本的圖像，可以用比等效數(shù)字文本少得多的token來表示豐富信息。

?

簡(jiǎn)單來說，這個(gè)模型的核心思想是：用一張包含文檔的圖片，以比原始文本少得多的token數(shù)來表示相同的信息。
?

它不是在傳統(tǒng)OCR賽道上做簡(jiǎn)單優(yōu)化，而是試圖通過視覺模態(tài)來實(shí)現(xiàn)文本信息的高效壓縮。

?

實(shí)驗(yàn)數(shù)據(jù)顯示，在10倍壓縮比下，模型解碼精度能達(dá)到97%，即使壓縮到20倍，準(zhǔn)確率也保持在60%左右。這種壓縮效率在長(zhǎng)文本處理場(chǎng)景下潛力巨大。

?

技術(shù)架構(gòu)方面，DeepSeek-OCR由DeepEncoder視覺編碼器和基于MoE架構(gòu)的3B參數(shù)解碼器組成。特別值得一提的是DeepEncoder的設(shè)計(jì)，它結(jié)合了SAM-base和CLIP-large，既能處理高分辨率輸入，又能保持較低的激活狀態(tài)，最終生成數(shù)量適中的視覺token。

?

在實(shí)際應(yīng)用層面，這個(gè)模型的表現(xiàn)相當(dāng)出色。在OmniDocBench基準(zhǔn)測(cè)試中，僅用100個(gè)視覺token就超越了GOT-OCR2.0（需要256個(gè)token），用不到800個(gè)token就優(yōu)于MinerU2.0（需要近7000個(gè)token）。這種效率提升意味著單張A100 GPU每天能生成超過20萬頁的訓(xùn)練數(shù)據(jù)。

?

DeepSeek新模型再次引爆外網(wǎng)！“省錢省token”背后，揭示了智能的本質(zhì)-AI.x社區(qū)
?

除了傳統(tǒng)的文檔識(shí)別，模型還展現(xiàn)出對(duì)圖表、幾何圖形、化學(xué)公式的解析能力，支持近百種語言識(shí)別，并具備一定的通用圖像理解能力。

?

DeepSeek的新模型，在外網(wǎng)也引發(fā)了熱烈討論。特斯拉前自動(dòng)駕駛負(fù)責(zé)人、OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy對(duì)DeepSeek新開源的模型給予高度評(píng)價(jià)，他認(rèn)為，這項(xiàng)技術(shù)可能撼動(dòng)了當(dāng)前大語言模型（LLM）處理文本的基礎(chǔ)范式。
?
DeepSeek新模型再次引爆外網(wǎng)！“省錢省token”背后，揭示了智能的本質(zhì)-AI.x社區(qū)
?
同時(shí)，Karpathy的評(píng)價(jià)還觸及了當(dāng)前AI領(lǐng)域關(guān)注的幾個(gè)深層次問題：
?
首先是重新審視輸入方式。Karpathy強(qiáng)調(diào)，他感興趣的并非DeepSeek-OCR作為一個(gè)文字識(shí)別工具的性能，而是一個(gè)更根本的問題：對(duì)于大語言模型（LLM）來說，像素是否比文本是更好的輸入形式？
?
他甚至激進(jìn)地提出，“也許更合理的是，LLM的所有輸入都應(yīng)該是圖像。即使碰巧有純文本輸入，你更應(yīng)該先渲染它，然后再輸入?！?這一觀點(diǎn)直接挑戰(zhàn)了當(dāng)前以文本Token為核心的自然語言處理范式。
?
其次，他揭示了視覺壓縮的潛力。DeepSeek-OCR模型在技術(shù)上驗(yàn)證了"上下文光學(xué)壓縮"的可行性。該模型能夠用100個(gè)視覺Token解碼出1000個(gè)文本Token（10倍壓縮），且精度保持在97%；
?
最后，他認(rèn)為這項(xiàng)研究推動(dòng)了分詞器的變革。Karpathy一直對(duì)傳統(tǒng)的分詞器持批判態(tài)度，他曾多次指出分詞器帶來的種種問題。DeepSeek-OCR的技術(shù)路徑，通過視覺編碼器直接將圖像轉(zhuǎn)換為模型可理解的表示，跳過了傳統(tǒng)分詞步驟。
?
這與Karpathy"刪除分詞器"的愿景不謀而合，也是他對(duì)此項(xiàng)技術(shù)感到興奮的重要原因。
?
Karpathy的評(píng)價(jià)為DeepSeek-OCR的熱度添了一把火，該項(xiàng)目在GitHub上線后迅速獲得了大量關(guān)注。紐約大學(xué)助理教授謝賽寧等人也對(duì)這種視覺處理方式表示了認(rèn)同。
?
當(dāng)然，也存在一些反面的聲音，例如有研究者認(rèn)為該方法并非首創(chuàng)，或質(zhì)疑其與人類漸進(jìn)式認(rèn)知方式的差異。
?
DeepSeek新模型再次引爆外網(wǎng)！“省錢省token”背后，揭示了智能的本質(zhì)-AI.x社區(qū)
?
有研究者將DeepSeek-OCR的"視覺記憶壓縮"機(jī)制與人類的記憶和認(rèn)知方式相聯(lián)系。當(dāng)我們回憶一本書的內(nèi)容時(shí)，大腦時(shí)常會(huì)借助視覺記憶，比如回憶某段話在書頁的哪個(gè)位置。這種方式與DeepSeek-OCR的處理邏輯有相似之處。
?
無論如何，這項(xiàng)工作的意義可能超出了OCR本身。它為我們提供了一種新思路：是否可以通過視覺方式來解決長(zhǎng)上下文壓縮和LLM記憶遺忘等問題？
?

雖然目前還只是初步探索，但這種跨模態(tài)的思維方法確實(shí)為后續(xù)研究打開了新的想象空間。

?

回歸智能的本質(zhì)

?

這項(xiàng)工作的真正價(jià)值或許還在于，它挑戰(zhàn)了AI領(lǐng)域的傳統(tǒng)發(fā)展路徑。在當(dāng)前大模型規(guī)模不斷膨脹、算力需求激增的背景下，DeepSeek仍然選擇通過提升效率而非單純擴(kuò)大規(guī)模來解決問題。
?

在物理世界和生物系統(tǒng)中，能量最低原則，是宇宙運(yùn)行的基本法則。這一原則普遍存在，要求系統(tǒng)以最少的能量消耗實(shí)現(xiàn)所需功能。

?

除了自然萬物，人類大腦同樣如此，它通過高效的神經(jīng)連接和信息處理機(jī)制，在有限體積和能量消耗下實(shí)現(xiàn)了驚人的智能。

?

DeepSeek-OCR通過精細(xì)的架構(gòu)設(shè)計(jì)，在保證性能的同時(shí)大幅降低資源消耗，某種程度上是對(duì)這種自然法則的技術(shù)再現(xiàn)。它不是在追求極致的壓縮率，而是在壓縮效率和信息保真度之間尋找最優(yōu)平衡。

?

智能的本質(zhì)或許不在于規(guī)模大小，而在于效率高低。人類大腦在有限的能量消耗下實(shí)現(xiàn)高度智能，本身就是宇宙能量最低原則的完美體現(xiàn)。

?

在這個(gè)算力需求不斷增長(zhǎng)的時(shí)代，DeepSeek選擇回歸基本法則，通過提升效率而非單純擴(kuò)大規(guī)模來解決問題，恰恰是更接近智能本質(zhì)的體現(xiàn)。

?

正如自然界通過億萬年的進(jìn)化找到了各種最優(yōu)解，人工智能的發(fā)展或許也需要從這些基本法則中汲取靈感。

?

而這種效率優(yōu)先的設(shè)計(jì)理念，似乎正應(yīng)合了宇宙的基本規(guī)律。在有限資源下實(shí)現(xiàn)最大化價(jià)值，這不僅是技術(shù)挑戰(zhàn)，更是智慧的本質(zhì)。

?

對(duì)于DeepSeek的新模型，大家怎么看？歡迎交流討論！

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

算家計(jì)算

租算力，到算家云

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

比Transformer更快更省，Mamba終于卷到網(wǎng)絡(luò)領(lǐng)域了

arnoldzhw ? 9076瀏覽 ? 0回復(fù)
再次提升RAG性能：兩種高效的Rerank模型實(shí)踐指南

AIGC觀察者 ? 2.7w瀏覽 ? 0回復(fù)
幻方 AI DeepSeek 模型背后的萬卡集群建設(shè)

amei2000go ? 1.2w瀏覽 ? 0回復(fù)
由淺到深，揭示ChatGPT提示詞背后的本質(zhì)，讓它火力全開

ermulong ? 3668瀏覽 ? 0回復(fù)
華盛頓大學(xué)和艾倫人工智能研究所聯(lián)手，用幽默風(fēng)趣的方式，揭示了 AI 創(chuàng)意背后的真相

AIGC最前線 ? 3878瀏覽 ? 0回復(fù)
預(yù)測(cè)未來模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵

AIGC最前線 ? 3362瀏覽 ? 0回復(fù)
預(yù)測(cè)未來模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵

AIGC最前線 ? 3599瀏覽 ? 0回復(fù)
一項(xiàng)新研究揭示關(guān)鍵原因 | 從優(yōu)勢(shì)到局限：大型語言模型的潛力與邊界

sbf_2000 ? 3170瀏覽 ? 0回復(fù)
Meta公布BLT新架構(gòu)：告別token，擁抱patch

51CTO內(nèi)容精選 ? 3237瀏覽 ? 0回復(fù)
DeepSeek 驚艷背后的技術(shù)架構(gòu)創(chuàng)新剖析

玄姐聊AGI ? 1.4w瀏覽 ? 0回復(fù)
OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距

51CTO內(nèi)容精選 ? 3150瀏覽 ? 0回復(fù)
DeepSeek太給力了！自家的大模型秘方開源到底！國(guó)產(chǎn)大模型雄起

51CTO技術(shù)棧 ? 3909瀏覽 ? 0回復(fù)
中國(guó)產(chǎn)品再次引爆全球，首個(gè)通用AI代理跑分超OpenA1!最全梳理來了!

51CTO技術(shù)棧 ? 3467瀏覽 ? 0回復(fù)
DeepSeek開源新版V3，再次震驚國(guó)外

Aceryt ? 2965瀏覽 ? 0回復(fù)
DeepSeek與Qwen組團(tuán)開源了模型，沖!

PaperAgent ? 3120瀏覽 ? 0回復(fù)
開發(fā)者新選擇：用DeepSeek實(shí)現(xiàn)Cursor級(jí)智能編程的免費(fèi)方案

程序設(shè)計(jì)實(shí)驗(yàn)室 ? 3089瀏覽 ? 0回復(fù)
LeCun有了新證據(jù)！大模型思考與人類思考存在本質(zhì)差別

Syrupup ? 2710瀏覽 ? 0回復(fù)
玩轉(zhuǎn)DeepSeek V3.1更新引爆國(guó)產(chǎn)芯片發(fā)展新機(jī)遇

數(shù)智飛輪 ? 2837瀏覽 ? 0回復(fù)
字節(jié)的這個(gè)新模型，牛了！

NLP前沿1 ? 3865瀏覽 ? 0回復(fù)

算家計(jì)算

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

別再怪AI“聽不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對(duì)話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇：破5億用戶！國(guó)產(chǎn)AI模型成功逆襲，成為AI普及浪潮主角

下一篇：重磅！OpenAI正式入局瀏覽器大戰(zhàn)，首款A(yù)I瀏覽器能否取代Chrome？

社區(qū)精華內(nèi)容

目錄