偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

^{<blockquote id="a5uq1"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試

發(fā)布于 2025-6-11 06:39

瀏覽

0收藏

在數(shù)字化辦公席卷全球的今天，文檔解析技術(shù)已成為企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵瓶頸。面對海量的合同、報(bào)告、論文等文檔資料，傳統(tǒng)解決方案要么速度緩慢，要么錯(cuò)誤百出。5月22日，字節(jié)跳動(dòng)開源的全新文檔解析模型Dolphin橫空出世，憑借僅322M參數(shù)的輕量級(jí)架構(gòu)，在性能上實(shí)現(xiàn)了對GPT-4.1、Claude3.5等重量級(jí)模型的全面超越！

github: https://github.com/bytedance/Dolphin

在線Demo: http://115.190.42.15:8888/dolphin

下面開始部署指南：

一、安裝依賴環(huán)境

# 下載代碼

git clone https://github.com/ByteDance/Dolphin.git
cd Dolphin


# 創(chuàng)建虛擬環(huán)境
conda create -n Dolphin  python=3.11

# 激活虛擬環(huán)境
conda activate Dolphin 


# 安裝uv

pip install uv -i https://pypi.tuna.tsinghua.edu.cn/simple/


# 修改numpy版本
先修改requirements.txt文件，否則會(huì)報(bào)錯(cuò)，報(bào)錯(cuò)信息放在了文末：
把numpy==1.24.4  改為  numpy==1.26.0


# 安裝requirements.txt依賴包

uv pip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple/

二、下載模型權(quán)重

選項(xiàng)A：原始模型格式（基于配置）

從百度云或谷歌驅(qū)動(dòng)器下載，并將它們放在。/checkpoint文件夾中。

百度網(wǎng)盤：??https://pan.baidu.com/share/init?surl=5zcARoX0CTOHKbW8bFZovQ&pwd=9rpx??

谷歌云盤：??https://drive.google.com/drive/folders/1PQJ3UutepXvunizZEw-uGaQ0BCzf-mie??

選項(xiàng)B：Huggingface模型格式

huggingface模型地址：??https://huggingface.co/ByteDance/Dolphin??

魔搭的模型地址：??https://www.modelscope.cn/models/ByteDance/Dolphin??

#從Hugging Face Hub下載模型

Git LFS安裝

git clone https://huggingface.co/ByteDance/Dolphin ./hf_model

本文采用選項(xiàng)A：原始模型格式，百度網(wǎng)盤下載模型權(quán)重，放入checkpoints 目錄中；

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

三、實(shí)戰(zhàn)測試效果

模型推理的配置文件：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

1、頁面級(jí)解析（Page-level Parsing）

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

解析單個(gè)文檔圖片（page_1.jpeg）

python demo_page.py --config ./config/Dolphin.yaml --input_path ./demo/page_imgs/page_1.jpeg --save_dir ./results

輸出結(jié)果：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

顯存占用量高達(dá)15g多；

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

處理一個(gè)目錄中的所有文檔圖像

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

json和md文件都會(huì)生成一份；

python demo_page.py --config ./config/Dolphin.yaml --input_path ./demo/page_imgs --save_dir ./results

運(yùn)行日志截圖：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

顯存截圖：顯存占用量最高達(dá)到17g；

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

2、元素級(jí)解析（Element-level Parsing）

Using Original Framework (config-based)

# Process a single table image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/table_1.jpeg --element_type table

# Process a single formula image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/line_formula.jpeg --element_type formula

# Process a single text paragraph image
python demo_element.py --config ./config/Dolphin.yaml --input_path ./demo/element_imgs/para_1.jpg --element_type text

# Process a single table image 顯存截圖

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

# Process a single formula image 顯存截圖

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

1、單個(gè)段落處理

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

結(jié)果：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

2、單個(gè)表格處理

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

結(jié)果：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

把md文件，在線解析一下看看，表格還原程度如何：

模型解析的md結(jié)果：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

原始圖片的：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

結(jié)果竟然是正確的，效果很厲害！

3、單行公式處理

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

結(jié)果：

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

字節(jié)開源Dolphin文檔解析模型-部署指南+實(shí)戰(zhàn)測試-AI.x社區(qū)

部署中常見的錯(cuò)誤：

numpy==1.24.4 與opencv-pythnotallow==4.11.0.86 版本沖突的報(bào)錯(cuò)信息：

and opencv-pythnotallow==4.11.0.86 depends on numpy>=1.26.0, we can conclude that opencv-pythnotallow==4.11.0.86 depends on numpy>=1.26.0.

And because you require numpy==1.24.4 and opencv-pythnotallow==4.11.0.86, we can conclude that your requirements are unsatisfiable.

解決方案：

修改numpy版本

先修改requirements.txt文件：

把numpy==1.24.4 改為 numpy==1.26.0

總結(jié)：本文手把手教學(xué)，從零開始安裝Dolphin項(xiàng)目，使用官方示例代碼，測試過程中發(fā)現(xiàn)，元素級(jí)解析顯存占用5G左右，頁面級(jí)解析顯存占用到達(dá)17G，這個(gè)確實(shí)令人驚訝，不過看著效果還可以的，尤其是表格解析，挺不錯(cuò)的，快來一起本地部署使用吧！

本文轉(zhuǎn)載自??????AI小新??????，作者：AI小新

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

Meta公司開源大數(shù)據(jù)模型SAM實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 3532瀏覽 ? 0回復(fù)
GraphRAG + Ollama 本地部署全攻略：避坑實(shí)戰(zhàn)指南

玄姐聊AGI ? 1.2w瀏覽 ? 0回復(fù)
GraphRAG + Ollama 本地部署全攻略：避坑實(shí)戰(zhàn)指南

玄姐聊AGI ? 8456瀏覽 ? 0回復(fù)
RAG文檔解析器，核心技術(shù)剖析

小虎哦哦 ? 3670瀏覽 ? 0回復(fù)
微調(diào)谷歌開源Gemini Flash模型實(shí)現(xiàn)PII脫敏實(shí)戰(zhàn)

51CTO內(nèi)容精選 ? 3339瀏覽 ? 0回復(fù)
探秘大語言模型數(shù)據(jù)合成能力：AgoraBench基準(zhǔn)測試全解析

十一月雨_55 ? 2937瀏覽 ? 0回復(fù)
文檔解析技術(shù)指南：從傳統(tǒng)Pipeline到端到端大模型

Baihai_IDP ? 3178瀏覽 ? 0回復(fù)
操作指南：如何部署AI進(jìn)行實(shí)時(shí)內(nèi)容審核

51CTO內(nèi)容精選 ? 4296瀏覽 ? 0回復(fù)
部署滿血DeepSeek R1的避坑指南-vLLM 0.7.1

NLP工作站 ? 7813瀏覽 ? 0回復(fù)
DeepSeek R1 全系列模型部署指南

芝士AI吃魚 ? 9764瀏覽 ? 0回復(fù)
allenai開源多模態(tài)的文檔智能解析大模型（OLMOCR）方法、效果淺析

大模型自然語言處理 ? 4170瀏覽 ? 0回復(fù)
文檔解析神器MinerU：2.5萬星標(biāo)！支持GPU加速，輕松應(yīng)對復(fù)雜文檔

AI博物院 ? 8302瀏覽 ? 0回復(fù)
AI 代理開發(fā)全攻略：從構(gòu)思到落地的實(shí)戰(zhàn)指南

Halo咯咯 ? 2390瀏覽 ? 0回復(fù)
DeepSeek 部署全解析：三種方案對比與云端部署的顯著優(yōu)勢

AI算力補(bǔ)給站 ? 1925瀏覽 ? 0回復(fù)
RAG實(shí)戰(zhàn) | 向量數(shù)據(jù)庫LanceDB指南

周末程序猿 ? 2338瀏覽 ? 0回復(fù)
OWL Agent 實(shí)戰(zhàn)指南：零成本打造你的全能開源 AI 打工人

墨風(fēng)如雪小站 ? 1915瀏覽 ? 0回復(fù)
Agent 部署全解析：LangGraph團(tuán)隊(duì)實(shí)戰(zhàn)洞察

ermulong ? 1355瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)2步突破，復(fù)雜文檔布局解析，為啥如此驚艷？

CourseAI ? 950瀏覽 ? 0回復(fù)
字節(jié)開源的多模態(tài)端到端文檔解析模型-Dolphin

大模型自然語言處理 ? 1165瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

LightRAG：顛覆傳統(tǒng)AI問答，一張“知識(shí)網(wǎng)”讓大模型真正開竅！ 9天前發(fā)布
探索 RAGFlow：開源 RAG 引擎的新力量，star高達(dá)55k+的開源項(xiàng)目 2025-06-24 06:43:20發(fā)布

熱門推薦

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

重磅！英偉達(dá)宣布H20芯片即將恢復(fù)對華銷售，并計(jì)劃推出全新GPU 0回復(fù)

將智能植根于運(yùn)動(dòng)之中——從AI模型到具身智能的下一個(gè)躍遷 0回復(fù)

實(shí)測AntV Chart MCP 和DataV Atlas GIS MCP 1回復(fù)

RAG：7個(gè)檢索增強(qiáng)生成技術(shù)的解析（含實(shí)現(xiàn)代碼） 0回復(fù)

上一篇：大模型是什么？大模型 vs 小模型：AI界的‘超人’和‘特種兵’有什么區(qū)別？

下一篇：探索 RAGFlow：開源 RAG 引擎的新力量，star高達(dá)55k+的開源項(xiàng)目

社區(qū)精華內(nèi)容

目錄

^{<blockquote id="zehrz"><i id="zehrz"></i></blockquote>}<style id="zehrz"></style>

<style id="zehrz"></style>

<legend id="zehrz"><track id="zehrz"></track></legend>