幾款開源的OCR識(shí)別項(xiàng)目,收藏備用
隨著科技的發(fā)展,OCR場(chǎng)景隨處可見,很多APP也集成如身份證識(shí)別,銀行卡識(shí)別的功能,包括微信都支持截圖文件中的文字提取?,F(xiàn)在,各大廠商均有提供各種場(chǎng)景的OCR識(shí)別的API。但是,有時(shí)候我們也想自己來折騰一下。這時(shí)候,就可以借助一些主流開源框架來快速達(dá)到我們的目的。
OCR引擎
tesseract
Tesseract,一款由HP實(shí)驗(yàn)室開發(fā)由Google維護(hù)的開源OCR引擎,開源,免費(fèi),支持多語言,多平臺(tái);

??https://github.com/tesseract-ocr/tesseract.git??
tesseract.js
js版本的Tesseract OCR,支持一百多種語言,使用也是非常簡(jiǎn)單,可以用npm安裝,也可以直接在頁面引用js


??https://github.com/naptha/tesseract.js.git??
PaddleOCR
PaddleOCR是百度開源一套OCR,旨在打造一套豐富、領(lǐng)先、且實(shí)用的OCR工具庫(kù),助力開發(fā)者訓(xùn)練出更好的模型,并應(yīng)用落地。



??https://github.com/PaddlePaddle/PaddleOCR.git??
EasyOCR
EasyOCR是用Python編寫基于Tesseract的OCR識(shí)別庫(kù),用于圖像識(shí)別輸出文本,目前支持80多種語言。

??https://github.com/JaidedAI/EasyOCR.git??
mmocr
MMOCR 是基于 PyTorch 和 mmdetection 的開源工具箱,專注于文本檢測(cè),文本識(shí)別以及相應(yīng)的下游任務(wù),如關(guān)鍵信息提取。

??https://github.com/open-mmlab/mmocr.git??
simple-ocr-opencv
基于opencv 和numpy開源的OCR識(shí)別引擎

??https://github.com/goncalopp/simple-ocr-opencv.git??
OCR工具
OCRmyPDF
OCRmyPDF是基于tesseract-ocr開發(fā)、訓(xùn)練的文字識(shí)別提取的開源項(xiàng)目

??https://github.com/ocrmypdf/OCRmyPDF.git??
Umi-OCR
基于 PaddleOCR 實(shí)現(xiàn)的一款開源的文字識(shí)別工具,

一般開源項(xiàng)目,識(shí)別率肯定沒有商用的那么高,只有通過訓(xùn)練自己的字庫(kù)來提高識(shí)別率。文字識(shí)別場(chǎng)景,有時(shí)候就會(huì)涉及到圖片處理,這里又會(huì)關(guān)聯(lián)到其它強(qiáng)大的圖像處理開源項(xiàng)目,如:OpenCV。這些項(xiàng)目中,PaddleOCR相對(duì)來說會(huì)更符合我們常見的業(yè)務(wù)場(chǎng)景,也支持我們自己去訓(xùn)練。















 
 
 













 
 
 
 