偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="2qxzk"></u>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

沒看錯！一行Python代碼就可以幫您獲取圖片中的文字信息

作者：測試開發(fā)Kevin 2023-04-26 07:32:04

開發(fā) 前端

目前在github上有50.5k個star！python可以調(diào)用，安裝也十分方便，pip install pytesseract 即可。如果沒有Pillow 包，還需要執(zhí)行pip install Pillow。

最近工作中有需求需要用python對圖片中的文字進(jìn)行識別，調(diào)研了一下，選擇了tesseract，

目前在github上有50.5k個star！python可以調(diào)用，安裝也十分方便，pip install pytesseract 即可。如果沒有Pillow 包，還需要執(zhí)行pip install Pillow。

核心代碼

讀取圖片中文字信息的核心api如下：

from PIL import Image
import pytesseract
captcha_text = pytesseract.image_to_string(Image.open("d:/tmp/img4.png"), lang='chi_sim')
print(captcha_text)

上面這段代碼中需要解釋的是如果圖片中有中文字符則需要添加參數(shù)lang='chi_sim'，并在安裝的過程中添加識別中文的字符庫，后面會講到！

運(yùn)行代碼遇到的問題

直接運(yùn)行上面的代碼，會遇到下面的問題

raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

我們來分析一下這個錯誤！錯誤提示tesseract沒有安裝，但是我們明明已經(jīng)執(zhí)行了pip install pytesseract，那么問題會出在哪里呢？

我們需要先了解一下pytesseract，它是一款用于光學(xué)字符識別（OCR）的python工具，即從圖片中識別出和“讀取”其中嵌入的文字，底層使用的是Google的Tesseract-OCR 引擎，pytesseract只是對Tesseract-OCR的一層封裝！看到這里我們就能夠理解，運(yùn)行python代碼

pytesseract.image_to_string() 報錯的原因了！因?yàn)槲业腜C上并沒有安裝Tesseract-OCR，pytesseract是無法調(diào)用Tesseract-OCR的api為我們干活的！

安裝Tesseract-OC

Tesseract-OCR windows 版本的下載鏈接如下：https://github.com/UB-Mannheim/tesseract/wiki

下載成功后，只需默認(rèn)安裝，在安裝的過程中，如果想對其他國家語言文字識別可以選擇相對應(yīng)的語言包，如下圖

安裝成功后配置路徑 C:\Program Files\Tesseract-OCR 到環(huán)境變量中即可。

再次運(yùn)行，正常執(zhí)行！大家可以自己做一張文字圖片的截圖查看效果。

復(fù)雜的登錄校驗(yàn)碼無法識別

另外我測試了Tesseract-OCR對復(fù)雜校驗(yàn)碼的識別情況，如下圖：

結(jié)論是：復(fù)雜的校驗(yàn)碼仍然無法識別。

責(zé)任編輯：武曉燕來源：今日頭條

python 代碼文字信息

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營