偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Github Star 10k,超級(jí)好用的 OCR 數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具

新聞 前端
OCR方向的工程師,一定需要知道這個(gè)OCR開(kāi)源項(xiàng)目:PaddleOCR。

  

一、導(dǎo)讀

OCR方向的工程師,一定需要知道這個(gè)OCR開(kāi)源項(xiàng)目:PaddleOCR

短短幾個(gè)月,累計(jì)Star數(shù)量已超過(guò)10k,

頻頻登上Github Trending 日榜月榜,

稱(chēng)它為 OCR方向目前最火的repo絕對(duì)不為過(guò)。

最近,它又帶來(lái)四大新發(fā)布與升級(jí):

核心內(nèi)容先睹為快:

  • 全新發(fā)布數(shù)據(jù)合成工具Style-Text: 可以批量合成大量與目標(biāo)場(chǎng)景類(lèi)似的圖像,在多個(gè)場(chǎng)景驗(yàn)證,效果均提升15%以上。
  • 全新發(fā)布半自動(dòng)數(shù)據(jù)標(biāo)注工具PPOCRLabel: 有了它數(shù)據(jù)標(biāo)注工作事半功倍,相比labelimg標(biāo)注效率提升60%以上,社區(qū)小規(guī)模測(cè)試,好評(píng)如潮。
  • 多語(yǔ)言識(shí)別模型效果升級(jí): 在開(kāi)源測(cè)試集評(píng)估,中文、英文、韓語(yǔ)、法語(yǔ)、德語(yǔ)、日文識(shí)別效果均優(yōu)于EasyOCR。
  • PP-OCR開(kāi)發(fā)體驗(yàn)再升級(jí): 支持動(dòng)態(tài)圖開(kāi)發(fā)(訓(xùn)練調(diào)試更方便),靜態(tài)圖部署(預(yù)測(cè)效率更高),魚(yú)與熊掌可以兼得。

二、PaddleOCR歷史表現(xiàn)回顧

先看下PaddleOCR自去年6月開(kāi)源以來(lái),短短幾個(gè)月在GitHub上的表現(xiàn):

  • 6月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢(shì)榜日榜第一。
  • 8月,開(kāi)源CVPR2020頂會(huì)SOTA算法,再上GitHub趨勢(shì)榜單!
  • 10月,發(fā)布PP-OCR算法,開(kāi)源3.5M超超輕量模型,再登Paperswithcode 趨勢(shì)榜第一。

 

這個(gè)含金量,廣大的GitHub開(kāi)發(fā)者們自然懂,3.5M超超輕量模型的效果圖大家直接看,絕對(duì)杠杠的。

火車(chē)票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語(yǔ)都是妥妥的,3.5M的模型能達(dá)到這個(gè)識(shí)別精度,絕對(duì)是良心之作了!

傳送門(mén):

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的12月份更新,又給大家?guī)?lái)哪些驚喜呢?

三、全新發(fā)布OCR數(shù)據(jù)合成工具:Style-Text

相比于傳統(tǒng)的數(shù)據(jù)合成算法,Style-Text可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移,只需要少許目標(biāo)場(chǎng)景圖像,就可以合成大量數(shù)據(jù),效果展示如下:

1、相同背景批量數(shù)據(jù)合成

2、相同文字批量數(shù)據(jù)合成

3、圖片分離前景背景

除了拉風(fēng)的效果,采用這樣的合成數(shù)據(jù)和真實(shí)數(shù)據(jù)一起訓(xùn)練,可以顯著提升特殊場(chǎng)景的性能指標(biāo),分別以?xún)蓚€(gè)場(chǎng)景為例:

怎么樣,絕對(duì)是黑科技了吧。

這項(xiàng)能力核心算法是基于百度和華科合作研發(fā)的文本編輯算法《Editing Text in the Wild》https://arxiv.org/abs/1908.03047

不同于常用的基于GAN的數(shù)據(jù)合成工具,Style-Text主要框架包括 ①文本前景風(fēng)格遷移模塊 ②背景抽取模塊 ③融合模塊。經(jīng)過(guò)這樣三步,就可以迅速實(shí)現(xiàn)圖片文字風(fēng)格遷移啦。

 

四、超強(qiáng)OCR數(shù)據(jù)標(biāo)注工具:PPOCRLabel

除了數(shù)據(jù)合成,數(shù)據(jù)標(biāo)注也一直是深度學(xué)習(xí)開(kāi)發(fā)者關(guān)注的重點(diǎn),無(wú)論是從成本還是時(shí)間上面,提高標(biāo)注效率,降低標(biāo)注成本太重要了。

PPOCRLabel通過(guò)內(nèi)置高質(zhì)量的PPOCR中英文超輕量預(yù)訓(xùn)練模型,可以實(shí)現(xiàn)OCR數(shù)據(jù)的高效標(biāo)注。CPU機(jī)器運(yùn)行也是完全沒(méi)問(wèn)題的。

話(huà)不多說(shuō),直接看PPOCRLabel效果演示:

用法也是非常的簡(jiǎn)單,標(biāo)注效率提升60%-80%是妥妥的。只能說(shuō),真的太香了。

五、最好的多語(yǔ)言模型效果

簡(jiǎn)單對(duì)比一下目前主流OCR方向開(kāi)源repo的核心能力:

中英文模型性能及功能對(duì)比

其中,部分多語(yǔ)言模型性能及功能(F1-Score)對(duì)比(僅EasyOCR提供)

值得一提的是,目前已經(jīng)有全球開(kāi)發(fā)者通過(guò)PR或者issue的方式為PaddleOCR提供多語(yǔ)言的字典和語(yǔ)料,在PaddleOCR上已經(jīng)完成了全球主流語(yǔ)言的廣泛覆蓋:包括中文簡(jiǎn)體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達(dá)文、泰米爾文,也歡迎更多開(kāi)發(fā)者可以參與共建。

六、PP-OCR開(kāi)發(fā)體驗(yàn)再升級(jí)

動(dòng)態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動(dòng)態(tài)圖模式下,代碼編寫(xiě)運(yùn)行方式符合Python程序員的習(xí)慣,易于調(diào)試,但在性能方面, Python執(zhí)行開(kāi)銷(xiāo)較大,與C++有一定差距。

相比動(dòng)態(tài)圖,靜態(tài)圖在部署方面更具有性能的優(yōu)勢(shì)。靜態(tài)圖程序在編譯執(zhí)行時(shí),預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離Python依賴(lài),在C++端被重新解析執(zhí)行,而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

飛槳?jiǎng)討B(tài)圖中新增了動(dòng)態(tài)圖轉(zhuǎn)靜態(tài)圖的功能,支持用戶(hù)使用動(dòng)態(tài)圖編寫(xiě)組網(wǎng)代碼。預(yù)測(cè)部署時(shí),飛槳會(huì)對(duì)用戶(hù)代碼進(jìn)行分析,自動(dòng)轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu),兼顧了動(dòng)態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢(shì)。

七、良心出品的中英文文檔教程

別的不需要多說(shuō)了,大家訪問(wèn)GitHub點(diǎn)過(guò)star之后自己體驗(yàn)吧:

https://github.com/PaddlePaddle/PaddleOCR

 

 

責(zé)任編輯:張燕妮 來(lái)源: 程序員的那些事
相關(guān)推薦

2020-12-16 15:04:58

工具Github開(kāi)發(fā)

2019-12-24 11:13:02

GitHub代碼開(kāi)發(fā)者

2020-03-23 15:35:36

Java工具類(lèi)Hutool

2018-06-12 16:33:23

GitHub替代品項(xiàng)目

2015-07-16 14:51:13

下載助手斷點(diǎn)續(xù)傳多任務(wù)

2023-09-20 08:02:09

Ceph客戶(hù)端

2019-07-17 15:29:46

GitHub數(shù)據(jù)科學(xué)學(xué)習(xí)

2022-04-28 13:17:10

低代碼開(kāi)發(fā)工具

2019-07-05 11:01:59

Google電子商務(wù)搜索引擎

2017-07-20 16:40:36

大數(shù)據(jù)分析工具

2023-10-16 13:43:00

AI模型

2020-08-04 10:07:47

Web日志安全分析工具漏洞

2021-03-30 10:02:51

前端開(kāi)發(fā)技術(shù)

2024-11-08 15:51:07

2019-03-06 09:47:33

工具代碼測(cè)試

2020-11-02 14:49:46

GitHub Java圖片

2020-10-28 09:50:05

GitHubPython項(xiàng)目

2021-09-09 07:21:25

項(xiàng)目GithubRedux-Thunk

2013-05-27 15:07:36

Eclipse插件

2022-07-18 15:48:43

數(shù)據(jù)庫(kù)開(kāi)源工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)