偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Github Star 7.2K,超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦!

開(kāi)發(fā) 開(kāi)發(fā)工具 新聞
OCR 方向的工程師,一定需要知道這個(gè) OCR 開(kāi)源項(xiàng)目。短短幾個(gè)月,累計(jì) Star 數(shù)量已超過(guò) 7.2K,頻頻登上 Github Trending 日榜月榜,稱它為 OCR 方向目前最火的 repo 絕對(duì)不為過(guò)。

 [[358114]]

OCR 方向的工程師,一定需要知道這個(gè) OCR 開(kāi)源項(xiàng)目:PaddleOCR。短短幾個(gè)月,累計(jì) Star 數(shù)量已超過(guò) 7.2K,頻頻登上 Github Trending 日榜月榜,稱它為 OCR 方向目前最火的 repo 絕對(duì)不為過(guò)。

12 月,它又帶來(lái)四大新發(fā)布與升級(jí),核心內(nèi)容先睹為快:

  • 全新發(fā)布數(shù)據(jù)合成工具 Style-Text:可以批量合成大量與目標(biāo)場(chǎng)景類似的圖像,在多個(gè)場(chǎng)景驗(yàn)證,效果均提升 15% 以上。
  • 全新發(fā)布半自動(dòng)數(shù)據(jù)標(biāo)注工具 PPOCRLabel:有了它數(shù)據(jù)標(biāo)注工作事半功倍,相比 labelimg 標(biāo)注效率提升 60% 以上,社區(qū)小規(guī)模測(cè)試,好評(píng)如潮。
  • 多語(yǔ)言識(shí)別模型效果升級(jí):中文、英文、韓語(yǔ)、法語(yǔ)、德語(yǔ)、日文識(shí)別效果均優(yōu)于 EasyO

R。

  • PP-OCR 開(kāi)發(fā)體驗(yàn)再升級(jí):支持動(dòng)態(tài)圖開(kāi)發(fā)(訓(xùn)練調(diào)試更方便),靜態(tài)圖部署(預(yù)測(cè)效率更高),魚(yú)與熊掌可以兼得。

PaddleOCR 歷史表現(xiàn)回顧

先看下 PaddleOCR 自今年開(kāi)源以來(lái),短短幾個(gè)月在 GitHub 上的表現(xiàn):

  • 6 月,8.6M 超輕量模型發(fā)布,GitHub Trending 全球趨勢(shì)榜日榜第一。
  • 8 月,開(kāi)源 CVPR2020 頂會(huì) SOTA 算法,再上 GitHub 趨勢(shì)榜單!
  • 10 月,發(fā)布 PP-OCR 算法,開(kāi)源 3.5M 超超輕量模型,再下 Paperswithcode 趨勢(shì)榜第一
超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

這個(gè)含金量,廣大的 GitHub 開(kāi)發(fā)者們自然懂,3.5M 超超輕量模型的效果圖大家直接看,絕對(duì)杠杠的。

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語(yǔ)都是妥妥的,3.5M 的模型能達(dá)到這個(gè)識(shí)別精度,絕對(duì)是良心之作了!

傳送門:https://github.com/PaddlePaddle/PaddleOCR

那么最近的 12 月份更新,又給大家?guī)?lái)哪些驚喜呢?

全新發(fā)布 OCR 數(shù)據(jù)合成工具:Style-Text

相比于傳統(tǒng)的數(shù)據(jù)合成算法,Style-Text 可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移,只需要少許目標(biāo)場(chǎng)景圖像,就可以合成大量數(shù)據(jù),效果展示如下:

1、相同背景批量數(shù)據(jù)合成

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

2、相同文字批量數(shù)據(jù)合成

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

3、圖片分離前景背景

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

除了拉風(fēng)的效果,采用這樣的合成數(shù)據(jù)和真實(shí)數(shù)據(jù)一起訓(xùn)練,可以顯著提升特殊場(chǎng)景的性能指標(biāo),分別以兩個(gè)場(chǎng)景為例:

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

怎么樣,絕對(duì)是黑科技了吧。這項(xiàng)能力核心算法是基于百度自研的文本編輯算法《Editing Text in the Wild》。

論文地址:https://arxiv.org/abs/1908.03047

不同于常用的基于 GAN 的數(shù)據(jù)合成工具,Style-Text 主要框架包括 ①文本前景風(fēng)格遷移模塊 ②背景抽取模塊 ③融合模塊。經(jīng)過(guò)這樣三步,就可以迅速實(shí)現(xiàn)圖片文字風(fēng)格遷移啦。

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

超強(qiáng) OCR 數(shù)據(jù)標(biāo)注工具:PPOCRLabel

除了數(shù)據(jù)合成,數(shù)據(jù)標(biāo)注也一直是深度學(xué)習(xí)開(kāi)發(fā)者關(guān)注的重點(diǎn),無(wú)論是從成本還是時(shí)間上面,提高標(biāo)注效率,降低標(biāo)注成本太重要了。PPOCRLabel 通過(guò)內(nèi)置高質(zhì)量的 PPOCR 中英文超輕量預(yù)訓(xùn)練模型,可以實(shí)現(xiàn) OCR 數(shù)據(jù)的高效標(biāo)注。CPU 機(jī)器運(yùn)行也是完全沒(méi)問(wèn)題的。話不多說(shuō),直接看 PPOCRLabel 效果演示:

用法也是非常的簡(jiǎn)單,標(biāo)注效率提升 60%-80% 是妥妥的。只能說(shuō),真的太香了。

最好的多語(yǔ)言模型效果

簡(jiǎn)單對(duì)比一下目前主流 OCR 方向開(kāi)源 repo 的核心能力:

中英文模型性能及功能對(duì)比

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

其中,多語(yǔ)言識(shí)別模型準(zhǔn)確率對(duì)比(僅 EasyOCR 提供)

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

測(cè)試數(shù)據(jù)及環(huán)境說(shuō)明:

  • 中英文場(chǎng)景:針對(duì) OCR 實(shí)際應(yīng)用場(chǎng)景,包括合同,車牌,銘牌,火車票,化驗(yàn)單,表格,證書(shū),街景文字,名片,數(shù)碼顯示屏等,收集的 300 張圖像,每張圖平均有 17 個(gè)文本框,PaddleOCR 的 F1-Score 超過(guò) 0.5,這個(gè)性能已經(jīng)很不錯(cuò)了。
  • 多語(yǔ)言場(chǎng)景:PaddleOCR 選擇了開(kāi)源數(shù)據(jù) ICDAR2017 – MLT(多語(yǔ)言文本識(shí)別測(cè)試集),并抽取其中的法語(yǔ)、德語(yǔ)、日語(yǔ)、韓語(yǔ)數(shù)據(jù)作為評(píng)測(cè)集合。其中測(cè)試圖片大多來(lái)自于自然場(chǎng)景,例如廣告牌、路標(biāo)、海報(bào)等。

PP-OCR 開(kāi)發(fā)體驗(yàn)再升級(jí)

動(dòng)態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動(dòng)態(tài)圖模式下,代碼編寫(xiě)運(yùn)行方式符合 Python 程序員的習(xí)慣,易于調(diào)試,但在性能方面, Python 執(zhí)行開(kāi)銷較大,與 C++ 有一定差距。

相比動(dòng)態(tài)圖,靜態(tài)圖在部署方面更具有性能的優(yōu)勢(shì)。靜態(tài)圖程序在編譯執(zhí)行時(shí),預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離 Python 依賴,在 C++ 端被重新解析執(zhí)行,而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

飛槳?jiǎng)討B(tài)圖中新增了動(dòng)態(tài)圖轉(zhuǎn)靜態(tài)圖的功能,支持用戶使用動(dòng)態(tài)圖編寫(xiě)組網(wǎng)代碼。預(yù)測(cè)部署時(shí),飛槳會(huì)對(duì)用戶代碼進(jìn)行分析,自動(dòng)轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu),兼顧了動(dòng)態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢(shì)。

良心出品的中英文文檔教程

超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦

別的不需要多說(shuō)了,大家訪問(wèn) GitHub 點(diǎn)過(guò) star 之后自己體驗(yàn)吧:

https://github.com/PaddlePaddle/PaddleOCR

 

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2021-01-29 11:06:14

GitHub 數(shù)據(jù)開(kāi)發(fā)

2023-12-22 14:09:08

AI文本編輯器AiEditor

2011-04-21 14:42:46

CSSHTML工具

2011-07-06 13:38:42

Web

2020-02-24 19:40:22

WindowsSSH客戶端

2022-05-16 09:20:00

開(kāi)發(fā)工具

2023-12-07 19:13:48

Pythonprint

2024-02-27 08:25:52

LiteFlow代碼語(yǔ)法

2020-02-24 10:06:43

Mac軟件工具

2009-11-04 13:12:33

VB.NET繼承類

2023-07-10 08:44:00

2011-06-30 17:41:46

SEO

2022-09-15 15:34:48

數(shù)據(jù)庫(kù)開(kāi)源

2024-04-25 16:27:07

數(shù)據(jù)可視化Python

2009-11-04 13:46:36

ADO.NET數(shù)據(jù)庫(kù)

2011-05-16 08:37:56

JavaScript庫(kù)

2012-02-03 15:13:27

JavaScript

2012-06-14 11:14:14

運(yùn)維Firefox插件

2014-04-11 13:12:10

前端技能前端必備

2020-12-17 05:52:09

線程池ThreadPoolThreadPoolE
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)