Skip to content

从NLP出发对于OCR的深度实践集锦,重在实战

Notifications You must be signed in to change notification settings

developWmark/Chinese-OCR3

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Chinese-OCR3:面向中文的OCR深度实践系列

目前NLP+OCR的落地应用在市场上愈加火热,如金融领域的研报分析、司法领域的合同审核甚至知识图谱的信息抽取,无不显示着NLP与OCR融合的巨大魅力。

本文将针对OCR从理论实战两方面进行详细论述,当然,不会涉及过多的公式,网上对于公式解析已经很全面,若感兴趣可自行查找。

实验环境配置

本项目下的所有模型均在以下环境中测试成功:
python版本:python3.6
系统:ubuntu18.04
pytorch:1.2.0
tensorflow:1.14.0

目前章节系列已更新完毕:

(一)OCR深度实践系列:图像预处理
(二)OCR深度实践系列:数据生成
(三)OCR深度实践系列:文本检测
(四)OCR深度实践系列:文本识别
(五)OCR深度实践系列:后处理篇

About

从NLP出发对于OCR的深度实践集锦,重在实战

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages

  • C++ 72.6%
  • Python 26.2%
  • Other 1.2%