17个超级实用OCR开源项目-51CTO.COM

大家好，我是Echa。

光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。

光学字符识（OCR）别技术应用

OCR技术的特点

提高效率：OCR技术相比传统的人工方式，能够更快实现信息录入。

降低成本：以机器代替人工，能够节省人力成本的开销。

适用性强：OCR技术能够实现多场景和多语言的识别，还能通过提取图像中的文本分析其所包含的语义信息，为机器理解图像提供高层语义线索。

OCR技术的特点

OCR的应用场景

卡片证件识别类：身份证识别、银行卡识别、驾驶证识别、行驶证识别、港澳通行证识别、护照识别、户口簿识别、营业执照识别；
票据类识别：增值税发票识别、支票识别、承兑汇票识别、银行票据识别、营业执照识别、物流快递识别；
文字信息结构化视频类识别：主要有字幕识别和文字跟踪；
其他识别：二维码识别、一维码识别、车牌识别、数学公式识别、物理化学符号识别、音乐符号识别、工程图识别、流程图识别、古迹文献识别、手写输入识别；
除了以上列举的之外，还有自然场景下的文字识别、菜单识别、横幅检测识别、图章检测识别、广告类图文识别等围绕审核相关的业务应用。

OCR的应用场景

借此机会，小编今天又给大家好物分享17个超级实用OCR开源项目，涉及各个应用场景，覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目。希望对大家对OCR有新的认识和帮助。同时祝愿每一个粉丝都能拥有一份健康的身体,每天都能有充沛的精力去实现自己的梦想。

全文大纲

yx-image-recognition - 图像识别管理系统
EasyPR - 是一个中文的开源车牌识别系统
meihu-meiyan - 美狐直播美颜系统
dface - 是个开源的深度学习人脸检测和人脸识别系统
HyperLPR - 高性能中文车牌识别管理系统
idCardCv - 证件识别管理系统
verification-decoder - 验证码CNN识别库
medicine-identification - 中药图像识别系统
face-search - 人脸搜索采集管理系统
PaddleDetection - 目标检测管理系统
red5-rtmp-push - 天网人脸识别系统
open-anpr - 智能车牌识别管理系统，支持14种中文车牌类型。
Free Offline OCR - 离线的中文文本检测+识别SDK
car- 车辆检测计数+车牌定位+车牌识别的融合技术
document-ocr - 一个相对完整的文档分析和识别项目
gradio_yolov5_det - 通用目标检测系统
mobile-lpr - 是一个面向移动端的准商业级车牌识别库

yx-image-recognition - 图像识别管理系统

Gitee：https://gitee.com/admin_yu/yx-image-recognition

介绍

基于spring boot + maven + opencv 实现的图像深度学习Demo项目，包含车牌识别、人脸识别、证件识别等功能，贯穿样本处理、模型训练、图像处理、对象检测、对象识别等技术点

功能特点

蓝、绿、黄车牌检测及车牌号码识别
网上常见的轮廓提取车牌算法JAVA实现
hsv色彩分割提取车牌算法JAVA实现
harrcascade特征识别算法 JAVA实现
基于svm算法的车牌检测训练JAVA实现
基于ann算法的车牌号码识别训练JAVA实现
人脸检测接下来将实现人脸识别
图片工具: 目前实现了HSV色彩切割，后续将添加更多使用的图片处理工具，用于辅助算法优化
证件文字识别

系统截图

EasyPR - 是一个中文的开源车牌识别系统

Gitee：https://gitee.com/liuruoze/EasyPR

介绍

EasyPR是一个开源的中文车牌识别系统，其目标是成为一个简单、高效、准确的非限制场景(unconstrained situation)下的车牌识别库。

相比于其他的车牌识别系统，EasyPR有如下特点：

它基于openCV这个开源库。这意味着你可以获取全部源代码，并且移植到opencv支持的所有平台。
它能够识别中文。例如车牌为苏EUK722的图片，它可以准确地输出std:string类型的"苏EUK722"的结果。
它的识别率较高。图片清晰情况下，车牌检测与字符识别可以达到80%以上的精度。

例子

假设我们有如下的原始图片，需要识别出中间的车牌字符与颜色：

经过EasyPR的第一步处理车牌检测（PlateDetect）以后，我们获得了原始图片中仅包含车牌的图块：

接着，我们对图块进行OCR过程，在EasyPR中，叫做字符识别（CharsRecognize）。我们得到了一个包含车牌颜色与字符的字符串：

“蓝牌：苏EUK722”

截图：

meihu-meiyan - 美狐直播美颜系统

Gitee：https://gitee.com/MeiHuSDK/meihu-meiyan

介绍

美狐美颜sdk，满足客户在直播平台实现美颜效果、短视频系统自带美颜特效等众多音视频软件业务场景的美化需求的第三方美颜api，是以人脸识别、人脸关键点技术为核心，提供专业级实时美颜、大眼瘦脸、美颜滤镜、动态贴纸、美白磨皮、美型、萌颜等特效的接口，以打造多功能视频美颜软件为目标。

截图

dface - 是个开源的深度学习人脸检测和人脸识别系统

Gitee：https://gitee.com/kuaikuaikim/dface

介绍

基于多任务卷积网络(MTCNN)和Center-Loss的多人实时人脸检测和人脸识别系统。

DFace 是个开源的深度学习人脸检测和人脸识别系统。所有功能都采用　pytorch　框架开发。pytorch是一个由facebook开发的深度学习框架，它包含了一些比较有趣的高级特性，例如自动求导，动态构图等。DFace天然的继承了这些优点，使得它的训练过程可以更加简单方便，并且实现的代码可以更加清晰易懂。 DFace可以利用CUDA来支持GPU加速模式。