导读图像识别领域有几个最热门的方向,其中就包含了OCR(Optical Character Recognition,光学字符识别),百度、阿里、腾讯都有自己的OCR收费服务 。随着目前数据量越来越大,以及硬件性能的提升,OCR的应用也越来越成熟,像身份证识别、火车票识别、发票识别、出租票识别等等 。相信大家也体验过一些,今天给大家介绍一个好用的开源OCR应用EasyOCR,而且还包含多种语言,识别效果也还不错,目前在git上已有8K颗星
git地址:https://github.com/JaidedAI/EasyOCR
EasyOCR
- 介绍
文章插图
EasyOCR支持的语言类型
- 模型架构
文章插图
EasyOCR的模型主要分为两个,基于CRAFT的文字检测模型和基于ResNet+LSTM+CTC的识别模型
- demo
文章插图
第三方基于easyOCR提供了几个demo地址,大家可以试试自己的数据看看效果:
- https://colab.fan/easyocr
- https://hub.Docker.com/r/challisa/easyocr
- https://easyocrgpu-wook-2.endpoint.ainize.ai/
文章插图
文字基本上能识别出来,不过标点符号的识别不是那么的准确,我在自己的电脑上按照git上配置了一下环境,识别效果要比上面好不少,效果如下
文章插图
顺便测试了一下火车票的识别效果
文章插图
文章插图
火车票的识别效果还是要差一些,估计是训练的时候缺少这样的数据
EasyOCR的安装EasyOCR依赖pytorch的环境,需要先安装pytorch,这个安装教程大家参考torch的官方安装教程,在安装好torch之后大家就可以通过pip直接来安装EasyOCR
- pip安装
pip install easyocr
- git安装最新版本
pip install git+git://github.com/jaidedai/easyocr.git
- 模型准备
import easyocrreader = easyocr.Reader(['ch_sim','en']) print(result)
- 不足之处
【一个超好用的开源OCR】
推荐阅读
- 火把节是白族的节日吗 火把节是哪一个少数民族的节日
- 科学家发现外星人居住的星球 一个外星人对地球的观察
- 知道什么是时间轮算法吗?在Netty和Kafka中如何应用的?
- 蛇的抗毒血清是通用的吗 在制备蛇毒抗毒素血清时
- 双鱼男喜欢一个女孩会怎样?
- Windows 这些没用的设置,我建议你还是趁早关闭吧
- 微信使用的这六款开源代码,你用过哪一个?
- 中国水怪之谜 世界水怪之谜大揭秘
- 薄烟念bo还是念bao?
- 可观测宇宙怎么测的 宇宙可观测距离