Python3.6使用tesseract-ocr的正确方法


Posted in Python onOctober 17, 2018

Tesseract介绍

tesseract是一个挺不错的OCR引擎,目前的问题是最新的中文资料相对较少,过时、不准确的信息偏多。

tesseract是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载。

实际使用tesseract ocr也有两种方式:1. 动态库方式 libtesseract  2. 执行程序方式 tesseract.exe

环境

  • Python 3.6.3
  • pip 9.0.1
  • tesseract-ocr-setup-3.05.00dev.exe
  • Windows10

安装

1.tesseract-orc

  • Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。

安装的时候需要自行选择安装的语言,一些其他国家的语言可以不选择安装,我之按安装了中文,英文和日语。安装过程和其他软件一样。

2.pytesseract

pip install pytesseract

配置环境

1.设置 tesseract-orc路径

默认情况下tesseract-orc是不被添加到系统的path路径的,这样在使用的时候发生FileNotFoundError: [WinError 2] 系统找不到指定的文件错误。

解决方法:

  • 方法1:将 C:\Program Files (x86)\Tesseract-OCR添加到系统路径(路径因安装过程而异)
  • 方法2:修改pytesseract.py文件

设置训练集的位置

下载的默认训练集也没有添加到系统路径,会报错

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\tessdata/chi_sim.traineddata')

解决方法:

设置环境变量 TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata

实例程序

import pytesseract
from PIL import Image
image = Image.open('test.png')
code = pytesseract.image_to_string(image)
print(code)

更多参考:https://pypi.python.org/pypi/pytesseract

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
浅谈Python基础之I/O模型
May 11 Python
python实现日常记账本小程序
Mar 10 Python
Python内存读写操作示例
Jul 18 Python
纯python进行矩阵的相乘运算的方法示例
Jul 17 Python
Python进程,多进程,获取进程id,给子进程传递参数操作示例
Oct 11 Python
pycharm双击无响应(打不开问题解决办法)
Jan 10 Python
Python装饰器用法与知识点小结
Mar 09 Python
Python3爬虫里关于识别微博宫格验证码的知识点详解
Jul 30 Python
Python Socket多线程并发原理及实现
Dec 11 Python
selenium自动化测试入门实战
Dec 21 Python
AI:如何训练机器学习的模型
Apr 16 Python
python数字转对应中文的方法总结
Aug 02 Python
python学生信息管理系统(初级版)
Oct 17 #Python
学生信息管理系统python版
Oct 17 #Python
python 使用sys.stdin和fileinput读入标准输入的方法
Oct 17 #Python
Python实现Dijkstra算法
Oct 17 #Python
使用Python抓取豆瓣影评数据的方法
Oct 17 #Python
python 对key为时间的dict排序方法
Oct 17 #Python
解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题
Oct 17 #Python
You might like
PHP新手上路(十四)
2006/10/09 PHP
一步一步学习PHP(4) php 函数 补充2
2010/02/15 PHP
php实现可以设置中奖概率的抽奖程序代码分享
2014/01/19 PHP
分享一个php 的异常处理程序
2014/06/22 PHP
Joomla调用系统自带编辑器的实现方法
2016/05/05 PHP
PHP实现简易blog的制作
2016/10/24 PHP
Yii2 如何在modules中添加验证码的方法
2017/06/19 PHP
js弹出模式对话框,并接收回传值的方法
2013/03/12 Javascript
JQuery设置和去除disabled属性的5种方法总结
2013/05/16 Javascript
通过伪协议解决父页面与iframe页面通信的问题
2015/04/05 Javascript
微信小程序 引用其他js文件实现代码
2017/02/22 Javascript
js 转义字符及URI编码详解
2017/02/28 Javascript
详谈JS中数组的迭代方法和归并方法
2017/08/11 Javascript
如何理解Vue的作用域插槽的实现原理
2017/08/19 Javascript
jQuery 开发之EasyUI 添加数据的实例
2017/09/26 jQuery
elementui的默认样式修改方法
2018/02/23 Javascript
浅析Visual Studio Code断点调试Vue
2018/02/27 Javascript
vue的for循环使用方法
2019/02/12 Javascript
vue-router二级导航切换路由及高亮显示的实现方法
2019/07/10 Javascript
ElementUI多个子组件表单的校验管理实现
2019/11/07 Javascript
原生JS实现多条件筛选
2020/08/19 Javascript
记录Django开发心得
2014/07/16 Python
Python中的with语句与上下文管理器学习总结
2016/06/28 Python
浅谈tensorflow1.0 池化层(pooling)和全连接层(dense)
2018/04/27 Python
pytorch 调整某一维度数据顺序的方法
2018/12/08 Python
Python3.6.x中内置函数总结及讲解
2019/02/22 Python
Python3 selenium 实现QQ群接龙自动化功能
2020/04/17 Python
世界首屈一指的钓鱼用品商店:TackleDirect
2016/07/26 全球购物
瑞士设计师家具和家居饰品网上商店:Bruno Wickart
2019/03/18 全球购物
介绍一下linux的文件系统
2015/10/06 面试题
鲜果饮品店创业计划书
2014/01/21 职场文书
五四青年节优秀演讲稿范文
2014/05/28 职场文书
任命书怎么写
2014/06/04 职场文书
2015年酒店客房部工作总结
2015/04/25 职场文书
关爱空巢老人感想
2015/08/11 职场文书
《宝可梦》动画制作25周年到来 官方发布特别纪念视频
2022/04/01 日漫