win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码


Posted in Python onJanuary 16, 2020

链接:https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw
提取码:t3bq

win10安装tesserocr

首先需要下载tesseract,它为tesserocr提供底层支持。具体下载官方路径:https://github.com/UB-Mannheim/tesseract/wiki,选择对应的系统版本,可以选择一个相对不带dev的稳定版本下载,如:tesseract-ocr-setup-3.05.02-20180621.exe。然后一路安装,唯一记得勾选Additional language data(download),勾选可能会用到的语言tessdata,如简体、繁体中文,数学模块等,不需要全选,下载tessdata的时间会比较长。

win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码

下载时间会比较长,耐心等待即可,有条件可以翻墙下载速度会快很多

安装python对应的tesserocr库

使用原始的whl文件方式安装。tesserocr 的whl官方文件下载路径:https://github.com/simonflueckiger/tesserocr-windows_build/releases,下载本地环境对应的whl文件,如我的是window64位系统,python版本是3.5。下载完后,使用cd跳转到whl文件所在目录,然后 执行 ”pip install tesserocr-2.2.2-cp35-cp35m-win_amd64.whl“,即可轻松完成安装。

tesserocr 报错 UnicodeDecodeError 系统问题 用下面的模块替代

pytesseract :pip install pytesseract

pip install pytesseract

首次运行总是不顺利,相信我遇到的坑大多数人都会遇到,大抵错误类似:

Traceback (most recent call last): File "G:\pythonSources\my12306/obtain_message\test.py", line 4, in <module>
 print(tesserocr.image_to_text(image))
 File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: “本地某个路径”

有个比较简单粗暴的解决方法是把安装好的Tesseract-OCR下的tessdata文件夹整个拷贝到提示的那个路径中,亲测有效。

测试代码

import tesserocr
from PIL import Image
image=Image.open('image.jpg')
print(tesserocr.image_to_text(image))

总结

以上所述是小编给大家介绍的win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
老生常谈Python startswith()函数与endswith函数
Sep 08 Python
python验证码识别实例代码
Feb 03 Python
python操作excel文件并输出txt文件的实例
Jul 10 Python
详解Python读取yaml文件多层菜单
Mar 23 Python
python pandas 时间日期的处理实现
Jul 30 Python
Python GUI学习之登录系统界面篇
Aug 21 Python
Python数据库小程序源代码
Sep 15 Python
Flask框架 CSRF 保护实现方法详解
Oct 30 Python
python中的函数递归和迭代原理解析
Nov 14 Python
python中常用的数据结构介绍
Jan 12 Python
Python之qq自动发消息的示例代码
Feb 18 Python
Python写情书? 10行代码展示如何把情书写在她的照片里
Apr 21 Python
Python通过VGG16模型实现图像风格转换操作详解
Jan 16 #Python
Python使用turtle库绘制小猪佩奇(实例代码)
Jan 16 #Python
PyCharm汉化安装及永久激活详细教程(靠谱)
Jan 16 #Python
python如何使用Redis构建分布式锁
Jan 16 #Python
Python中url标签使用知识点总结
Jan 16 #Python
PyTorch的SoftMax交叉熵损失和梯度用法
Jan 15 #Python
pytorch方法测试——激活函数(ReLU)详解
Jan 15 #Python
You might like
一个可查询所有表的“通用”查询分页类
2006/10/09 PHP
Linux fgetcsv取得的数组元素为空字符串的解决方法
2011/11/25 PHP
php查找任何页面上的所有链接的方法
2013/12/03 PHP
DOM下的节点属性和操作小结
2009/05/14 Javascript
javascript右下角弹层及自动隐藏(自己编写)
2013/11/20 Javascript
页面定时刷新(1秒刷新一次)
2013/11/22 Javascript
浅析javascript 定时器
2014/12/23 Javascript
如何编写高质量JS代码(续)
2015/02/25 Javascript
MVVM模式中ViewModel和View、Model有什么区别?
2015/06/19 Javascript
jquery实现表格中点击相应行变色功能效果【实例代码】
2016/05/09 Javascript
jQuery实现带遮罩层效果的blockUI弹出层示例【附demo源码下载】
2016/09/14 Javascript
js方法数据验证的简单实例
2016/09/17 Javascript
详解jQuery uploadify文件上传插件的使用方法
2016/12/16 Javascript
nodejs结合Socket.IO实现的即时通讯功能详解
2018/01/12 NodeJs
vue2.0 可折叠列表 v-for循环展示的实例
2018/09/07 Javascript
vue + element-ui的分页问题实现
2018/12/17 Javascript
vue中英文切换实例代码
2020/01/21 Javascript
JQuery实现折叠式菜单的详细代码
2020/06/03 jQuery
JavaScript this关键字指向常用情况解析
2020/09/02 Javascript
Python urllib模块urlopen()与urlretrieve()详解
2013/11/01 Python
python安装PIL模块时Unable to find vcvarsall.bat错误的解决方法
2016/09/19 Python
Python计算时间间隔(精确到微妙)的代码实例
2019/02/26 Python
多个python文件调用logging模块报错误
2020/02/12 Python
python支持多继承吗
2020/06/19 Python
Python TestSuite生成测试报告过程解析
2020/07/23 Python
详解HTML5新增标签
2017/11/27 HTML / CSS
HTML5输入框下拉菜单功能的示例代码
2020/09/08 HTML / CSS
具有防紫外线功能的高性能钓鱼服装:Hook&Tackle
2018/08/16 全球购物
Elizabeth Gage官网:英国最好的珠宝设计之一
2020/09/26 全球购物
交通安全演讲稿
2014/01/07 职场文书
2014年标准化工作总结
2014/12/17 职场文书
胡雪岩故居导游词
2015/02/06 职场文书
宾馆安全管理制度
2015/08/06 职场文书
2016年党支部公开承诺书
2016/03/25 职场文书
python实现MD5进行文件去重的示例代码
2021/07/09 Python
vue组件冲突之引用另一个组件出现组件不显示的问题
2022/04/13 Vue.js