Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现把utf-8格式的文件转换成gbk格式的文件
Jan 22 Python
整理Python中的赋值运算符
May 13 Python
使用Python的PIL模块来进行图片对比
Feb 18 Python
Python使用functools模块中的partial函数生成偏函数
Jul 02 Python
python操作xlsx文件的包openpyxl实例
May 03 Python
Django跨域请求问题的解决方法示例
Jun 16 Python
python 使用turtule绘制递归图形(螺旋、二叉树、谢尔宾斯基三角形)
May 30 Python
Python中的十大图像处理工具(小结)
Jun 10 Python
python hashlib加密实现代码
Oct 17 Python
18个Python脚本可加速你的编码速度(提示和技巧)
Oct 17 Python
python虚拟环境模块venv使用及示例
Mar 04 Python
Python爬虫之Selenium库的使用方法
Jan 03 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
解析php防止form重复提交的方法
2013/07/01 PHP
php学习笔记之基础知识
2014/11/08 PHP
php使用wordwrap格式化文本段落的方法
2015/03/17 PHP
调用js时ie6和ie7,ff的区别
2009/08/19 Javascript
JavaScript中出现乱码的处理心得
2009/12/24 Javascript
javascript 最常用的10个自定义函数[推荐]
2009/12/26 Javascript
基于jquery的页面划词搜索JS
2010/09/14 Javascript
js对象的比较
2011/02/26 Javascript
NodeJS url验证(url-valid)的使用方法
2013/11/18 NodeJs
JS实现仿百度输入框自动匹配功能的示例代码
2014/02/19 Javascript
nw.js实现类似微信的聊天软件
2015/03/16 Javascript
javascript实现图片左右滚动效果【可自动滚动,有左右按钮】
2016/09/19 Javascript
jQuery ajaxForm()的应用
2016/10/14 Javascript
微信小程序getPhoneNumber获取用户手机号
2017/09/29 Javascript
ionic选择多张图片上传的示例代码
2017/10/10 Javascript
详解angular脏检查原理及伪代码实现
2018/06/08 Javascript
小程序云开发获取不到数据库记录的解决方法
2019/05/18 Javascript
JS面向对象编程基础篇(三) 继承操作实例详解
2020/03/03 Javascript
vue使用Sass时报错问题的解决方法
2020/10/14 Javascript
vue使用require.context实现动态注册路由
2020/12/25 Vue.js
python求素数示例分享
2014/02/16 Python
python实现的登录和操作开心网脚本分享
2014/07/09 Python
日常整理python执行系统命令的常见方法(全)
2015/10/22 Python
使用Python内置的模块与函数进行不同进制的数的转换
2016/03/12 Python
Python使用matplotlib的pie函数绘制饼状图功能示例
2018/01/08 Python
解决Pyinstaller 打包exe文件 取消dos窗口(黑框框)的问题
2019/06/21 Python
python暴力解压rar加密文件过程详解
2019/07/05 Python
TensorFlow tf.nn.conv2d实现卷积的方式
2020/01/03 Python
python speech模块的使用方法
2020/09/09 Python
Python基于template实现字符串替换
2020/11/27 Python
皇家阿尔伯特英国官方商店:Royal Albert骨瓷
2019/03/25 全球购物
Yahoo-PHP面试题4
2012/05/05 面试题
如何用SQL语句进行模糊查找
2015/09/25 面试题
英语专业学生个人求职信范文
2014/01/06 职场文书
国家助学金感谢信
2015/01/21 职场文书
四则混合运算教学反思
2016/02/23 职场文书