Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的rfind()方法使用详解
May 19 Python
python中WSGI是什么,Python应用WSGI详解
Nov 24 Python
python读取一个目录下所有txt里面的内容方法
Jun 23 Python
浅析python3中的os.path.dirname(__file__)的使用
Aug 30 Python
使用Template格式化Python字符串的方法
Jan 22 Python
详解Python静态网页爬取获取高清壁纸
Apr 23 Python
python文档字符串(函数使用说明)使用详解
Jul 30 Python
Python (Win)readline和tab补全的安装方法
Aug 27 Python
Python爬虫实现使用beautifulSoup4爬取名言网功能案例
Sep 15 Python
深入浅析python 中的self和cls的区别
Jun 20 Python
Python中Qslider控件实操详解
Feb 20 Python
python实现腾讯滑块验证码识别
Apr 27 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
PHP XML操作类DOMDocument
2009/12/16 PHP
PHP的几个常用数字判断函数代码
2012/04/24 PHP
腾讯CMEM的PHP扩展编译安装方法
2015/09/25 PHP
PHP 实现链式操作
2021/03/09 PHP
Prototype 学习 工具函数学习($w,$F方法)
2009/07/12 Javascript
js常用代码段收集
2011/10/28 Javascript
深入理解JavaScript系列(4) 立即调用的函数表达式
2012/01/15 Javascript
JQuery分别取得每行最后一列和最后一行的示例代码
2013/08/18 Javascript
js或jquery实现页面打印可局部打印
2014/03/27 Javascript
AMD异步模块定义介绍和Require.js中使用jQuery及jQuery插件的方法
2014/06/06 Javascript
JavaScript中统计Textarea字数并提示还能输入的字符
2014/06/10 Javascript
jQuery中siblings()方法用法实例
2015/01/08 Javascript
JavaScript实现的字符串replaceAll函数代码分享
2015/04/02 Javascript
多功能jQuery树插件zTree实现权限列表简单实例
2016/07/12 Javascript
很棒的一组js图片轮播特效
2017/01/12 Javascript
JS正则替换去空格的方法
2017/03/24 Javascript
Angular实现一个简单的多选复选框的弹出框指令实例
2017/04/25 Javascript
ckeditor一键排版功能实现方法分析
2020/02/06 Javascript
原生JS实现萤火虫效果
2020/03/07 Javascript
vue 封装 Adminlte3组件的实现
2020/03/18 Javascript
vue iview 隐藏Table组件里的某一列操作
2020/11/13 Javascript
[01:52]深扒TI7聊天轮盘语音出处7
2017/05/11 DOTA
[15:20]DOTA2-DPC中国联赛 正赛 Elephant vs Aster 选手采访
2021/03/11 DOTA
python根据经纬度计算距离示例
2014/02/16 Python
python抓取网页时字符集转换问题处理方案分享
2014/06/19 Python
python如何生成网页验证码
2018/07/28 Python
Python第三方Window模块文件的几种安装方法
2018/11/22 Python
python3编写ThinkPHP命令执行Getshell的方法
2019/02/26 Python
python3实现字符串操作的实例代码
2019/04/16 Python
django 基于中间件实现限制ip频繁访问过程详解
2019/07/30 Python
简单了解python装饰器原理及使用方法
2019/12/18 Python
H5离线存储Manifest原理及使用
2020/04/28 HTML / CSS
Perry Ellis官网:美国男士品味服装
2016/12/09 全球购物
大学应届生的自我评价
2014/03/06 职场文书
2014年机关党委工作总结
2014/12/11 职场文书
详解SpringBoot异常处理流程及原理
2021/06/21 Java/Android