Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 文件和路径操作函数小结
Nov 23 Python
Python实现对比不同字体中的同一字符的显示效果
Apr 23 Python
TensorFlow saver指定变量的存取
Mar 10 Python
Python3.6基于正则实现的计算器示例【无优化简单注释版】
Jun 14 Python
python 统计数组中元素出现次数并进行排序的实例
Jul 02 Python
Python文件如何引入?详解引入Python文件步骤
Dec 10 Python
python实现图书借阅系统
Feb 20 Python
Python中的self用法详解
Aug 06 Python
numpy ndarray 按条件筛选数组,关联筛选的例子
Nov 26 Python
python return逻辑判断表达式实现解析
Dec 02 Python
Python socket聊天脚本代码实例
Jan 02 Python
keras获得某一层或者某层权重的输出实例
Jan 24 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
杏林同学录(九)
2006/10/09 PHP
php email邮箱正则
2008/10/08 PHP
PHP5+UTF8多文件上传类
2008/10/17 PHP
一个显示效果非常不错的PHP错误、异常处理类
2014/03/21 PHP
php去除换行(回车换行)的三种方法
2014/03/26 PHP
php中__destruct与register_shutdown_function执行的先后顺序问题
2014/10/17 PHP
PHP数学运算函数大汇总(经典值得收藏)
2016/04/01 PHP
PHP实现微信支付(jsapi支付)流程步骤详解
2018/03/15 PHP
JavaScript 对话框和状态栏使用说明
2009/10/25 Javascript
将Datatable转化成json发送前台实现思路
2013/09/06 Javascript
js switch case default 的用法示例介绍
2013/10/23 Javascript
javascript:window.open弹出窗口的位置问题
2014/03/18 Javascript
node+express+jade制作简单网站指南
2014/11/26 Javascript
深入理解JavaScript系列(33):设计模式之策略模式详解
2015/03/03 Javascript
关于安卓手机微信浏览器中使用XMLHttpRequest 2上传图片显示字节数为0的解决办法
2016/05/17 Javascript
学习使用Bootstrap栅格系统
2017/05/11 Javascript
解决Nodejs全局安装模块后找不到命令的问题
2018/05/15 NodeJs
CentOS7中源码编译安装NodeJS的完整步骤
2018/10/13 NodeJs
vuex Module将 store 分割成模块的操作
2020/12/07 Vue.js
设计模式中的原型模式在Python程序中的应用示例
2016/03/02 Python
python运行其他程序的实现方法
2017/07/14 Python
Python实现将一个正整数分解质因数的方法分析
2017/12/14 Python
python爬虫筛选工作实例讲解
2020/11/23 Python
CSS3制作漂亮的照片墙的实现代码
2016/06/08 HTML / CSS
HTML5 history新特性pushState、replaceState及两者的区别
2015/12/26 HTML / CSS
Html5页面获取微信公众号的openid的方法
2020/05/12 HTML / CSS
Johnston & Murphy官网: 约翰斯顿·墨菲牛津总统鞋
2018/01/09 全球购物
Math.round(11.5)等於多少? Math.round(-11.5)等於多少?
2015/01/27 面试题
工程造价与财务管理专业应届生求职信
2013/10/06 职场文书
商务日语专业毕业生自荐信
2014/03/27 职场文书
青春无悔演讲稿
2014/05/08 职场文书
2015年感恩节活动总结
2015/03/24 职场文书
三八节活动主持词
2015/07/04 职场文书
诺贝尔奖获得者名言100句:句句启人心智,值永久收藏
2019/08/09 职场文书
浅谈Mysql多表连接查询的执行细节
2021/04/24 MySQL
Python爬虫之自动爬取某车之家各车销售数据
2021/06/02 Python