Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python用于url解码和中文解析的小脚本(python url decoder)
Aug 11 Python
Python中利用原始套接字进行网络编程的示例
May 04 Python
在Python的Django框架中加载模版的方法
Jul 16 Python
利用Python如何实现数据驱动的接口自动化测试
May 11 Python
浅析python中的迭代与迭代对象
Oct 08 Python
python list格式数据excel导出方法
Oct 31 Python
用Python识别人脸,人种等各种信息
Jul 15 Python
Python使用lambda表达式对字典排序操作示例
Jul 25 Python
Python类的绑定方法和非绑定方法实例解析
Mar 04 Python
Python Pillow(PIL)库的用法详解
Sep 19 Python
Python编写可视化界面的全过程(Python+PyCharm+PyQt)
May 17 Python
详解Golang如何实现支持随机删除元素的堆
Sep 23 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
初学PHP的朋友 经常问的一些问题。不断更新
2011/08/11 PHP
php中unlink()、mkdir()、rmdir()等方法的使用介绍
2012/12/21 PHP
PHP中如何调用webservice的实例参考
2013/04/25 PHP
PHP开发框架Laravel数据库操作方法总结
2014/09/03 PHP
php实现简单的上传进度条
2015/11/17 PHP
firefox中JS读取XML文件
2006/12/21 Javascript
javascript 尚未实现错误解决办法
2008/11/27 Javascript
javascript 冒泡排序 正序和倒序实现代码
2010/12/14 Javascript
jquery解析XML字符串和XML文件的方法说明
2014/02/21 Javascript
Javascript封装DOMContentLoaded事件实例
2014/06/12 Javascript
jQuery中data()方法用法实例
2014/12/27 Javascript
AngularJs concepts详解及示例代码
2016/09/01 Javascript
Javascript实现前端简单的路由实例
2016/09/11 Javascript
backbone简介_动力节点Java学院整理
2017/07/14 Javascript
浅谈vue+webpack项目调试方法步骤
2017/09/11 Javascript
微信小程序如何利用getCurrentPages进行页面传值
2019/07/01 Javascript
Python中tell()方法的使用详解
2015/05/24 Python
使用url_helper简化Python中Django框架的url配置教程
2015/05/30 Python
Python通过future处理并发问题
2017/10/17 Python
Pyinstaller将py打包成exe的实例
2018/03/31 Python
Python字符串中删除特定字符的方法
2020/01/15 Python
如何验证python安装成功
2020/07/06 Python
python对 MySQL 数据库进行增删改查的脚本
2020/10/22 Python
TripAdvisor日本:全球领先的旅游网站
2019/02/14 全球购物
求职信模版
2013/11/30 职场文书
饲料采购员岗位职责
2013/12/19 职场文书
创建文明学校实施方案
2014/03/11 职场文书
三月法制宣传月活动总结
2014/07/03 职场文书
我爱祖国演讲稿
2014/09/02 职场文书
乡镇党建工作汇报材料
2014/10/27 职场文书
小学英语复习计划
2015/01/19 职场文书
泰山导游词
2015/02/02 职场文书
2015年设计师个人工作总结
2015/04/25 职场文书
青年志愿者服务活动总结
2015/05/06 职场文书
小学数学新课改心得体会
2016/01/22 职场文书
详解盒子端CSS动画性能提升
2021/05/24 HTML / CSS