Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用py2exe打包程序介绍
Nov 20 Python
使用Python设计一个代码统计工具
Apr 04 Python
python读取LMDB中图像的方法
Jul 02 Python
python中多个装饰器的执行顺序详解
Oct 08 Python
python3.6利用pyinstall打包py为exe的操作实例
Oct 31 Python
基于python历史天气采集的分析
Feb 14 Python
浅析Python 实现一个自动化翻译和替换的工具
Apr 14 Python
基于多进程中APScheduler重复运行的解决方法
Jul 22 Python
Python 70行代码实现简单算式计算器解析
Aug 30 Python
python3.6环境下安装freetype库和基本使用方法(推荐)
May 10 Python
增大python字体的方法步骤
Jul 05 Python
简述 Python 的类和对象
Aug 21 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
set_include_path和get_include_path使用及注意事项
2013/02/02 PHP
PHP中比较时间大小实例
2014/08/21 PHP
实例讲解PHP设计模式编程中的简单工厂模式
2016/02/29 PHP
ThinkPHP连接Oracle数据库
2016/04/22 PHP
Laravel中使用FormRequest进行表单验证方法及问题汇总
2016/06/19 PHP
php 防止表单重复提交两种实现方法
2016/11/03 PHP
php二维码生成以及下载实现
2017/09/28 PHP
Javascript中eval函数的使用方法与示例
2007/04/09 Javascript
JavaScript脚本性能优化注意事项
2008/11/18 Javascript
JS遮罩层效果 兼容ie firefox jQuery遮罩层
2010/07/26 Javascript
ie6下png图片背景不透明的解决办法使用js实现
2013/01/11 Javascript
js实现简单的联动菜单效果
2015/08/19 Javascript
jQuery实现可编辑的表格实例讲解(2)
2015/09/17 Javascript
Jquery ajax加载等待执行结束再继续执行下面代码操作
2015/11/24 Javascript
AngularJS页面传参的5种方式
2017/04/01 Javascript
利用jQuery实现简单的拖曳效果实例代码
2017/10/20 jQuery
NodeJS实现视频转码的示例代码
2017/11/18 NodeJs
如何快速解决JS或Jquery ajax异步跨域的问题
2018/01/08 jQuery
JavaScript格式化json和xml的方法示例
2019/01/22 Javascript
layui使用button按钮 点击出现弹层 弹层中加载表单的实例
2019/09/04 Javascript
《javascript设计模式》学习笔记四:Javascript面向对象程序设计链式调用实例分析
2020/04/07 Javascript
elementui实现预览图片组件二次封装
2020/12/29 Javascript
[07:57]DOTA2热力大趴狂欢夜 广州站活动回顾
2013/11/27 DOTA
[01:45]DOTA2众星出演!DSPL刀塔次级职业联赛宣传片
2014/11/21 DOTA
python对url格式解析的方法
2015/05/13 Python
Python环境Pillow( PIL )图像处理工具使用解析
2019/09/12 Python
python实现批量转换图片为黑白
2020/06/16 Python
canvas基础之图形验证码的示例
2018/01/02 HTML / CSS
linux面试题参考答案(5)
2016/11/05 面试题
外贸业务员工作职责
2014/01/06 职场文书
银行保安拾金不昧表扬稿
2015/05/05 职场文书
大学生学习十八届五中全会精神心得体会
2016/01/05 职场文书
制定企业培训计划的五大要点!
2019/07/10 职场文书
Python基础知识之变量的详解
2021/04/14 Python
python文件名批量重命名脚本实例代码
2021/04/22 Python
Mysql索引失效 数据库表中有索引还是查询很慢
2022/05/15 MySQL