Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python动态监控日志内容的示例
Feb 16 Python
有关wxpython pyqt内存占用问题分析
Jun 09 Python
在SAE上部署Python的Django框架的一些问题汇总
May 30 Python
python中使用iterrows()对dataframe进行遍历的实例
Jun 09 Python
python实现将读入的多维list转为一维list的方法
Jun 28 Python
如何使用Python进行OCR识别图片中的文字
Apr 01 Python
Python socket模块实现的udp通信功能示例
Apr 10 Python
django框架auth模块用法实例详解
Dec 10 Python
python中有关时间日期格式转换问题
Dec 25 Python
Keras 利用sklearn的ROC-AUC建立评价函数详解
Jun 15 Python
Python 高效编程技巧分享
Sep 10 Python
python爬虫分布式获取数据的实例方法
Nov 26 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
深入php define()函数以及defined()函数的用法详解
2013/06/05 PHP
php递归函数中使用return的注意事项
2014/01/17 PHP
php生成无限栏目树
2017/03/16 PHP
ThinkPHP中调用PHPExcel的实现代码
2017/04/08 PHP
PHP实现PDO操作mysql存储过程示例
2019/02/13 PHP
Swoole 5将移除自动添加Event::wait()特性详解
2019/07/10 PHP
jQeury淡入淡出需要注意的问题
2010/09/08 Javascript
Javascript学习指南
2014/12/01 Javascript
jQuery给多个不同元素添加class样式的方法
2015/03/26 Javascript
微信WeixinJSBridge API使用实例
2015/05/25 Javascript
Node.js的Express框架使用上手指南
2016/03/12 Javascript
JavaScript蒙板(model)功能的简单实现代码
2016/08/04 Javascript
js自调用匿名函数的三种写法(推荐)
2016/08/19 Javascript
jQuery简单创建节点的方法
2016/09/09 Javascript
js实现可以点击收缩或张开的悬浮窗
2017/09/18 Javascript
Node.js文件编码格式的转换的方法
2018/04/27 Javascript
vue-cli 如何打包上线的方法示例
2018/05/08 Javascript
Vue实现简易翻页效果源码分享
2018/11/08 Javascript
vue 如何从单页应用改造成多页应用
2020/10/23 Javascript
详解vue-router的导航钩子(导航守卫)
2020/11/02 Javascript
[51:05]DOTA2上海特级锦标赛主赛事日 - 5 败者组决赛Liquid VS EG第一局
2016/03/06 DOTA
[01:52]深扒TI7聊天轮盘语音出处7
2017/05/11 DOTA
[49:08]完美世界DOTA2联赛PWL S2 LBZS vs FTD.C 第一场 11.27
2020/12/01 DOTA
使用python进行波形及频谱绘制的方法
2019/06/17 Python
pytorch下大型数据集(大型图片)的导入方式
2020/01/08 Python
python GUI库图形界面开发之PyQt5 MDI(多文档窗口)QMidArea详细使用方法与实例
2020/03/05 Python
Python使用Numpy模块读取文件并绘制图片
2020/05/13 Python
如何使用css3实现一个类在线直播的队列动画的示例代码
2020/06/17 HTML / CSS
印尼最大的网上书店:Gramedia.com
2018/09/13 全球购物
Sunglasses Shop英国:欧洲领先的太阳镜在线供应商之一
2018/09/19 全球购物
微笑服务演讲稿
2014/05/13 职场文书
公司承诺书范文
2014/05/19 职场文书
学习焦裕禄观后感
2015/06/09 职场文书
php中配置文件保存修改操作 如config.php文件的读取修改等操作
2021/05/12 PHP
java中重写父类方法加不加@Override详解
2021/06/21 Java/Android
世界十大狙击步枪排行榜
2022/03/20 杂记