Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作日期和时间的方法
Mar 11 Python
python编写暴力破解FTP密码小工具
Nov 19 Python
Python list操作用法总结
Nov 10 Python
一张图带我们入门Python基础教程
Feb 05 Python
Python数据类型之String字符串实例详解
May 08 Python
Django RBAC权限管理设计过程详解
Aug 06 Python
python程序输出无内容的解决方式
Apr 09 Python
基于python实现获取网页图片过程解析
May 11 Python
python下对hsv颜色空间进行量化操作
Jun 04 Python
python中字典增加和删除使用方法
Sep 30 Python
Python批量删除mysql中千万级大量数据的脚本分享
Dec 03 Python
Python Matplotlib绘制动画的代码详解
May 30 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
PHP类与对象后期静态绑定操作实例详解
2018/12/20 PHP
PHP配合fiddler抓包抓取微信指数小程序数据的实现方法分析
2020/01/02 PHP
PHP与Web页面交互操作实例分析
2020/06/02 PHP
Track Image Loading效果代码分析
2007/08/13 Javascript
javascript 一段左右两边随屏滚动的代码
2009/06/18 Javascript
Javascript结合css实现网页换肤功能
2009/11/02 Javascript
js FLASH幻灯片字符串中有连接符&的处理方法
2012/03/01 Javascript
Js操作树节点自动折叠展开的几种方法
2014/05/05 Javascript
浅谈jQuery中 wrap() wrapAll() 与 wrapInner()的差异
2014/11/12 Javascript
javascript 判断整数方法分享
2014/12/16 Javascript
jQuery知识点整理
2015/01/30 Javascript
animate 实现滑动切换效果【实例代码】
2016/05/05 Javascript
JS刷新父窗口的几种方式小结(推荐)
2016/11/09 Javascript
AngularJS2中一种button切换效果的实现方法(二)
2017/03/27 Javascript
bootstrap suggest下拉框使用详解
2017/04/10 Javascript
JavaScript全屏和退出全屏事件总结(附代码)
2017/08/17 Javascript
微信小程序实现星级评价效果
2018/12/28 Javascript
Nodejs在局域网配置https访问的实现方法
2020/10/17 NodeJs
[07:52]2014DOTA2 TI逗比武士游V社解说背后的故事
2014/07/10 DOTA
[01:34]DOTA2 7.22版本新增神杖效果一览(敏捷英雄篇)
2019/05/28 DOTA
使用beaker让Facebook的Bottle框架支持session功能
2015/04/23 Python
在win和Linux系统中python命令行运行的不同
2016/07/03 Python
python实现简单聊天室功能 可以私聊
2019/07/12 Python
python用pip install时安装失败的一系列问题及解决方法
2020/02/24 Python
在python tkinter界面中添加按钮的实例
2020/03/04 Python
CSS3实现DIV圆角效果完整代码
2012/10/10 HTML / CSS
怎样实现H5+CSS3手指滑动切换图片的示例代码
2019/05/05 HTML / CSS
中国旅游网站:途牛旅游网
2019/09/29 全球购物
自然健康的概念:Natural Healthy Concepts
2020/01/26 全球购物
介绍一下Java的事务处理
2012/12/07 面试题
制药工程专业个人求职自荐信
2014/01/25 职场文书
物业消防安全责任书
2014/07/23 职场文书
迁徙的鸟观后感
2015/06/09 职场文书
毕业生求职自荐信(2016最新版)
2016/01/28 职场文书
解析CSS 提取图片主题色功能(小技巧)
2021/05/12 HTML / CSS
什么是SOLID
2022/03/24 Javascript