Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 不同对象比较大小示例探讨
Aug 21 Python
Python爬取三国演义的实现方法
Sep 12 Python
python解决汉字编码问题:Unicode Decode Error
Jan 19 Python
简单了解Python中的几种函数
Nov 03 Python
Python实现Pig Latin小游戏实例代码
Feb 02 Python
Python 最大概率法进行汉语切分的方法
Dec 14 Python
ORM Django 终端打印 SQL 语句实现解析
Aug 09 Python
python TCP包注入方式
May 05 Python
Scrapy框架介绍之Puppeteer渲染的使用
Jun 19 Python
python如何删除列为空的行
Jul 17 Python
python如何快速拼接字符串
Oct 28 Python
Python自动化实战之接口请求的实现
May 30 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
【动漫杂谈】关于《请在T台上微笑》
2020/03/03 日漫
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
2007/03/29 PHP
通过php快速统计某个数据库中每张表的数据量
2012/09/04 PHP
PHP PDO fetch 模式各种参数的输出结果一览
2015/01/07 PHP
织梦sitemap地图实时推送给百度的教程
2015/08/03 PHP
PHP实现原比例生成缩略图的方法
2016/02/03 PHP
php 数组字符串搜索array_search技巧
2016/07/05 PHP
php从数据库中读取特定的行(实例)
2017/06/02 PHP
PHP数组基本用法与知识点总结
2020/06/02 PHP
40款非常有用的 jQuery 插件推荐(系列一)
2011/12/21 Javascript
JS定时关闭窗口的实例
2013/05/22 Javascript
网页中可关闭的漂浮窗口实现可自行调节
2013/08/20 Javascript
js 去除字符串第一位逗号的方法
2014/06/07 Javascript
jQuery源码分析之jQuery中的循环技巧详解
2014/09/06 Javascript
jquery预加载图片的方法
2015/05/27 Javascript
JS数组操作(数组增加、删除、翻转、转字符串、取索引、截取(切片)slice、剪接splice、数组合并)
2016/05/20 Javascript
jQuery动态改变多行文本框高度的方法
2016/09/07 Javascript
jquery写出PC端轮播图实例
2018/01/26 jQuery
Vue学习之常用指令实例详解
2020/01/06 Javascript
vue实现把接口单独存放在一个文件方式
2020/08/13 Javascript
js实现弹窗猜数字游戏
2020/11/26 Javascript
[37:50]VP vs TNC Supermajor小组赛B组 BO3 第一场 6.2
2018/06/03 DOTA
[40:03]Liquid vs Optic 2018国际邀请赛淘汰赛BO3 第一场 8.21
2018/08/22 DOTA
[58:00]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Elephant BO3 第二场 2月7日
2021/03/11 DOTA
轻松掌握python设计模式之策略模式
2016/11/18 Python
python字符串的方法与操作大全
2018/01/30 Python
python openpyxl使用方法详解
2019/07/18 Python
Pytorch保存模型用于测试和用于继续训练的区别详解
2020/01/10 Python
解决Pycharm 导入其他文件夹源码的2种方法
2020/02/12 Python
三步解决python PermissionError: [WinError 5]拒绝访问的情况
2020/04/22 Python
前端隐藏出边界内容的实现方法
2016/04/14 HTML / CSS
html5开发三八女王节表白神器
2018/03/07 HTML / CSS
安全保证书范文
2014/04/29 职场文书
2016年共产党员公开承诺书
2016/03/24 职场文书
Python&Matlab实现灰狼优化算法的示例代码
2022/03/21 Python
Python实现为PDF去除水印的示例代码
2022/04/03 Python