Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python文件读取的3种方法及路径转义
Jun 21 Python
详解Python编程中包的概念与管理
Oct 16 Python
python验证码识别的实例详解
Sep 09 Python
使用Python多线程爬虫爬取电影天堂资源
Sep 23 Python
Python中的is和==比较两个对象的两种方法
Sep 06 Python
如何在python中使用selenium的示例
Dec 26 Python
Python实现图片裁剪的两种方式(Pillow和OpenCV)
Oct 30 Python
Anaconda配置pytorch-gpu虚拟环境的图文教程
Apr 16 Python
PyQt5实现简单的计算器
May 30 Python
Python3爬虫带上cookie的实例代码
Jul 28 Python
python自动化测试三部曲之request+django实现接口测试
Oct 07 Python
Python图片处理之图片裁剪教程
May 27 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
PHP简单读取PDF页数的实现方法
2016/07/21 PHP
如何实现浏览器上的右键菜单
2006/07/10 Javascript
JS合并数组的几种方法及优劣比较
2014/09/19 Javascript
JavaScript实现仿新浪微博大厅和腾讯微博首页滚动特效源码
2015/09/15 Javascript
label+input实现按钮开关切换效果的实例
2017/08/16 Javascript
vue.js语法及常用指令
2017/10/29 Javascript
react router4+redux实现路由权限控制的方法
2018/05/03 Javascript
JS防抖和节流实例解析
2019/09/24 Javascript
JavaScript禁止右击保存图片,禁止拖拽图片的实现代码
2020/04/28 Javascript
解决VUE-Router 同一页面第二次进入不刷新的问题
2020/07/22 Javascript
基于vue中的scoped坑点解说
2020/09/04 Javascript
[01:33:30]DOTA2-DPC中国联赛 正赛 RNG vs Phoenix BO3 第二场 2月5日
2021/03/11 DOTA
python处理文本文件实现生成指定格式文件的方法
2014/07/31 Python
在Python中使用M2Crypto模块实现AES加密的教程
2015/04/08 Python
wxPython定时器wx.Timer简单应用实例
2015/06/03 Python
python reduce 函数使用详解
2017/12/05 Python
SVM基本概念及Python实现代码
2017/12/27 Python
Python3.5面向对象程序设计之类的继承和多态详解
2019/04/24 Python
python实现对服务器脚本敏感信息的加密解密功能
2019/08/13 Python
scikit-learn线性回归,多元回归,多项式回归的实现
2019/08/29 Python
Python Numpy,mask图像的生成详解
2020/02/19 Python
Nginx+Uwsgi+Django 项目部署到服务器的思路详解
2020/05/08 Python
python numpy库np.percentile用法说明
2020/06/08 Python
css3 线性渐变和径向渐变示例附图
2014/04/08 HTML / CSS
德国购买踏板车网站:Microscooter
2019/10/14 全球购物
请解释virtual关键字的含义
2015/06/17 面试题
车间班长岗位职责
2013/11/30 职场文书
大学活动策划书范文
2014/01/10 职场文书
纪念建党演讲稿范文
2014/01/13 职场文书
入党自我鉴定
2014/03/25 职场文书
电子专业毕业生自荐信
2014/05/25 职场文书
领导干部廉政自律承诺书
2014/05/26 职场文书
工地宣传标语
2014/06/18 职场文书
文明班级申报材料
2014/12/24 职场文书
平凡的世界读书笔记
2015/06/25 职场文书
详解运行Python的神器Jupyter Notebook
2021/06/03 Python