Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
讲解Python中if语句的嵌套用法
May 14 Python
python 爬虫出现403禁止访问错误详解
Mar 11 Python
python编程线性回归代码示例
Dec 07 Python
分分钟入门python语言
Mar 20 Python
python查看模块安装位置的方法
Oct 16 Python
对Python random模块打乱数组顺序的实例讲解
Nov 08 Python
如何将你的应用迁移到Python3的三个步骤
Dec 22 Python
深入了解如何基于Python读写Kafka
Dec 31 Python
pymysql的简单封装代码实例
Jan 08 Python
TensorFlow使用Graph的基本操作的实现
Apr 22 Python
详解pandas绘制矩阵散点图(scatter_matrix)的方法
Apr 23 Python
解决更改AUTH_USER_MODEL后出现的问题
May 14 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
短波收音机简介
2021/03/01 无线电
php中json_encode UTF-8中文乱码的更好解决方法
2014/09/28 PHP
php字符串替换函数substr_replace()用法实例
2015/03/17 PHP
PHP preg_match实现正则表达式匹配功能【输出是否匹配及匹配值】
2017/07/19 PHP
laravel 5.3 单用户登录简单实现方法
2019/10/14 PHP
jQuery EasyUI API 中文文档 - PropertyGrid属性表格
2011/11/18 Javascript
20款非常优秀的 jQuery 工具提示插件 推荐
2012/07/15 Javascript
js判断样式className同时增加class或删除class
2013/01/30 Javascript
js substr支持中文截取函数代码(中文是双字节)
2013/04/17 Javascript
js获得地址栏?问号后参数的方法
2013/08/08 Javascript
jquery实现盒子下拉效果示例代码
2013/09/12 Javascript
浅析offsetLeft,Left,clientLeft之间的区别
2013/11/30 Javascript
JavaScript的代码编写格式规范指南
2015/12/07 Javascript
图解Sublime Text3使用技巧
2015/12/21 Javascript
详解js私有作用域中创建特权方法
2016/01/25 Javascript
基于Vue.js的表格分页组件
2016/05/22 Javascript
JavaScript  event对象整理及详细介绍
2016/10/10 Javascript
老生常谈js-react组件生命周期
2017/05/02 Javascript
JS随机排序数组实现方法分析
2017/10/11 Javascript
JavaScript事件冒泡与事件捕获实例分析
2018/08/01 Javascript
JS加密插件CryptoJS实现的DES加密示例
2018/08/16 Javascript
js神秘的电报密码 哈弗曼编码实现
2019/09/10 Javascript
Vue + Node.js + MongoDB图片上传组件实现图片预览和删除功能详解
2020/04/29 Javascript
vue+animation实现翻页动画
2020/06/29 Javascript
python打开文件并获取文件相关属性的方法
2015/04/23 Python
python保存字符串到文件的方法
2015/07/01 Python
python3实现163邮箱SMTP发送邮件
2018/05/22 Python
Python 中 function(#) (X)格式 和 (#)在Python3.*中的注意事项
2018/11/30 Python
对python中Librosa的mfcc步骤详解
2019/01/09 Python
使用matlab或python将txt文件转为excel表格
2019/11/01 Python
加拿大最大的钻石商店:Peoples Jewellers
2018/01/01 全球购物
一年级家长会邀请函
2014/01/25 职场文书
校园联欢晚会主持词
2014/03/17 职场文书
家长通知书家长评语
2014/04/17 职场文书
运动会班级前导词
2015/07/20 职场文书
班主任班级管理心得体会
2016/01/07 职场文书