Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python+Django在windows下的开发环境配置图解
Nov 11 Python
在Python中移动目录结构的方法
Jan 31 Python
Python中遍历字典过程中更改元素导致异常的解决方法
May 12 Python
Python随机生成均匀分布在单位圆内的点代码示例
Nov 13 Python
python 寻找优化使成本函数最小的最优解的方法
Dec 28 Python
获取python文件扩展名和文件名方法
Feb 02 Python
python  创建一个保留重复值的列表的补码
Oct 15 Python
Python中遍历列表的方法总结
Jun 27 Python
python 抓包保存为pcap文件并解析的实例
Jul 23 Python
python 修改本地网络配置的方法
Aug 14 Python
tensorflow 实现从checkpoint中获取graph信息
Feb 10 Python
keras中的History对象用法
Jun 19 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
PHP 中文处理技巧
2010/04/25 PHP
PhpDocumentor 2安装以及生成API文档的方法
2014/05/21 PHP
ThinkPHP有变量的where条件分页实例
2014/11/03 PHP
laravel框架与其他框架的详细对比
2019/10/23 PHP
PHP数组基本用法与知识点总结
2020/06/02 PHP
如果文字过长,则将过长的部分变成省略号显示
2006/06/26 Javascript
弹出广告特效代码(一个IP只弹出一次)
2007/05/11 Javascript
jQuery 位置函数offset,innerWidth,innerHeight,outerWidth,outerHeight,scrollTop,scrollLeft
2010/03/23 Javascript
事件模型在各浏览器中存在差异
2010/10/20 Javascript
jquery自动补齐功能插件flexselect用法示例
2016/08/06 Javascript
微信小程序 Flex布局详解
2016/10/09 Javascript
JS实现最简单的冒泡排序算法
2017/02/15 Javascript
AngularJS执行流程详解
2017/02/17 Javascript
vue2.0实战之基础入门(1)
2017/03/27 Javascript
Vue.js仿Metronic高级表格(一)静态设计
2017/04/17 Javascript
JavaScript运动框架 解决速度正负取整问题(一)
2017/05/17 Javascript
详解前后端分离之VueJS前端
2017/05/24 Javascript
JavaWeb表单及时验证功能在输入后立即验证(含用户类型,性别,爱好...的验证)
2017/06/09 Javascript
JavaScript 高性能数组去重的方法
2018/09/20 Javascript
js动态获取时间的方法分析
2019/08/02 Javascript
JS实现简单随机3D骰子
2019/10/24 Javascript
vue实现权限控制路由(vue-router 动态添加路由)
2019/11/04 Javascript
javascript实现前端成语点击验证
2020/06/24 Javascript
python用来获得图片exif信息的库实例分析
2015/03/16 Python
深入解析Python中的urllib2模块
2015/11/13 Python
对numpy数据写入文件的方法讲解
2018/07/09 Python
Python 网络编程之UDP发送接收数据功能示例【基于socket套接字】
2019/10/11 Python
PYQT5开启多个线程和窗口,多线程与多窗口的交互实例
2019/12/13 Python
Python实现疫情通定时自动填写功能(附代码)
2020/05/27 Python
澳洲小众品牌的集合网站:BNKR
2018/02/23 全球购物
程序员机试试题汇总
2012/03/07 面试题
给物业的表扬信
2014/01/21 职场文书
作风建设年活动总结
2014/08/27 职场文书
领导干部考核评语
2015/01/04 职场文书
同意报考证明
2015/06/17 职场文书
食品安全主题班会
2015/08/13 职场文书