Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python中的匿名函数使用简介
Apr 27 Python
详细解读Python中的__init__()方法
May 02 Python
Python中的异常处理相关语句基础学习笔记
Jul 11 Python
python的exec、eval使用分析
Dec 11 Python
Python多进程multiprocessing.Pool类详解
Apr 27 Python
使用PyInstaller将python转成可执行文件exe笔记
May 26 Python
Python操作mongodb数据库进行模糊查询操作示例
Jun 09 Python
wxPython实现列表增删改查功能
Nov 19 Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 Python
用Python 爬取猫眼电影数据分析《无名之辈》
Jul 24 Python
python中判断数字是否为质数的实例讲解
Dec 06 Python
python绘制简单直方图(质量分布图)的方法
Apr 21 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
PHP4(windows版本)中的COM函数
2006/10/09 PHP
php strnatcmp()函数的用法总结
2013/11/27 PHP
PHP中获取时间的下一周下个月的方法
2014/03/18 PHP
php像数组一样存取和修改字符串字符
2014/03/21 PHP
php微信公众号开发(4)php实现自定义关键字回复
2016/12/15 PHP
基于JQuery的简单实现折叠菜单代码
2010/09/15 Javascript
JS运行耗时操作的延时显示方法
2010/11/19 Javascript
jQuery-Easyui 1.2 实现多层菜单效果的代码
2012/01/13 Javascript
ASP.NET jQuery 实例12 通过使用jQuery validation插件简单实现用户注册页面验证功能
2012/02/03 Javascript
单击按钮显示隐藏子菜单经典案例
2013/01/04 Javascript
javascript完美拖拽的实现方法
2013/09/29 Javascript
js导出txt示例代码
2014/01/14 Javascript
node.js 开发指南 ? Node.js 连接 MySQL 并进行数据库操作
2014/07/29 Javascript
javascript中闭包(Closure)详解
2016/01/06 Javascript
JS实现全屏的四种写法
2016/12/30 Javascript
JavaScript制作简易计算器(不用eval)
2017/02/05 Javascript
深入理解vue-router之keep-alive
2017/08/31 Javascript
JS沙箱模式实例分析
2017/09/04 Javascript
Node.JS循环删除非空文件夹及子目录下的所有文件
2018/03/12 Javascript
三分钟学会用ES7中的Async/Await进行异步编程
2018/06/14 Javascript
小程序实现搜索框功能
2020/03/26 Javascript
Js实现复选框的全选、全不选反选功能代码实例
2020/02/28 Javascript
[55:02]2014 DOTA2国际邀请赛中国区预选赛 HGT VS Orenda
2014/05/21 DOTA
python 中文字符串的处理实现代码
2009/10/25 Python
使用python爬虫获取黄金价格的核心代码
2018/06/13 Python
Python面向对象之继承和组合用法实例分析
2018/08/27 Python
python dumps和loads区别详解
2020/02/04 Python
详解如何在css中引入自定义字体(font-face)
2018/05/17 HTML / CSS
体育教师工作总结的自我评价
2013/10/10 职场文书
吸烟检讨书2000字
2014/02/13 职场文书
公司合作协议范文
2014/10/01 职场文书
个人事迹材料怎么写
2014/12/30 职场文书
班委竞选稿范文
2015/11/21 职场文书
创业计划书之冷饮店
2019/09/27 职场文书
CSS实现章节添加自增序号的方法
2021/06/23 HTML / CSS
《极主夫道》真人电影正式预告 定档6月3日上映
2022/04/05 日漫