Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python读取图片EXIF信息类库介绍和使用实例
Jul 10 Python
Python异常处理总结
Aug 15 Python
Python字符串格式化输出方法分析
Apr 13 Python
常见的python正则用法实例讲解
Jun 21 Python
利用ctypes提高Python的执行速度
Sep 09 Python
Python爬取网易云音乐热门评论
Mar 31 Python
Python3安装Scrapy的方法步骤
Nov 23 Python
利用Python将文本中的中英文分离方法
Oct 31 Python
利用Python实现kNN算法的代码
Aug 16 Python
Python socket非阻塞模块应用示例
Sep 12 Python
在django-xadmin中APScheduler的启动初始化实例
Nov 15 Python
python实现自动化报表功能(Oracle/plsql/Excel/多线程)
Dec 02 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
PHP与MySQL开发中页面出现乱码的一种解决方法
2007/07/29 PHP
PHP 网页过期时间的控制代码
2009/06/29 PHP
php笔记之常用文件操作
2010/10/12 PHP
curl实现站外采集的方法和技巧
2014/01/31 PHP
php 生成自动创建文件夹并上传文件的示例代码
2014/03/07 PHP
php结合web uploader插件实现分片上传文件
2016/05/10 PHP
php利用云片网实现短信验证码功能的示例代码
2017/11/18 PHP
Aliyun Linux 编译安装 php7.3 tengine2.3.2 mysql8.0 redis5的过程详解
2020/10/20 PHP
jQuery(1.6.3) 中css方法对浮动的实现缺陷分析
2011/09/09 Javascript
JS连连看源码完美注释版(推荐)
2013/12/09 Javascript
JS异步文件上传(兼容IE8+)
2017/04/02 Javascript
JavaScript严格模式下关于this的几种指向详解
2017/07/12 Javascript
解决npm管理员身份install时出现权限的问题
2018/03/16 Javascript
如何用webpack4带你实现一个vue的打包的项目
2018/06/20 Javascript
Vue项目查看当前使用的elementUI版本的方法
2018/09/27 Javascript
elementUI 设置input的只读或禁用的方法
2018/10/30 Javascript
Vue项目部署在Spring Boot出现页面空白问题的解决方案
2018/11/26 Javascript
JS实现小星星特效
2019/12/24 Javascript
快速解决Vue、element-ui的resetFields()方法重置表单无效的问题
2020/08/12 Javascript
[05:09]2016国际邀请赛中国区预选赛淘汰赛首日精彩回顾
2016/06/29 DOTA
python通过百度地图API获取某地址的经纬度详解
2018/01/28 Python
Python使用pyautogui模块实现自动化鼠标和键盘操作示例
2018/09/04 Python
Python爬虫新手入门之初学lxml库
2020/12/20 Python
Python制作运行进度条的实现效果(代码运行不无聊)
2021/02/24 Python
浅析CSS3中鲜为人知的属性:-webkit-tap-highlight-color
2017/01/12 HTML / CSS
Html5 Canvas 实现一个“刮刮乐”游戏
2019/09/05 HTML / CSS
中文专业自荐书
2014/06/29 职场文书
语文课外活动总结
2014/08/27 职场文书
12.4全国法制宣传日活动总结
2014/11/01 职场文书
保险公司客户经理岗位职责
2015/04/09 职场文书
小学生节水倡议书
2015/04/29 职场文书
2015年大学辅导员工作总结
2015/05/12 职场文书
高中美术教学反思
2016/02/17 职场文书
新手必备之MySQL msi版本下载安装图文详细教程
2021/05/21 MySQL
Spring mvc是如何实现与数据库的前后端的连接操作的?
2021/06/30 Java/Android
java设计模式--原型模式详解
2021/07/21 Java/Android