Python2实现的图片文本识别功能详解


Posted in Python onJuly 11, 2018

本文实例讲述了Python2实现的图片文本识别功能。分享给大家供大家参考,具体如下:

这里需要用到python的几个库,分别是pytesser,以及pytesser的依赖库PIL。python的版本建议用2.7或者2.7一下的都行,不建议用python3以上的,因为python3不向下兼容,所以有很多python2的东西它不支持

pytesser下载的话,我直接在pycharm里面下全是失败,用DOS的命令行下也是失败,所以还是自己直接去google下吧
地址:http://code.google.com/p/pytesser/downloads/list

如果打不开上面的网址的话可以从我的资源里面下载,点击此处本站下载

下载好了之后安装,步骤:

1.  解压pytesser ,将解压后的文件复制到Python安装目录的Lib\site-packages下,直接使用,比如我的安装目录是:C:\Python27\Lib\site-packages

2. 这里我建立好的pytesser目录为C:\Python27\Lib\site-packages\pytesser\

3. 接下来打开pytesser文件夹,将pytesser.py修改成__init__.py,然后打开py文件进行修改:
①. import Image 改为: from PIL import Image
②. tesseract_exe_name = 'tesseract' —> tesseract_exe_name = 'C:\\Python27\\Lib\\site-packges\\pytesser\\tesseract,注意双斜杠,否则可能因为转义字符报错

接下来就是下载PIL了。这个我在pycharm里面也是下载失败,提示没有找到适合python版本的PIL。
可以在DOS命令行下用命令下:pip install Pillow 这里要注意的是如果要直接在DOS下用pip命令的话要先把pip的路径加到环境变量path里面去,例如我的pip路径:“D:\python2.7.13\Scripts\

注:小编尝试后发现PIL安装很麻烦,推荐下载exe直接安装

具体可至PIL官网查找对应安装版本:http://pythonware.com/products/pil/

全部下载完之后就可以开始拿图片测试了。这里我们先拿上面下载的pytesser压缩包里面给的测试图片来测试
代码如下:

from pytesser import *
img=Image.open("D:\\fnord.tif") 
#我这里是直接把图片复制在d盘下。可以随意更改。如果是d盘下的XX文件夹,路径就是:d:\XX\\fnord.tif
#一些对python不熟悉的小伙伴要注意的是这个路径只有最后一个斜杠要改成双斜杠,前面的都是单斜杠,如果不是这样的话在pycharm里面就会报一些看不懂的错误,百度到死都不知道怎么解决。
print image_to_string(img)

或者可以写成:

print image_file_to_string("D:\\fnord.tif")

这里需要注意一下,直接运行上面的代码的话可能会报一个找不到Image类的错误,具体我也不是很清楚,可能是因为pytesser只支持PIL的Image类吧,因此我们还要改一个东西,就是上面步骤3中pytesser包里面__init__.py 文件的第一行:import Image改成from PIL import Image。如图:

 Python2实现的图片文本识别功能详解

这时候就可以看到输出结果:

 Python2实现的图片文本识别功能详解

大功告成。

最后说一下这个方法的一些缺点,就是识别率不高,要图片里面的文字很清晰才可以识别出来,要想提高识别率的话还要对图片进行一些操作,这里就不详细说啦,请大家自行百度。

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python中的引用和拷贝浅析
Nov 22 Python
Python fileinput模块使用实例
Jun 03 Python
python采集百度百科的方法
Jun 05 Python
python微信跳一跳游戏辅助代码解析
Jan 29 Python
Pyqt5 实现跳转界面并关闭当前界面的方法
Jun 19 Python
python版百度语音识别功能
Jul 09 Python
pytorch 实现删除tensor中的指定行列
Jan 13 Python
基于Keras 循环训练模型跑数据时内存泄漏的解决方式
Jun 11 Python
python 实现简单的计算器(gui界面)
Nov 11 Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 Python
python scrapy简单模拟登录的代码分析
Jul 21 Python
python获取字符串中的email
Mar 31 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 #Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
You might like
收音机史话 - 1960年代前后的DIY
2021/03/02 无线电
PHP生成带有雪花背景的验证码
2006/10/09 PHP
PHP线程的内存回收问题
2016/07/08 PHP
浅谈PHP匿名函数和闭包
2019/03/08 PHP
javascript js cookie的存储,获取和删除
2007/12/29 Javascript
用Javascript数组处理多个字符串的连接问题
2009/08/20 Javascript
复制js对象方法(详解)
2013/07/08 Javascript
jquery 按键盘上的enter事件
2014/05/11 Javascript
javascript随机之洗牌算法深入分析
2014/06/07 Javascript
我的Node.js学习之路(三)--node.js作用、回调、同步和异步代码 以及事件循环
2014/07/06 Javascript
5个书写JavaScript代码的坏习惯,看看你中枪了没?
2014/11/06 Javascript
关于编写性能高效的javascript事件的技术
2014/11/28 Javascript
js实现键盘Enter键提交表单的方法
2015/05/27 Javascript
vue双向绑定简要分析
2017/03/23 Javascript
bootstrap datepicker插件默认英文修改为中文
2017/07/28 Javascript
Vue快速实现通用表单验证功能
2019/12/05 Javascript
jQuery实现二级导航菜单的示例
2020/09/30 jQuery
详解 javascript对象创建模式
2020/10/30 Javascript
[45:16]完美世界DOTA2联赛PWL S3 Magma vs Phoenix 第一场 12.12
2020/12/16 DOTA
python显示天气预报
2014/03/02 Python
使用python写的opencv实时监测和解析二维码和条形码
2019/08/14 Python
python-opencv获取二值图像轮廓及中心点坐标的代码
2019/08/27 Python
Python(PyS60)实现简单语音整点报时
2019/11/18 Python
利用setuptools打包python程序的方法步骤
2020/01/18 Python
python GUI库图形界面开发之PyQt5 MDI(多文档窗口)QMidArea详细使用方法与实例
2020/03/05 Python
HTML5使用ApplicationCache接口实现离线缓存技术解决离线难题
2012/12/13 HTML / CSS
关键字throw与throws的用法差异
2016/11/22 面试题
综合实践教学反思
2014/01/31 职场文书
幼儿园消防演练方案
2014/02/13 职场文书
教师中国梦演讲稿
2014/04/23 职场文书
物流管理专业推荐信
2014/09/06 职场文书
教师批评与自我批评(群众路线)
2014/10/15 职场文书
欠款证明
2015/06/24 职场文书
幼儿园安全管理制度
2015/08/05 职场文书
python中Matplotlib绘制直线的实例代码
2021/07/04 Python
SQL Server2019安装的详细步骤实战记录(亲测可用)
2022/06/10 SQL Server