如何使用Python进行PDF图片识别OCR


Posted in Python onJanuary 22, 2021

使用场景

使用图片识别可以快速提取图片中的信息,方便高效。

Python并不能直接对PDF进行识别,所以如果是识别PDF的话,需要先将PDF转化为图片,然后再进行识别。

必备工具

  • Python 

可以安装3.7及以上版本

  • tesseract-ocr 

下载地址: https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

  • 需要用到的库
pip install pillow
pip install opencv-python
pip install fitz
pip install PyMuPDF
pip install pytesseract

代码示例

from PIL import Image
import os
import pytesseract 
import cv2 as cv
import fitz

def pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle):
  # 打开PDF文件
  pdf = fitz.open(pdfPath)
  # 逐页读取PDF
  for pg in range(0, pdf.pageCount):
    page = pdf[pg]
    # 设置缩放和旋转系数
    trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle)
    pm = page.getPixmap(matrix=trans, alpha=False)
    # 开始写图像
    pm.writePNG(imgPath+str(pg)+".png")
    #pm.writePNG(imgPath)
  pdf.close()
pdf_path ='D:/123.pdf'
img_path ='D:/123.png'
pdf_image(pdf_path,img_path,5,5,0)
# 依赖opencv
img=cv.imread(img_path)
text=pytesseract.image_to_string(Image.fromarray(img),lang='chi_tra')
# 不依赖opencv写法
# text=pytesseract.image_to_string(Image.open(img_path))
print(text)

总结

识别清晰的文字图片的时候准确率非常高

但是识别手写体的话效果不太好

注意事项

在安装tesseract-ocr 的时候一定要记得选择对应的语言,不然是无法正常使用的。

以上就是如何使用Python进行PDF图片识别OCR的详细内容,更多关于python pdf图片识别ocr的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
讲解Python中的递归函数
Apr 27 Python
以视频爬取实例讲解Python爬虫神器Beautiful Soup用法
Jan 20 Python
Python实现的摇骰子猜大小功能小游戏示例
Dec 18 Python
对Python3 pyc 文件的使用详解
Feb 16 Python
keras获得model中某一层的某一个Tensor的输出维度教程
Jan 24 Python
TensorFlow:将ckpt文件固化成pb文件教程
Feb 11 Python
matplotlib 曲线图 和 折线图 plt.plot()实例
Apr 17 Python
django实现日志按日期分割
May 21 Python
Python类及获取对象属性方法解析
Jun 15 Python
keras 自定义loss model.add_loss的使用详解
Jun 22 Python
解决PyCharm不在run输出运行结果而不是再Console里输出的问题
Sep 21 Python
Python如何解决secure_filename对中文不支持问题
Jul 16 Python
详解pandas映射与数据转换
Jan 22 #Python
python实现简单的井字棋游戏(gui界面)
Jan 22 #Python
Django url 路由匹配过程详解
Jan 22 #Python
浅析pandas随机排列与随机抽样
Jan 22 #Python
python 合并多个excel中同名的sheet
Jan 22 #Python
Python读取pdf表格写入excel的方法
Jan 22 #Python
python 基于UDP协议套接字通信的实现
Jan 22 #Python
You might like
PHP 服务器配置(使用Apache及IIS两种方法)
2009/06/01 PHP
php 服务器调试 Zend Debugger 的安装教程
2009/09/25 PHP
PHP-X系列教程之内置函数的使用示例
2017/10/16 PHP
PHP高并发和大流量解决方案整理
2019/12/24 PHP
更正确的asp冒泡排序
2007/05/24 Javascript
通过下拉框的值来确定输入框是否可以为空的代码
2011/10/18 Javascript
jquery实现图片裁剪思路及实现
2013/08/16 Javascript
JavaScript获取某年某月的最后一天附截图
2014/06/23 Javascript
浅谈Javascript 数组与字典
2015/01/29 Javascript
在Node.js应用中使用Redis的方法简介
2015/06/24 Javascript
灵活的理解JavaScript中的this指向
2016/02/25 Javascript
javascript检测移动设备横竖屏
2016/05/21 Javascript
node.js cookie-parser之parser.js
2016/06/06 Javascript
Node.js包管理器Yarn的入门介绍与安装
2016/10/17 Javascript
JavaScript实现公历转农历功能示例
2017/02/13 Javascript
js中数组插入、删除元素操作的方法
2017/02/15 Javascript
浅析Vue中拆分视图层代码的5点建议
2019/08/15 Javascript
JavaScript的查询机制LHS和RHS解析
2019/08/16 Javascript
Vue实现商品详情页的评价列表功能
2019/09/04 Javascript
layui form.render('select', 'test2') 更新渲染的方法
2019/09/27 Javascript
Vue scoped及deep使用方法解析
2020/08/01 Javascript
javascript实现图片轮换动作方法
2020/08/07 Javascript
[03:08]Ti4观战指南上
2014/07/07 DOTA
python matplotlib坐标轴设置的方法
2017/12/05 Python
基于python分析你的上网行为 看看你平时上网都在干嘛
2019/08/13 Python
Python对列表的操作知识点详解
2019/08/20 Python
Python中生成一个指定长度的随机字符串实现示例
2019/11/06 Python
Python各种扩展名区别点整理
2020/02/27 Python
音频处理 windows10下python三方库librosa安装教程
2020/06/20 Python
HTML最新标准HTML5总结(必看)
2016/06/13 HTML / CSS
澳大利亚优质葡萄酒专家:Vintage Cellars
2019/01/08 全球购物
Timberland法国官网:购买靴子、鞋子、衣服、夹克和配饰
2019/11/30 全球购物
LINUX下线程,GDI类的解释
2016/12/14 面试题
30年同学聚会邀请函
2014/01/25 职场文书
基于PyTorch实现一个简单的CNN图像分类器
2021/05/29 Python
Echarts如何重新渲染实例详解
2022/05/30 Javascript