编程 Python

windows下Python实现将pdf文件转化为png格式图片的方法

Posted in Python onJuly 21, 2017

本文实例讲述了windows下Python实现将pdf文件转化为png格式图片的方法。分享给大家供大家参考，具体如下：

最近工作中需要把pdf文件转化为图片，想用Python来实现，于是在网上找啊找啊找啊找，找了半天，倒是找到一些代码。

1、第一个找到的代码，我试了一下好像是反了，只能实现把图片转为pdf，而不能把pdf转为图片。。。

参考链接：https://zhidao.baidu.com/question/745221795058982452.html

代码如下：

#!/usr/bin/env python
import os
import sys
from reportlab.lib.pagesizes import A4, landscape
from reportlab.pdfgen import canvas
f = sys.argv[1]
filename = ''.join(f.split('/')[-1:])[:-4]
f_jpg = filename+'.jpg'
print f_jpg
def conpdf(f_jpg):
 f_pdf = filename+'.pdf'
 (w, h) = landscape(A4)
 c = canvas.Canvas(f_pdf, pagesize = landscape(A4))
 c.drawImage(f, 0, 0, w, h)
 c.save()
 print "okkkkkkkk."
conpdf(f_jpg)

2、第二个是文章写的比较详细，可惜的是linux下的代码，所以仍然没用。

3、第三个文章指出有一个库PythonMagick可以实现这个功能，需要下载一个库 PythonMagick-0.9.10-cp27-none-win_amd64.whl 这个是64位的。

这里不得不说自己又犯了一个错误，因为自己从python官网上下载了一个python 2.7,以为是64位的版本，实际上是32位的版本，所以导致python的版本（32位）和下载的PythonMagick的版本（64位）不一致，弄到晚上12点多，总算了发现了这个问题。。。

4、然后，接下来继续用搜索引擎搜，找到很多stackoverflow的问题帖子，发现了2个代码，不过要先下载PyPDF2以及ghostscript模块。

先通过pip来安装 PyPDF2、PythonMagick、ghostscript 模块。

C:\Users\Administrator>pip install PyPDF2
Collecting PyPDF2
 Using cached PyPDF2-1.25.1.tar.gz
Installing collected packages: PyPDF2
 Running setup.py install for PyPDF2
Successfully installed PyPDF2-1.25.1
You are using pip version 7.1.2, however version 8.1.2 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.
C:\Users\Administrator>pip install C:\PythonMagick-0.9.10-cp27-none-win_amd64.whl
Processing c:\pythonmagick-0.9.10-cp27-none-win_amd64.whl
Installing collected packages: PythonMagick
Successfully installed PythonMagick-0.9.10
You are using pip version 7.1.2, however version 8.1.2 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.
C:\Users\Administrator>pip install ghostscript
Collecting ghostscript
 Downloading ghostscript-0.4.1.tar.bz2
Requirement already satisfied (use --upgrade to upgrade): setuptools in c:\python27\lib\site-packages (from ghostscript)
Installing collected packages: ghostscript
 Running setup.py install for ghostscript
Successfully installed ghostscript-0.4.1
You are using pip version 7.1.2, however version 8.1.2 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.

下面是代码

代码1：

import os
import ghostscript
from PyPDF2 import PdfFileReader, PdfFileWriter
from tempfile import NamedTemporaryFile
from PythonMagick import Image
reader = PdfFileReader(open("C:/deep.pdf", "rb"))
for page_num in xrange(reader.getNumPages()):
 writer = PdfFileWriter()
 writer.addPage(reader.getPage(page_num))
 temp = NamedTemporaryFile(prefix=str(page_num), suffix=".pdf", delete=False)
 writer.write(temp)
 print temp.name
 tempname = temp.name
 temp.close()
 im = Image(tempname)
 #im.density("3000") # DPI, for better quality
 #im.read(tempname)
 im.write("some_%d.png" % (page_num))
 os.remove(tempname)

代码2：

import sys
import PyPDF2
import PythonMagick
import ghostscript
pdffilename = "C:\deep.pdf"
pdf_im = PyPDF2.PdfFileReader(file(pdffilename, "rb"))
print '1'
npage = pdf_im.getNumPages()
print('Converting %d pages.' % npage)
for p in range(npage):
 im = PythonMagick.Image()
 im.density('300')
 im.read(pdffilename + '[' + str(p) +']')
 im.write('file_out-' + str(p)+ '.png')
 #print pdffilename + '[' + str(p) +']','file_out-' + str(p)+ '.png'

然后执行时都报错了，这个是代码2 的报错信息：

Traceback (most recent call last):
 File "C:\c.py", line 15, in <module>
 im.read(pdffilename + '[' + str(p) +']')
RuntimeError: pythonw.exe: PostscriptDelegateFailed `C:\DEEP.pdf': No such file or directory @ error/pdf.c/ReadPDFImage/713

总是在上面的 im.read(pdffilename + '[' + str(p) +']') 这一行报错。

于是，根据报错的信息在网上查，但是没查到什么有用的信息，但是感觉应该和GhostScript有关，于是在网上去查安装包，找到一个在github上的下载连接，但是点进去的时候显示无法下载。

最后，在csdn的下载中找到了这个文件：GhostScript_Windows_9.15_win32_win64，安装了64位版本，之后，再次运行上面的代码，都能用了。

不过代码2需要做如下修改，不然还是会报 No such file or directory @ error/pdf.c/ReadPDFImage/713 错误：

#代码2
import sys
import PyPDF2
import PythonMagick
import ghostscript
pdffilename = "C:\deep.pdf"
pdf_im = PyPDF2.PdfFileReader(file(pdffilename, "rb"))
print '1'
npage = pdf_im.getNumPages()
print('Converting %d pages.' % npage)
for p in range(npage):
 im = PythonMagick.Image(pdffilename + '[' + str(p) +']')
 im.density('300')
 #im.read(pdffilename + '[' + str(p) +']')
 im.write('file_out-' + str(p)+ '.png')
 #print pdffilename + '[' + str(p) +']','file_out-' + str(p)+ '.png'

这次有个很深刻的体会，就是解决这个问题过程中，大部分时间都是用在查资料、验证资格资料是否有用上了，搜索资料的能力很重要。

而在实际搜索资料的过程中，国内关于PythonMagick的文章太少了，搜索出来的大部分有帮助的文章都是国外的，但是这些国外的帖子文章，也没有解决我的问题或者是给出有用的线索，最后还是通过自己的思考，解决了问题。

希望本文所述对大家Python程序设计有所帮助。

windows下Python实现将pdf文件转化为png格式图片的方法

- Author -

不想长大啊

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

详解python-图像处理（映射变换）

Mar 22 Python

Python2和Python3的共存和切换使用

Apr 12 Python

扩展Django admin的list_filter()可使用范围方法

Aug 21 Python

Win10下python 2.7与python 3.7双环境安装教程图解

Oct 12 Python

Python hashlib加密模块常用方法解析

Dec 18 Python

IronPython连接MySQL的方法步骤

Dec 27 Python

解决python-docx打包之后找不到default.docx的问题

Feb 13 Python

Python基于numpy模块实现回归预测

May 14 Python

PyQt5实现简单的计算器

May 30 Python

浅析Python的命名空间与作用域

Nov 25 Python

Python中生成ndarray实例讲解

Feb 22 Python

python3 删除所有自定义变量的操作

Apr 08 Python

python僵尸进程产生的原因

Jul 21 #Python

python下载图片实现方法(超简单)

Jul 21 #Python

Python基于Pymssql模块实现连接SQL Server数据库的方法详解

Jul 20 #Python

Python使用内置json模块解析json格式数据的方法

Jul 20 #Python

Python轻量级ORM框架Peewee访问sqlite数据库的方法详解

Jul 20 #Python

Python函数式编程

Jul 20 #Python

python 换位密码算法的实例详解

Jul 19 #Python

You might like

PHP4实际应用经验篇(5)

2006/10/09 PHP

PHP递归算法的详细示例分析

2013/02/19 PHP

关于PHP结束标签的使用细节探讨及联想

2013/03/04 PHP

php生成缩略图填充白边(等比缩略图方案)

2013/12/25 PHP

ThinkPHP3.2.2的插件控制器功能简述

2014/07/09 PHP

php 防止表单重复提交两种实现方法

2016/11/03 PHP

goto语法在PHP中的使用教程

2020/09/17 PHP

jQuery插件支持同一页面被多次调用

2016/02/14 Javascript

动态设置form表单的action属性的值的简单方法

2016/05/25 Javascript

js实现小窗口拖拽效果

2016/12/03 Javascript

svg动画之动态描边效果

2017/02/22 Javascript

vue loadmore组件上拉加载更多功能示例代码

2017/07/19 Javascript

jQuery实现的文字逐行向上间歇滚动效果示例

2017/09/06 jQuery

vue学习笔记之v-if和v-show的区别

2017/09/20 Javascript

vue实现同一个页面可以有多个router-view的方法

2018/09/20 Javascript

从零到一详聊创建Vue工程及遇到的常见问题

2019/04/25 Javascript

Vue利用localStorage本地缓存使页面刷新验证码不清零功能的实现

2020/09/04 Javascript

使用TS来编写express服务器的方法步骤

2020/10/29 Javascript

[58:15]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 NB vs Liquid

2018/04/02 DOTA

跟老齐学Python之通过Python连接数据库

2014/10/28 Python

python3写的简单本地文件上传服务器实例

2018/06/04 Python

python使用Turtle库绘制动态钟表

2018/11/19 Python

利用nohup来开启python文件的方法

2019/01/14 Python

eclipse创建python项目步骤详解

2019/05/10 Python

python代码编写计算器小程序

2020/03/30 Python

通过实例解析python描述符原理作用

2020/01/22 Python

Python3实现打印任意宽度的菱形代码

2020/04/12 Python

雅虎笔试题(字符串操作)

2015/03/24 面试题

车间工艺员岗位职责

2013/12/09 职场文书

内衣营销方案

2014/03/15 职场文书

电工技术比武方案

2014/05/11 职场文书

工地安全标语

2014/06/07 职场文书

个人委托书

2014/07/31 职场文书

普宁寺导游词

2015/02/04 职场文书

法制教育主题班会

2015/08/13 职场文书

Golang表示枚举类型的详细讲解

2021/09/04 Golang