浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
Python+Pika+RabbitMQ环境部署及实现工作队列的实例教程
Jun 29 Python
python3中获取文件当前绝对路径的两种方法
Apr 26 Python
基于python进行桶排序与基数排序的总结
May 29 Python
TensorFlow实现Logistic回归
Sep 07 Python
Python中的引用知识点总结
May 20 Python
利用anaconda保证64位和32位的python共存
Mar 09 Python
Python中socket网络通信是干嘛的
May 27 Python
Python+Kepler.gl实现时间轮播地图过程解析
Jul 20 Python
PyCharm设置注释字体颜色以及是否倾斜的操作
Sep 16 Python
在Windows下安装配置CPU版的PyTorch的方法
Apr 02 Python
Python爬虫之爬取某文库文档数据
Apr 21 Python
Python中使用tkFileDialog实现文件选择、保存和路径选择
May 20 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
PHP 伪静态隐藏传递参数名的四种方法
2010/02/22 PHP
Yii框架表单模型和验证用法
2016/05/20 PHP
Javascript 读书笔记索引贴
2010/01/11 Javascript
jquery调用wcf并展示出数据的方法
2011/07/07 Javascript
js 控制下拉菜单刷新的方法
2013/03/03 Javascript
JavaScript 对任意元素,自定义右键菜单的实现方法
2013/05/08 Javascript
jQuery学习笔记之 Ajax操作篇(一) - 数据加载
2014/06/23 Javascript
基于jQuery实现拖拽图标到回收站并删除功能
2015/11/25 Javascript
AngularJs bootstrap搭载前台框架——基础页面
2016/09/01 Javascript
mvc 、bootstrap 结合分布式图简单实现分页
2016/10/10 Javascript
nodejs个人博客开发第二步 入口文件
2017/04/12 NodeJs
JS 调试中常见的报错问题解决方法
2017/05/20 Javascript
VsCode插件整理(小结)
2017/09/14 Javascript
JavaScript实现数字前补“0”的五种方法示例
2019/01/03 Javascript
关于微信小程序获取小程序码并接受buffer流保存为图片的方法
2019/06/07 Javascript
vue-cli 项目打包完成后运行文件路径报错问题
2019/07/19 Javascript
Node.js fs模块原理及常见用途
2020/10/22 Javascript
vue.js实现输入框输入值内容实时响应变化示例
2018/07/07 Python
对Python 语音识别框架详解
2018/12/24 Python
详解django中url路由配置及渲染方式
2019/02/25 Python
用Python调用win命令行提高工作效率的实例
2019/08/14 Python
python使用sessions模拟登录淘宝的方式
2019/08/16 Python
自适应线性神经网络Adaline的python实现详解
2019/09/30 Python
python配置文件写入过程详解
2019/10/19 Python
Python实现封装打包自己写的代码,被python import
2020/07/12 Python
Python Socket多线程并发原理及实现
2020/12/11 Python
程序员跳槽必看面试题总结
2013/06/28 面试题
护士自荐信
2013/10/25 职场文书
计算机系毕业生推荐信
2013/11/06 职场文书
电大会计学自我鉴定
2014/02/06 职场文书
简单的大学生自我鉴定
2014/02/18 职场文书
毕业生写求职信的要点
2014/03/04 职场文书
2014年机关党建工作总结
2014/11/11 职场文书
幼儿园辞职信
2015/05/13 职场文书
nginx反向代理配置去除前缀案例教程
2021/07/26 Servers
使用CSS实现黑白格背景效果
2022/06/01 HTML / CSS