浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
讲解Python的Scrapy爬虫框架使用代理进行采集的方法
Feb 18 Python
python编程实现12306的一个小爬虫实例
Dec 27 Python
PyQt5每天必学之带有标签的复选框
Apr 19 Python
pip安装py_zipkin时提示的SSL问题对应
Dec 29 Python
Python分布式进程中你会遇到的问题解析
May 28 Python
django drf框架自带的路由及最简化的视图
Sep 10 Python
Python3 全自动更新已安装的模块实现
Jan 06 Python
python、PyTorch图像读取与numpy转换实例
Jan 13 Python
python3代码输出嵌套式对象实例详解
Dec 03 Python
Python实现自动整理文件的脚本
Dec 17 Python
Python序列化与反序列化相关知识总结
Jun 08 Python
python脚本框架webpy模板控制结构
Nov 20 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
用PHP实现多服务器共享SESSION数据的方法
2007/03/16 PHP
php 如何获取数组第一个值
2013/08/06 PHP
php7 参数、整形及字符串处理机制修改实例分析
2020/05/25 PHP
农历与西历对照
2006/09/06 Javascript
海量经典的jQuery插件集合
2010/01/12 Javascript
javascript 设计模式之单体模式 面向对象学习基础
2010/04/18 Javascript
JS脚本defer的作用示例介绍
2014/01/02 Javascript
js拖拽一些常见的思路方法整理
2014/03/19 Javascript
jQuery获得document和window对象宽度和高度的方法
2015/03/25 Javascript
使用JS实现图片展示瀑布流效果的实例代码
2016/09/12 Javascript
js图片延迟加载(Lazyload)三种实现方式
2017/03/01 Javascript
node使用promise替代回调函数
2018/05/07 Javascript
jQuery实现表单动态加减、ajax表单提交功能
2018/06/08 jQuery
微信小程序实现商城倒计时
2020/11/01 Javascript
layui(1.0.9)文件上传upload,前后端的实例代码
2019/09/26 Javascript
Javascript表单序列化原理及实现代码详解
2020/10/30 Javascript
python类继承用法实例分析
2014/10/10 Python
利用PyCharm Profile分析异步爬虫效率详解
2019/05/08 Python
关于Numpy数据类型对象(dtype)使用详解
2019/11/27 Python
python GUI库图形界面开发之PyQt5图片显示控件QPixmap详细使用方法与实例
2020/02/27 Python
浅谈Python爬虫原理与数据抓取
2020/07/21 Python
Django修改app名称和数据表迁移方案实现
2020/09/17 Python
PyCharm 2020.2下配置Anaconda环境的方法步骤
2020/09/23 Python
image-set实现Retina屏幕下图片显示详细介绍
2012/12/24 HTML / CSS
linux面试题参考答案(4)
2013/01/28 面试题
医学生自荐信
2013/12/03 职场文书
客服工作职责
2013/12/11 职场文书
市场开发与营销专业求职信
2013/12/31 职场文书
石油大学毕业生自荐信
2014/01/28 职场文书
2014年租房协议书范本
2014/10/30 职场文书
五年级学生期末评语
2014/12/26 职场文书
导游词开场白
2015/01/31 职场文书
圆明园纪录片观后感
2015/06/03 职场文书
同学会演讲稿
2019/04/02 职场文书
2019年亲子运动会口号
2019/10/11 职场文书
Windows Server 2022 超融合部署(图文教程)
2022/06/25 Servers