浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
Python中将字典转换为XML以及相关的命名空间解析
Oct 15 Python
python虚拟环境virualenv的安装与使用
Dec 18 Python
OpenCV2.3.1+Python2.7.3+Numpy等的配置解析
Jan 05 Python
Python如何获得百度统计API的数据并发送邮件示例代码
Jan 27 Python
详解用python生成随机数的几种方法
Aug 04 Python
基于Python+Appium实现京东双十一自动领金币功能
Oct 31 Python
Python中顺序表原理与实现方法详解
Dec 03 Python
Python利用PyExecJS库执行JS函数的案例分析
Dec 18 Python
Tensorflow 自定义loss的情况下初始化部分变量方式
Jan 06 Python
浅谈python3 构造函数和析构函数
Mar 12 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
May 14 Python
高考要来啦!用Python爬取历年高考数据并分析
Jun 03 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
php中Y2K38的漏洞解决方法实例分析
2014/09/22 PHP
Laravel多域名下字段验证的方法
2019/04/04 PHP
jquery select(列表)的操作(取值/赋值)
2009/08/06 Javascript
ie下jquery.getJSON的缓存问题的处理方法
2013/03/29 Javascript
js 获取(接收)地址栏参数值的方法
2013/04/01 Javascript
js判断运行jsp页面的浏览器类型以及版本示例
2013/10/30 Javascript
解决node-webkit 不支持html5播放mp4视频的方法
2015/03/11 Javascript
利用JQuery实现datatables插件的增加和删除行功能
2017/01/06 Javascript
浅谈js中用$(#ID)来作为选择器的问题(id重复的时候)
2017/02/14 Javascript
Vue组件的使用教程详解
2018/01/05 Javascript
微信小程序实现左右联动的实战记录
2018/07/05 Javascript
详解JavaScript实现动态的轮播图效果
2019/04/29 Javascript
深入分析JavaScript 事件循环(Event Loop)
2020/06/19 Javascript
[01:17:47]TNC vs VGJ.S 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
MySQL最常见的操作语句小结
2015/05/07 Python
Python多进程分块读取超大文件的方法
2016/04/13 Python
python基于物品协同过滤算法实现代码
2018/05/31 Python
Python实现的远程文件自动打包并下载功能示例
2019/07/12 Python
django做form表单的数据验证过程详解
2019/07/26 Python
python  ceiling divide 除法向上取整(或小数向上取整)的实例
2019/12/27 Python
美国男女折扣服饰百货连锁店:Stein Mart
2017/05/02 全球购物
英国户外装备和冒险服装零售商:alloutdoor
2018/01/30 全球购物
Chicco婴儿用品美国官网:汽车座椅、婴儿推车、高脚椅等
2018/11/05 全球购物
Molton Brown美国官网:奢华美容、香水、沐浴和身体护理
2020/09/02 全球购物
大学毕业生的自我鉴定
2013/11/30 职场文书
实习生单位鉴定意见
2013/12/04 职场文书
餐饮采购员岗位职责
2014/03/15 职场文书
副检察长四风问题对照检查材料思想汇报
2014/10/07 职场文书
党的群众路线教育实践活动党员个人剖析材料
2014/10/08 职场文书
学生上课迟到检讨书
2015/01/01 职场文书
会计工作岗位职责
2015/02/03 职场文书
2016年大学生暑期社会实践方案
2015/11/26 职场文书
《圆的周长》教学反思
2016/02/17 职场文书
python爬不同图片分别保存在不同文件夹中的实现
2021/04/02 Python
Python 可迭代对象 iterable的具体使用
2021/08/07 Python
关于CSS自定义属性与前端页面的主题切换问题
2022/03/21 HTML / CSS