浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
Python标准库之多进程(multiprocessing包)介绍
Nov 25 Python
Python urllib、urllib2、httplib抓取网页代码实例
May 09 Python
Python初学时购物车程序练习实例(推荐)
Aug 08 Python
Python实现通讯录功能
Feb 22 Python
Python3实现购物车功能
Apr 18 Python
Python使用mongodb保存爬取豆瓣电影的数据过程解析
Aug 14 Python
Django项目基础配置和基本使用过程解析
Nov 25 Python
python GUI库图形界面开发之PyQt5中QMainWindow, QWidget以及QDialog的区别和选择
Feb 26 Python
python关于变量名的基础知识点
Mar 03 Python
详解Python GUI编程之PyQt5入门到实战
Dec 10 Python
Python字符串格式化方式
Apr 07 Python
Python FuzzyWuzzy实现模糊匹配
Apr 28 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
深入php之规范编程命名小结
2013/05/15 PHP
smarty内置函数config_load用法实例
2015/01/22 PHP
php截取视频指定帧为图片
2016/05/16 PHP
PHP编程实现的TCP服务端和客户端功能示例
2018/04/13 PHP
JavaScript日期时间格式化函数分享
2014/05/05 Javascript
javascript简单实现滑动菜单效果的方法
2015/07/27 Javascript
jQuery Mobile开发中日期插件Mobiscroll使用说明
2016/03/02 Javascript
基于javascript实现表格的简单操作
2016/05/21 Javascript
微信小程序的日期选择器的实例详解
2017/09/29 Javascript
微信小程序获取音频时长与实时获取播放进度问题
2018/08/28 Javascript
详解Vue项目在其他电脑npm run dev运行报错的解决方法
2018/10/29 Javascript
vue+django实现一对一聊天功能的实例代码
2019/07/17 Javascript
[06:14]《辉夜杯》外卡赛附加赛 4支战队巡礼
2015/10/23 DOTA
[05:09]DOTA2-DPC中国联赛2月22日Recap集锦
2021/03/11 DOTA
Python中实现参数类型检查的简单方法
2015/04/21 Python
基于asyncio 异步协程框架实现收集B站直播弹幕
2016/09/11 Python
tensorflow建立一个简单的神经网络的方法
2018/02/10 Python
python smtplib模块实现发送邮件带附件sendmail
2018/05/22 Python
python TKinter获取文本框内容的方法
2018/10/11 Python
在python中实现将一张图片剪切成四份的方法
2018/12/05 Python
使用django实现一个代码发布系统
2019/07/18 Python
python处理大日志文件
2019/07/23 Python
python 非线性规划方式(scipy.optimize.minimize)
2020/02/11 Python
Python基于requests实现模拟上传文件
2020/04/21 Python
TensorFlow keras卷积神经网络 添加L2正则化方式
2020/05/22 Python
windows10在visual studio2019下配置使用openCV4.3.0
2020/07/14 Python
python实现图书馆抢座(自动预约)功能的示例代码
2020/09/29 Python
python re模块常见用法例举
2021/03/01 Python
2014年清明节寄语
2014/04/03 职场文书
股东授权委托书范本
2014/09/13 职场文书
纪念九一八事变演讲稿:勿忘国耻
2014/09/14 职场文书
2015年汽车销售员工作总结
2015/07/24 职场文书
课题研究阶段性总结
2015/08/13 职场文书
组织委员竞选稿
2015/11/21 职场文书
python - asyncio异步编程
2021/04/06 Python
用Python可视化新冠疫情数据
2022/01/18 Python