浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
在Django框架中设置语言偏好的教程
Jul 27 Python
深入学习Python中的装饰器使用
Jun 20 Python
Python查询IP地址归属完整代码
Jun 21 Python
VScode编写第一个Python程序HelloWorld步骤
Apr 06 Python
Python对切片命名的实现方法
Oct 16 Python
Pycharm配置远程调试的方法步骤
Dec 17 Python
对python中字典keys,values,items的使用详解
Feb 03 Python
原生python实现knn分类算法
Oct 24 Python
Python实现定时监测网站运行状态的示例代码
Sep 30 Python
Python调用飞书发送消息的示例
Nov 10 Python
Python Pycharm虚拟下百度飞浆PaddleX安装报错问题及处理方法(亲测100%有效)
May 24 Python
Python实现自动玩连连看的脚本分享
Apr 04 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
php中json_encode处理gbk与gb2312中文乱码问题的解决方法
2014/07/10 PHP
PHP改进计算字符串相似度的函数similar_text()、levenshtein()
2014/10/27 PHP
ThinkPHP实现支付宝接口功能实例
2014/12/02 PHP
PHP+Mysql基于事务处理实现转账功能的方法
2015/07/08 PHP
Laravel实现自定义错误输出内容的方法
2016/10/10 PHP
PHP+jQuery实现双击修改table表格功能示例
2019/02/21 PHP
Laravel 模型关联基础教程详解
2019/09/17 PHP
JavaScript中如何通过arguments对象实现对象的重载
2014/05/12 Javascript
jquery缓动swing liner控制动画过程不同时刻的速度
2014/05/29 Javascript
js判断变量初始化的三种形式及推荐用的形式
2014/07/22 Javascript
javascript中parseInt()函数的定义和用法分析
2014/12/20 Javascript
javascript删除数组重复元素的方法汇总
2015/06/24 Javascript
Express实现前端后端通信上传图片之存储数据库(mysql)傻瓜式教程(二)
2015/12/10 Javascript
再谈Javascript中的基本类型和引用类型(推荐)
2016/07/01 Javascript
详解AngularJS通过ocLazyLoad实现动态(懒)加载模块和依赖
2017/03/01 Javascript
JavaScript中利用Array filter() 方法压缩稀疏数组
2018/02/24 Javascript
在vue中阻止浏览器后退的实例
2019/11/06 Javascript
浅析 Vue 3.0 的组装式 API(一)
2020/08/31 Javascript
[59:26]DOTA2上海特级锦标赛D组资格赛#1 EG VS VP第二局
2016/02/28 DOTA
python发送邮件示例(支持中文邮件标题)
2014/02/16 Python
K-means聚类算法介绍与利用python实现的代码示例
2017/11/13 Python
基于Python实现的微信好友数据分析
2018/02/26 Python
详解如何用django实现redirect的几种方法总结
2018/11/22 Python
python:解析requests返回的response(json格式)说明
2020/04/30 Python
python中return如何写
2020/06/18 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
2020/06/29 Python
python 从list中随机取值的方法
2020/11/16 Python
英国汽车零件购物网站:GSF Car Parts
2019/05/23 全球购物
行政助理岗位职责
2013/11/10 职场文书
校园新闻广播稿
2014/01/10 职场文书
2014年工程部工作总结
2014/11/25 职场文书
销售内勤岗位职责范本
2015/04/13 职场文书
2015年学校政教工作总结
2015/07/20 职场文书
退伍军人感言
2015/08/01 职场文书
高中体育课教学反思
2016/02/16 职场文书
MYSQL如何查看进程和kill进程
2022/03/13 MySQL