浅谈Python处理PDF的方法


Posted in Python onNovember 10, 2017

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法

#使用PdfFileWriter
import PyPDF2
 
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()
 
pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:python先序遍历二叉树问题、python实现人脸识别代码、python执行使用shell命令方法分享等,有什么问题可以随时留言,小编会及时回复大家的。感谢朋友们对本站的支持!

Python 相关文章推荐
从源码解析Python的Flask框架中request对象的用法
Jun 02 Python
python绘制铅球的运行轨迹代码分享
Nov 14 Python
Python自然语言处理之词干,词形与最大匹配算法代码详解
Nov 16 Python
Anaconda下配置python+opencv+contribx的实例讲解
Aug 06 Python
python使用zip将list转为json的方法
Dec 31 Python
使用python3构建文件传输的方法
Feb 13 Python
用Python中的turtle模块画图两只小羊方法
Apr 09 Python
ubuntu 16.04下python版本切换的方法
Jun 14 Python
对Python中画图时候的线类型详解
Jul 07 Python
Python csv文件记录流程代码解析
Jul 16 Python
numpy中生成随机数的几种常用函数(小结)
Aug 18 Python
解决numpy和torch数据类型转化的问题
May 23 Python
django开发教程之利用缓存文件进行页面缓存的方法
Nov 10 #Python
python使用邻接矩阵构造图代码示例
Nov 10 #Python
python先序遍历二叉树问题
Nov 10 #Python
简单了解OpenCV是个什么东西
Nov 10 #Python
python的文件操作方法汇总
Nov 10 #Python
python使用正则表达式的search()函数实现指定位置搜索功能
Nov 10 #Python
Python3调用微信企业号API发送文本消息代码示例
Nov 10 #Python
You might like
用PHP调用Oracle存储过程
2006/10/09 PHP
在PHP中使用X-SendFile头让文件下载更快
2014/06/01 PHP
php身份证号码检查类实例
2015/06/18 PHP
PHP 常用时间函数资料整理
2016/10/22 PHP
PHP实现的简单对称加密与解密方法实例小结
2017/08/28 PHP
PHP实现生成模糊图片的方法示例
2017/12/21 PHP
优化javascript的执行速度
2010/01/23 Javascript
浅谈javascript的原型继承
2012/07/25 Javascript
吐槽一下我所了解的Node.js
2014/10/08 Javascript
node.js中的console.assert方法使用说明
2014/12/10 Javascript
javascript与jquery动态创建html元素示例
2016/07/25 Javascript
工作中常用的js、jquery自定义扩展函数代码片段汇总
2016/12/22 Javascript
浅谈angular2的http请求返回结果的subcribe注意事项
2017/03/01 Javascript
jQuery Masonry瀑布流布局神器使用详解
2017/05/25 jQuery
详解AngularJS ng-class样式切换
2017/06/27 Javascript
JavaScript动态加载重复绑定问题
2018/04/01 Javascript
node.js基于socket.io快速实现一个实时通讯应用
2019/04/23 Javascript
JS实现利用闭包判断Dom元素和滚动条的方向示例
2019/08/26 Javascript
微信小程序获取公众号文章列表及显示文章的示例代码
2020/03/10 Javascript
解决vue字符串换行问题(绝对管用)
2020/08/06 Javascript
Python操作Access数据库基本步骤分析
2016/09/19 Python
python实现逆序输出一个数字的示例讲解
2018/06/25 Python
不管你的Python报什么错,用这个模块就能正常运行
2018/09/14 Python
python3下载抖音视频的完整代码
2019/06/05 Python
HTML5通用接口详解
2016/06/12 HTML / CSS
HTML5中indexedDB 数据库的使用实例
2017/05/11 HTML / CSS
size?德国官方网站:英国伦敦的球鞋精品店
2018/03/17 全球购物
英国最受欢迎的母婴精品品牌:JoJo Maman BéBé
2021/02/17 全球购物
Currentbody德国站:健康与美容技术专家
2020/04/05 全球购物
介绍一下gcc特性
2012/01/20 面试题
七年级历史教学反思
2014/02/05 职场文书
工作分析计划书
2014/04/30 职场文书
电子信息工程专业求职信
2014/06/28 职场文书
幼儿园大班见习报告
2014/10/31 职场文书
信用卡工作证明范本
2015/06/19 职场文书
python实现自定义日志的具体方法
2021/05/28 Python