通过python-pptx模块操作ppt文件的方法


Posted in Python onDecember 26, 2020

ppt通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。ppt的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

本文主要介绍python操作ppt的技巧,编程的优势在于处理速度,对于高大上的ppt设计,还是需要"以人为本", 所以该模块的使用场景主要是ppt基本元素的提取和添加,适合大量内容的转化,比如word转ppt, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是并不能满足日常办公对ppt美观性的要求。

在该模块中,将ppt拆分为了以下多个元素

1. presentations, 表示整个ppt文档

2. sliders. 表示ppt文档的每一页

3. shapes

4. placeholders

上述分类对应的常用操作如下

1. presentations

用于打开,创建,保存ppt文档,用法如下

>>> from pptx import Presentation
# 创建新的ppt文档
>>> prs = Presentation()
# 打开一个ppt文档
>>> prs = Presentation('input.pptx')
# 保存ppt文档
>>> prs.save('test.pptx')

2. slides

在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

1. Title

2. Title and Content

3. Section Header

4. Two Content

5. Comparison

6. Title Only

7. Blank

8. Content with Caption

9. Picture with Caption

通过数字下标0到9来访问,指定布局添加一页ppt的用法如下

>>> title_slide_layout = prs.slide_layouts[0]
>>> slide = prs.slides.add_slide(title_slide_layout)

3. shapes

shapes表示容器,在制作ppt时,各种基本元素,比如文本框,表格,图片等都占据了ppt的一个部分,或者矩形区域,或者其他各种自定义的形状。shapes表示所有基本元素的和, 通过如下方式来访问对应的shapes

shapes = slide.shapes

对于shapes而言,我们可以获取和设置其各种属性,比如最常用的text属性,用法如下

>>> shapes.text = 'hello world'

还可以通过add系列方法来添加各种元素,添加文本框的方法如下

>>> from pptx.util import Inches, Pt
>>> left = top = width = height = Inches(1)
>>> txBox = slide.shapes.add_textbox(left, top, width, height)
>>> tf = txBox.text_frame
>>> tf.text = "first paragraph"
>>> p = tf.add_paragraph()
>>> p.text = "second paragraph"

添加表格的方法如下

>>> rows = cols = 2
>>> left = top = Inches(2.0)
>>> width = Inches(6.0)
>>> height = Inches(0.8)
>>> table = shapes.add_table(rows, cols, left, top, width, height).table
>>> table.columns[0].width = Inches(2.0)
>>> table.columns[1].width = Inches(4.0)
>>> # write column headings
>>> table.cell(0, 0).text = 'Foo'
>>> table.cell(0, 1).text = 'Bar'

4. placeholders

shapes表示所有基本元素的总和,而placeholders则表示每一个具体的元素,所以placeholders是shapes的子集, 通过数字下标来访问对应的placeholder,用法如下

>>> slide.placeholders[1]
<pptx.shapes.placeholder.SlidePlaceholder object at 0x03F73A90>
>>> slide.placeholders[1].placeholder_format.idx
1
>>> slide.placeholders[1].name
'Subtitle 2'

placeholders是页面上已有的元素,获取对应的placeholders之后,可以通过insert系列方法来向其中新添元素。

了解上述层级结构,有助于我们对ppt的读写操作。除了写操作之外,也可以通过读操作来批量提取ppt中的特定元素,以文字为例,提取方式如下

from pptx import Presentation
 
prs = Presentation(path_to_presentation)
 
text_runs = []
 
for slide in prs.slides:
 for shape in slide.shapes:
  if not shape.has_text_frame:
   continue
  for paragraph in shape.text_frame.paragraphs:
   for run in paragraph.runs:
    text_runs.append(run.text)

通过该模块,可以快速搭建ppt的基本框架,也可以批量提取ppt中的特定元素,比如提取文字转换成word, 或者提取表格转换成excel文件。总而言之,该模块适合替代大量繁琐的人工复制粘贴操作。

到此这篇关于通过python-pptx模块操作ppt文件的方法的文章就介绍到这了,更多相关python-pptx模块操作ppt文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中针对函数处理的特殊方法
Mar 06 Python
Python标准库之多进程(multiprocessing包)介绍
Nov 25 Python
Python中利用原始套接字进行网络编程的示例
May 04 Python
机器学习python实战之决策树
Nov 01 Python
Python数据结构与算法之图的广度优先与深度优先搜索算法示例
Dec 14 Python
python opencv实现旋转矩形框裁减功能
Jul 25 Python
Python面向对象基础入门之设置对象属性
Dec 11 Python
Python 列表的清空方式
Jan 13 Python
有关Tensorflow梯度下降常用的优化方法分享
Feb 04 Python
python获取依赖包和安装依赖包教程
Feb 13 Python
Python爬虫+Tkinter制作一个翻译软件的示例
Feb 20 Python
python中validators库的使用方法详解
Sep 23 Python
Python如何实现感知器的逻辑电路
Dec 25 #Python
使用Python实现音频双通道分离
Dec 25 #Python
Python用户自定义异常的实现
Dec 25 #Python
Django前后端分离csrf token获取方式
Dec 25 #Python
在vscode中启动conda虚拟环境的思路详解
Dec 25 #Python
python语言time库和datetime库基本使用详解
Dec 25 #Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 #Python
You might like
Win2003服务器安全加固设置--进一步提高服务器安全性
2007/05/23 PHP
php中mt_rand()随机数函数用法
2014/11/24 PHP
php使用MySQL保存session会话的方法
2015/06/26 PHP
php检查字符串中是否有外链的方法
2015/07/29 PHP
阿里云Win2016安装Apache和PHP环境图文教程
2018/03/11 PHP
mysqli扩展无法在PHP7下升级问题的解决
2019/09/10 PHP
TP5框架实现签到功能的方法分析
2020/04/05 PHP
取得一定长度的内容,处理中文
2006/12/20 Javascript
基于jQuery的计算文本框字数的代码
2012/06/06 Javascript
JavaScript 判断浏览器是否支持SVG的代码
2013/03/21 Javascript
遍历DOM对象内的元素属性示例代码
2014/02/08 Javascript
如何判断微信内置浏览器(通过User Agent实现)
2014/09/01 Javascript
bootstrap jquery dataTable 异步ajax刷新表格数据的实现方法
2017/02/10 Javascript
Vue 路由切换时页面内容没有重新加载的解决方法
2018/09/01 Javascript
Vuejs学习笔记之使用指令v-model完成表单的数据双向绑定
2019/04/29 Javascript
浅谈关于vue中scss公用的解决方案
2019/12/02 Javascript
Javascript中的奇葩知识,你知道吗?
2021/01/25 Javascript
python私有属性和方法实例分析
2015/01/15 Python
Python的净值数据接口调用示例分享
2016/03/15 Python
使用pycharm生成代码模板的实例
2018/05/23 Python
Python + selenium + requests实现12306全自动抢票及验证码破解加自动点击功能
2018/11/23 Python
Python制作动态字符图的实例
2019/01/27 Python
Django框架视图函数设计示例
2019/07/29 Python
Python字典常见操作实例小结【定义、添加、删除、遍历】
2019/10/25 Python
Python使用qrcode二维码库生成二维码方法详解
2020/02/17 Python
python 函数嵌套及多函数共同运行知识点讲解
2020/03/03 Python
python字典的值可以修改吗
2020/06/29 Python
利用python+request通过接口实现人员通行记录上传功能
2021/01/13 Python
美国家居装饰和豪华家具购物网站:One Kings Lane
2018/12/24 全球购物
动态密码技术
2012/10/18 面试题
实习单位推荐信范文
2013/11/27 职场文书
关于感恩的演讲稿400字
2014/08/26 职场文书
出纳年终工作总结2014
2014/12/05 职场文书
运动与健康自我评价
2015/03/09 职场文书
因身体原因离职的辞职信范文
2015/05/12 职场文书
小学数学新课改心得体会
2016/01/22 职场文书