通过python-pptx模块操作ppt文件的方法


Posted in Python onDecember 26, 2020

ppt通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。ppt的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

本文主要介绍python操作ppt的技巧,编程的优势在于处理速度,对于高大上的ppt设计,还是需要"以人为本", 所以该模块的使用场景主要是ppt基本元素的提取和添加,适合大量内容的转化,比如word转ppt, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是并不能满足日常办公对ppt美观性的要求。

在该模块中,将ppt拆分为了以下多个元素

1. presentations, 表示整个ppt文档

2. sliders. 表示ppt文档的每一页

3. shapes

4. placeholders

上述分类对应的常用操作如下

1. presentations

用于打开,创建,保存ppt文档,用法如下

>>> from pptx import Presentation
# 创建新的ppt文档
>>> prs = Presentation()
# 打开一个ppt文档
>>> prs = Presentation('input.pptx')
# 保存ppt文档
>>> prs.save('test.pptx')

2. slides

在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

1. Title

2. Title and Content

3. Section Header

4. Two Content

5. Comparison

6. Title Only

7. Blank

8. Content with Caption

9. Picture with Caption

通过数字下标0到9来访问,指定布局添加一页ppt的用法如下

>>> title_slide_layout = prs.slide_layouts[0]
>>> slide = prs.slides.add_slide(title_slide_layout)

3. shapes

shapes表示容器,在制作ppt时,各种基本元素,比如文本框,表格,图片等都占据了ppt的一个部分,或者矩形区域,或者其他各种自定义的形状。shapes表示所有基本元素的和, 通过如下方式来访问对应的shapes

shapes = slide.shapes

对于shapes而言,我们可以获取和设置其各种属性,比如最常用的text属性,用法如下

>>> shapes.text = 'hello world'

还可以通过add系列方法来添加各种元素,添加文本框的方法如下

>>> from pptx.util import Inches, Pt
>>> left = top = width = height = Inches(1)
>>> txBox = slide.shapes.add_textbox(left, top, width, height)
>>> tf = txBox.text_frame
>>> tf.text = "first paragraph"
>>> p = tf.add_paragraph()
>>> p.text = "second paragraph"

添加表格的方法如下

>>> rows = cols = 2
>>> left = top = Inches(2.0)
>>> width = Inches(6.0)
>>> height = Inches(0.8)
>>> table = shapes.add_table(rows, cols, left, top, width, height).table
>>> table.columns[0].width = Inches(2.0)
>>> table.columns[1].width = Inches(4.0)
>>> # write column headings
>>> table.cell(0, 0).text = 'Foo'
>>> table.cell(0, 1).text = 'Bar'

4. placeholders

shapes表示所有基本元素的总和,而placeholders则表示每一个具体的元素,所以placeholders是shapes的子集, 通过数字下标来访问对应的placeholder,用法如下

>>> slide.placeholders[1]
<pptx.shapes.placeholder.SlidePlaceholder object at 0x03F73A90>
>>> slide.placeholders[1].placeholder_format.idx
1
>>> slide.placeholders[1].name
'Subtitle 2'

placeholders是页面上已有的元素,获取对应的placeholders之后,可以通过insert系列方法来向其中新添元素。

了解上述层级结构,有助于我们对ppt的读写操作。除了写操作之外,也可以通过读操作来批量提取ppt中的特定元素,以文字为例,提取方式如下

from pptx import Presentation
 
prs = Presentation(path_to_presentation)
 
text_runs = []
 
for slide in prs.slides:
 for shape in slide.shapes:
  if not shape.has_text_frame:
   continue
  for paragraph in shape.text_frame.paragraphs:
   for run in paragraph.runs:
    text_runs.append(run.text)

通过该模块,可以快速搭建ppt的基本框架,也可以批量提取ppt中的特定元素,比如提取文字转换成word, 或者提取表格转换成excel文件。总而言之,该模块适合替代大量繁琐的人工复制粘贴操作。

到此这篇关于通过python-pptx模块操作ppt文件的方法的文章就介绍到这了,更多相关python-pptx模块操作ppt文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python深入06——python的内存管理详解
Dec 07 Python
python机器学习之神经网络(二)
Dec 20 Python
对numpy中的transpose和swapaxes函数详解
Aug 02 Python
Python subprocess库的使用详解
Oct 26 Python
Python3爬虫学习之爬虫利器Beautiful Soup用法分析
Dec 12 Python
Python多项式回归的实现方法
Mar 11 Python
Python可变参数会自动填充前面的默认同名参数实例
Nov 18 Python
python爬虫可以爬什么
Jun 16 Python
利用python清除移动硬盘中的临时文件
Oct 28 Python
一文带你了解Python 四种常见基础爬虫方法介绍
Dec 04 Python
Pandas||过滤缺失数据||pd.dropna()函数的用法说明
May 14 Python
python 实现两个变量值进行交换的n种操作
Jun 02 Python
Python如何实现感知器的逻辑电路
Dec 25 #Python
使用Python实现音频双通道分离
Dec 25 #Python
Python用户自定义异常的实现
Dec 25 #Python
Django前后端分离csrf token获取方式
Dec 25 #Python
在vscode中启动conda虚拟环境的思路详解
Dec 25 #Python
python语言time库和datetime库基本使用详解
Dec 25 #Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 #Python
You might like
PHP 命名空间实例说明
2011/01/27 PHP
PHP中计算字符串相似度的函数代码
2012/12/29 PHP
php实现根据字符串生成对应数组的方法
2014/09/22 PHP
PHP滚动日志的代码实现
2015/06/10 PHP
PHP的全局错误处理详解
2016/04/25 PHP
javascript之卸载鼠标事件的代码
2007/05/14 Javascript
将字符串转换成gb2312或者utf-8编码的参数(js版)
2013/04/10 Javascript
js数组的基本用法及数组根据下标(数值或字符)移除元素
2013/10/20 Javascript
jquery 合并内容相同的单元格(示例代码)
2013/12/13 Javascript
45个JavaScript编程注意事项、技巧大全
2015/02/11 Javascript
轻松学习jQuery插件EasyUI EasyUI实现拖动基本操作
2015/11/30 Javascript
Boostrap入门准备之border box
2016/05/09 Javascript
jQuery获取table下某一行某一列的值实现代码
2017/04/07 jQuery
Node.js学习之地址解析模块URL的使用详解
2017/09/28 Javascript
vue单页应用加百度统计代码(亲测有效)
2018/01/31 Javascript
Vue自定义过滤器格式化数字三位加一逗号实现代码
2018/03/23 Javascript
vue源码解析之事件机制原理
2018/04/21 Javascript
vue-cli3.0使用及部分配置详解
2018/08/29 Javascript
详解JavaScript中typeof与instanceof用法
2018/10/24 Javascript
js实现简单音乐播放器
2020/06/30 Javascript
详解JavaScript 异步编程
2020/07/13 Javascript
[01:08:43]DOTA2-DPC中国联赛定级赛 Phoenix vs DLG BO3第一场 1月9日
2021/03/11 DOTA
Python获取CPU、内存使用率以及网络使用状态代码
2018/02/08 Python
python pandas消除空值和空格以及 Nan数据替换方法
2018/10/30 Python
python 根据字典的键值进行排序的方法
2019/07/24 Python
Atom Python 配置Python3 解释器的方法
2019/08/28 Python
感知器基础原理及python实现过程详解
2019/09/30 Python
python 实现list或string按指定分段
2019/12/25 Python
Python+Selenium实现自动化的环境搭建的步骤(图文)
2020/09/01 Python
python实现跨年表白神器--你值得拥有
2021/01/04 Python
使用CSS3美化HTML表单的技巧演示
2016/05/17 HTML / CSS
Famous Footwear加拿大:美国多品牌运动休闲鞋店
2018/12/05 全球购物
世界上最好的野生海鲜和有机食品:Vital Choice
2020/01/16 全球购物
亚马逊海外购:亚马逊美国、英国、日本、德国直邮
2021/03/18 全球购物
一些关于MySql加速和优化的面试题
2014/01/30 面试题
《三顾茅庐》教学反思
2014/04/10 职场文书