通过python-pptx模块操作ppt文件的方法


Posted in Python onDecember 26, 2020

ppt通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。ppt的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

本文主要介绍python操作ppt的技巧,编程的优势在于处理速度,对于高大上的ppt设计,还是需要"以人为本", 所以该模块的使用场景主要是ppt基本元素的提取和添加,适合大量内容的转化,比如word转ppt, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是并不能满足日常办公对ppt美观性的要求。

在该模块中,将ppt拆分为了以下多个元素

1. presentations, 表示整个ppt文档

2. sliders. 表示ppt文档的每一页

3. shapes

4. placeholders

上述分类对应的常用操作如下

1. presentations

用于打开,创建,保存ppt文档,用法如下

>>> from pptx import Presentation
# 创建新的ppt文档
>>> prs = Presentation()
# 打开一个ppt文档
>>> prs = Presentation('input.pptx')
# 保存ppt文档
>>> prs.save('test.pptx')

2. slides

在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

1. Title

2. Title and Content

3. Section Header

4. Two Content

5. Comparison

6. Title Only

7. Blank

8. Content with Caption

9. Picture with Caption

通过数字下标0到9来访问,指定布局添加一页ppt的用法如下

>>> title_slide_layout = prs.slide_layouts[0]
>>> slide = prs.slides.add_slide(title_slide_layout)

3. shapes

shapes表示容器,在制作ppt时,各种基本元素,比如文本框,表格,图片等都占据了ppt的一个部分,或者矩形区域,或者其他各种自定义的形状。shapes表示所有基本元素的和, 通过如下方式来访问对应的shapes

shapes = slide.shapes

对于shapes而言,我们可以获取和设置其各种属性,比如最常用的text属性,用法如下

>>> shapes.text = 'hello world'

还可以通过add系列方法来添加各种元素,添加文本框的方法如下

>>> from pptx.util import Inches, Pt
>>> left = top = width = height = Inches(1)
>>> txBox = slide.shapes.add_textbox(left, top, width, height)
>>> tf = txBox.text_frame
>>> tf.text = "first paragraph"
>>> p = tf.add_paragraph()
>>> p.text = "second paragraph"

添加表格的方法如下

>>> rows = cols = 2
>>> left = top = Inches(2.0)
>>> width = Inches(6.0)
>>> height = Inches(0.8)
>>> table = shapes.add_table(rows, cols, left, top, width, height).table
>>> table.columns[0].width = Inches(2.0)
>>> table.columns[1].width = Inches(4.0)
>>> # write column headings
>>> table.cell(0, 0).text = 'Foo'
>>> table.cell(0, 1).text = 'Bar'

4. placeholders

shapes表示所有基本元素的总和,而placeholders则表示每一个具体的元素,所以placeholders是shapes的子集, 通过数字下标来访问对应的placeholder,用法如下

>>> slide.placeholders[1]
<pptx.shapes.placeholder.SlidePlaceholder object at 0x03F73A90>
>>> slide.placeholders[1].placeholder_format.idx
1
>>> slide.placeholders[1].name
'Subtitle 2'

placeholders是页面上已有的元素,获取对应的placeholders之后,可以通过insert系列方法来向其中新添元素。

了解上述层级结构,有助于我们对ppt的读写操作。除了写操作之外,也可以通过读操作来批量提取ppt中的特定元素,以文字为例,提取方式如下

from pptx import Presentation
 
prs = Presentation(path_to_presentation)
 
text_runs = []
 
for slide in prs.slides:
 for shape in slide.shapes:
  if not shape.has_text_frame:
   continue
  for paragraph in shape.text_frame.paragraphs:
   for run in paragraph.runs:
    text_runs.append(run.text)

通过该模块,可以快速搭建ppt的基本框架,也可以批量提取ppt中的特定元素,比如提取文字转换成word, 或者提取表格转换成excel文件。总而言之,该模块适合替代大量繁琐的人工复制粘贴操作。

到此这篇关于通过python-pptx模块操作ppt文件的方法的文章就介绍到这了,更多相关python-pptx模块操作ppt文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中的一些类型转换函数小结
Feb 10 Python
python操作gmail实例
Jan 14 Python
Python Web框架Flask中使用新浪SAE云存储实例
Feb 08 Python
用Python编写分析Python程序性能的工具的教程
Apr 01 Python
python基于xmlrpc实现二进制文件传输的方法
Jun 02 Python
python如何让类支持比较运算
Mar 20 Python
Django 1.10以上版本 url 配置注意事项详解
Aug 05 Python
python 叠加等边三角形的绘制的实现
Aug 14 Python
对python中的*args与**kwgs的含义与作用详解
Aug 28 Python
Python自动化操作实现图例绘制
Jul 09 Python
python如何导入依赖包
Jul 13 Python
使用py-spy解决scrapy卡死的问题方法
Sep 29 Python
Python如何实现感知器的逻辑电路
Dec 25 #Python
使用Python实现音频双通道分离
Dec 25 #Python
Python用户自定义异常的实现
Dec 25 #Python
Django前后端分离csrf token获取方式
Dec 25 #Python
在vscode中启动conda虚拟环境的思路详解
Dec 25 #Python
python语言time库和datetime库基本使用详解
Dec 25 #Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 #Python
You might like
无数据库的详细域名查询程序PHP版(2)
2006/10/09 PHP
PHP脚本的10个技巧(8)
2006/10/09 PHP
PHP运行时强制显示出错信息的代码
2011/04/20 PHP
给初学者的30条PHP最佳实践(荒野无灯)
2011/08/02 PHP
php生成数字字母的验证码图片
2015/07/14 PHP
10个超级有用的PHP代码片段果断收藏
2015/09/23 PHP
javascript 获取表单file全路径
2009/12/31 Javascript
改善用户体验的五款jQuery插件分享
2011/05/22 Javascript
jquery $.ajax相关用法分享
2012/03/16 Javascript
JavaScript动态创建link标签到head里的方法
2014/12/22 Javascript
angularjs+bootstrap菜单的使用示例代码
2017/03/07 Javascript
Vue隐藏显示、只读实例代码
2018/07/18 Javascript
nodejs异步编程基础之回调函数用法分析
2018/12/26 NodeJs
详解js 创建对象的几种方法
2019/03/08 Javascript
vue 使用鼠标滚动加载数据的例子
2019/10/31 Javascript
vue 解决遍历对象显示的顺序不对问题
2019/11/07 Javascript
jQuery+PHP+Ajax实现动态数字统计展示功能
2019/12/25 jQuery
Python中几种操作字符串的方法的介绍
2015/04/09 Python
详解在Python程序中使用Cookie的教程
2015/04/30 Python
Python制作爬虫抓取美女图
2016/01/20 Python
Python日志模块logging基本用法分析
2018/08/23 Python
基于python实现语音录入识别代码实例
2020/01/17 Python
Python 操作 MySQL数据库
2020/09/18 Python
HTML5+CSS3实例 :canvas 模拟实现电子彩票刮刮乐代码
2016/12/30 HTML / CSS
俄罗斯品牌服装和鞋子的在线商店:KUPIVIP
2019/10/27 全球购物
实习老师个人总结的自我评价
2013/09/28 职场文书
《冬阳童年骆驼队》教学反思
2014/04/15 职场文书
学校学雷锋活动总结
2014/06/26 职场文书
地理信息科学专业推荐信
2014/09/08 职场文书
市场营销工作计划书
2014/09/15 职场文书
2014年平安建设工作总结
2014/11/19 职场文书
初婚初育证明范本
2014/11/24 职场文书
2014年幼儿园园长工作总结
2014/12/17 职场文书
Nginx快速入门教程
2021/03/31 Servers
Python爬虫之爬取某文库文档数据
2021/04/21 Python
php访问对象中的成员的实例方法
2021/11/17 PHP