通过python-pptx模块操作ppt文件的方法


Posted in Python onDecember 26, 2020

ppt通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。ppt的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

本文主要介绍python操作ppt的技巧,编程的优势在于处理速度,对于高大上的ppt设计,还是需要"以人为本", 所以该模块的使用场景主要是ppt基本元素的提取和添加,适合大量内容的转化,比如word转ppt, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是并不能满足日常办公对ppt美观性的要求。

在该模块中,将ppt拆分为了以下多个元素

1. presentations, 表示整个ppt文档

2. sliders. 表示ppt文档的每一页

3. shapes

4. placeholders

上述分类对应的常用操作如下

1. presentations

用于打开,创建,保存ppt文档,用法如下

>>> from pptx import Presentation
# 创建新的ppt文档
>>> prs = Presentation()
# 打开一个ppt文档
>>> prs = Presentation('input.pptx')
# 保存ppt文档
>>> prs.save('test.pptx')

2. slides

在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

1. Title

2. Title and Content

3. Section Header

4. Two Content

5. Comparison

6. Title Only

7. Blank

8. Content with Caption

9. Picture with Caption

通过数字下标0到9来访问,指定布局添加一页ppt的用法如下

>>> title_slide_layout = prs.slide_layouts[0]
>>> slide = prs.slides.add_slide(title_slide_layout)

3. shapes

shapes表示容器,在制作ppt时,各种基本元素,比如文本框,表格,图片等都占据了ppt的一个部分,或者矩形区域,或者其他各种自定义的形状。shapes表示所有基本元素的和, 通过如下方式来访问对应的shapes

shapes = slide.shapes

对于shapes而言,我们可以获取和设置其各种属性,比如最常用的text属性,用法如下

>>> shapes.text = 'hello world'

还可以通过add系列方法来添加各种元素,添加文本框的方法如下

>>> from pptx.util import Inches, Pt
>>> left = top = width = height = Inches(1)
>>> txBox = slide.shapes.add_textbox(left, top, width, height)
>>> tf = txBox.text_frame
>>> tf.text = "first paragraph"
>>> p = tf.add_paragraph()
>>> p.text = "second paragraph"

添加表格的方法如下

>>> rows = cols = 2
>>> left = top = Inches(2.0)
>>> width = Inches(6.0)
>>> height = Inches(0.8)
>>> table = shapes.add_table(rows, cols, left, top, width, height).table
>>> table.columns[0].width = Inches(2.0)
>>> table.columns[1].width = Inches(4.0)
>>> # write column headings
>>> table.cell(0, 0).text = 'Foo'
>>> table.cell(0, 1).text = 'Bar'

4. placeholders

shapes表示所有基本元素的总和,而placeholders则表示每一个具体的元素,所以placeholders是shapes的子集, 通过数字下标来访问对应的placeholder,用法如下

>>> slide.placeholders[1]
<pptx.shapes.placeholder.SlidePlaceholder object at 0x03F73A90>
>>> slide.placeholders[1].placeholder_format.idx
1
>>> slide.placeholders[1].name
'Subtitle 2'

placeholders是页面上已有的元素,获取对应的placeholders之后,可以通过insert系列方法来向其中新添元素。

了解上述层级结构,有助于我们对ppt的读写操作。除了写操作之外,也可以通过读操作来批量提取ppt中的特定元素,以文字为例,提取方式如下

from pptx import Presentation
 
prs = Presentation(path_to_presentation)
 
text_runs = []
 
for slide in prs.slides:
 for shape in slide.shapes:
  if not shape.has_text_frame:
   continue
  for paragraph in shape.text_frame.paragraphs:
   for run in paragraph.runs:
    text_runs.append(run.text)

通过该模块,可以快速搭建ppt的基本框架,也可以批量提取ppt中的特定元素,比如提取文字转换成word, 或者提取表格转换成excel文件。总而言之,该模块适合替代大量繁琐的人工复制粘贴操作。

到此这篇关于通过python-pptx模块操作ppt文件的方法的文章就介绍到这了,更多相关python-pptx模块操作ppt文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
在Python3中初学者应会的一些基本的提升效率的小技巧
Mar 31 Python
python读写二进制文件的方法
May 09 Python
python多线程socket编程之多客户端接入
Sep 12 Python
Python实现的栈(Stack)
Jan 26 Python
Python使用combinations实现排列组合的方法
Nov 13 Python
深度辨析Python的eval()与exec()的方法
Mar 26 Python
django框架防止XSS注入的方法分析
Jun 21 Python
Python环境Pillow( PIL )图像处理工具使用解析
Sep 12 Python
Python如何输出整数
Jun 07 Python
Django+Celery实现定时任务的示例
Jun 23 Python
Python使用psutil库对系统数据进行采集监控的方法
Aug 23 Python
Python Matplotlib绘制两个Y轴图像
Apr 13 Python
Python如何实现感知器的逻辑电路
Dec 25 #Python
使用Python实现音频双通道分离
Dec 25 #Python
Python用户自定义异常的实现
Dec 25 #Python
Django前后端分离csrf token获取方式
Dec 25 #Python
在vscode中启动conda虚拟环境的思路详解
Dec 25 #Python
python语言time库和datetime库基本使用详解
Dec 25 #Python
Alpine安装Python3依赖出现的问题及解决方法
Dec 25 #Python
You might like
php批量缩放图片的代码[ini参数控制]
2011/02/11 PHP
PHP Cookie的使用教程详解
2013/06/03 PHP
smarty简单入门实例
2014/11/28 PHP
PHP实现截取中文字符串不出现?号的解决方法
2016/12/29 PHP
PHP有序表查找之插值查找算法示例
2018/02/10 PHP
Javascript匿名函数的一种应用 代码封装
2010/06/27 Javascript
Jquery 一次处理多个ajax请求的代码
2011/09/02 Javascript
js 3秒后跳转页面的实现代码
2014/03/10 Javascript
jQuery实现div拖拽效果实例分析
2016/02/20 Javascript
超实用的javascript时间处理总结
2016/08/16 Javascript
JS常用加密编码与算法实例总结
2016/12/22 Javascript
详解Angular 4.x NgTemplateOutlet
2017/05/24 Javascript
vue-router单页面路由
2017/06/17 Javascript
详解如何在angular2中获取节点
2017/11/23 Javascript
详解tween.js 中文使用指南
2018/01/05 Javascript
jquery实现图片无缝滚动 蒙版遮蔽效果
2020/01/11 jQuery
[02:56]DOTA2亚洲邀请赛 VG出场战队巡礼
2015/02/07 DOTA
在Python中使用__slots__方法的详细教程
2015/04/28 Python
python在windows下创建隐藏窗口子进程的方法
2015/06/04 Python
Python中的字符串替换操作示例
2016/06/27 Python
Python使用内置json模块解析json格式数据的方法
2017/07/20 Python
python导出chrome书签到markdown文件的实例代码
2017/12/27 Python
python实现用户管理系统
2018/01/10 Python
python算法与数据结构之单链表的实现代码
2019/06/27 Python
pytorch自定义二值化网络层方式
2020/01/07 Python
在pycharm中实现删除bookmark
2020/02/14 Python
Pytorch高阶OP操作where,gather原理
2020/04/30 Python
Python sorted对list和dict排序
2020/06/09 Python
Pycharm安装Qt Design快捷工具的详细教程
2020/11/18 Python
详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据
2020/12/13 Python
canvas如何绘制钟表的方法
2017/12/13 HTML / CSS
大学校运会广播稿
2014/02/03 职场文书
2015年安全生产月活动总结
2015/03/26 职场文书
Python还能这么玩之用Python修改了班花的开机密码
2021/06/04 Python
MySQL窗口函数的具体使用
2021/11/17 MySQL
JavaScript前端面试扁平数据转tree与tree数据扁平化
2022/06/14 Javascript