python3处理word文档实例分析


Posted in Python onDecember 01, 2020

直接使用word文档已经难不倒大家了,有没有想过用python构建一个word文档写点文章呢?当然这个文章的框架需要我们用代码一点点的建立,在过程上有一点繁琐,一下子看不懂的小伙伴可以把它拆分成几个部分来看。下面就在python3处理word文档的代码给大家带来讲解,还会有一些设置文章格式的技巧。

一个Word文档,主要由下面这些内容元素构成,每个元素都有对应的方法处理:

  • 标题:add_heading()
  • 段落:add_paragraph()
  • 文本:add_run(),其返回对象支持设置文本属性
  • 图片:add_picture()
  • 表格:add_table()、add_row()、add_col()
import pathlib

from docx import Document
from docx.shared import Inches, Pt
from docx.oxml.ns import qn
 
path = list(pathlib.Path.cwd().parents)[1].joinpath('data/automate/003word')
out_path = path.joinpath('003word_create.docx')
img_path = path.joinpath('dance.jpg')
document = Document()
document.add_heading('Python1024_自动生成标题', 0)
document.add_heading('基本:文本', level=1)
p = document.add_paragraph('测试文本\n测试内容\n')
p.add_run('粗体部分内容\n').bold = True
p.add_run('斜体部分\n').italic = True
p.add_run('下划线部分\n').underline = True
p.add_run('字体设置\n').font.size = Pt(24)
# 测试第三方字体
x = p.add_run('三方字体测试\n')
x.font.name = 'Source Han Sans CN' # 思源字体
x.element.rPr.rFonts.set(qn('w:eastAsia'), 'Source Han Sans CN')
# 段落和引用
document.add_heading('标题一:段落', level=1)
document.add_paragraph('引用块', style='Intense Quote')
document.add_heading('标题1.1、无序列表', level=2)
opts = ['选项1','选项2', '选项3']
# 无需列表
for opt in opts:
  document.add_paragraph(opt, style='List Bullet')
document.add_heading('标题1.2、有序列表', level=2)
# 有序列表
  document.add_paragraph(opt, style='List Number')
document.add_heading('标题二:图片', level=1)
document.add_picture(str(img_path), width=Inches(5))
document.add_page_break()
document.add_heading('标题三:表格', level=1)
records = (
  (1, '电风扇', '无叶风扇'),
  (2, '吹风机', '离子风机'),
  (3, 'Macbook pro', 'Apple macbook pro 15寸')
)
# 表格
table = document.add_table(rows=1, cols=3)
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = '数量'
hdr_cells[1].text = 'ID'
hdr_cells[2].text = '描述信息'
# 表格数据
for qty, cid, desc in records:
  row_cells = table.add_row().cells
  row_cells[0].text = str(qty)
  row_cells[1].text = cid
  row_cells[2].text = desc
# 保存文档
document.save(out_path)

设置段落样式,

如下:

document.add_paragraph('这是一个样式为 ListBullet 的段落', style='ListBullet')

paragraph = document.add_paragraph('这是一个样式为 ListBullet 的段落')
paragraph.style = 'List Bullet'

设置段落间距

分为 段前 和 段后 ,设置值用 Pt 单位是 磅 ,如下:

paragraph_format.space_before = Pt(18)
paragraph_format.space_after = Pt(12)

设置段落行距 

当行距为 最小值 和 固定值 时,设置值单位为 磅 ,需要用 Pt ;当行距为 多倍行距 时,设置值为数值,如下:

from docx.shared import Length

#SINGLE     => 单倍行距(默认)

#ONE_POINT_FIVE => 1.5倍行距

#DOUBLE2    => 倍行距

#AT_LEAST    => 最小值

#EXACTLY    => 固定值

#MULTIPLE    => 多倍行距

paragraph.line_spacing_rule = WD_LINE_SPACING.EXACTLY #固定值

paragraph_format.line_spacing = Pt(18) # 固定值18磅

paragraph.line_spacing_rule = WD_LINE_SPACING.MULTIPLE #多倍行距

paragraph_format.line_spacing = 1.75 # 1.75倍行间距

到此这篇关于python3处理word文档实例分析的文章就介绍到这了,更多相关python3处理word文档代码内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用mysqldb连接数据库操作方法示例详解
Dec 03 Python
Python开发WebService系列教程之REST,web.py,eurasia,Django
Jun 30 Python
Python深入学习之特殊方法与多范式
Aug 31 Python
Python解析json文件相关知识学习
Mar 01 Python
Python字典简介以及用法详解
Nov 15 Python
详谈在flask中使用jsonify和json.dumps的区别
Mar 26 Python
python矩阵/字典实现最短路径算法
Jan 17 Python
python判断文件是否存在,不存在就创建一个的实例
Feb 18 Python
Python多线程threading模块用法实例分析
May 22 Python
python点击鼠标获取坐标(Graphics)
Aug 10 Python
python实发邮件实例详解
Nov 11 Python
keras 读取多标签图像数据方式
Jun 12 Python
python3中布局背景颜色代码分析
Dec 01 #Python
python 读取yaml文件的两种方法(在unittest中使用)
Dec 01 #Python
Python用摘要算法生成token及检验token的示例代码
Dec 01 #Python
python录音并调用百度语音识别接口的示例
Dec 01 #Python
用python爬虫批量下载pdf的实现
Dec 01 #Python
python3字符串输出常见面试题总结
Dec 01 #Python
python3中数组逆序输出方法
Dec 01 #Python
You might like
DIY一个适配电脑声卡的动圈话筒放大器
2021/03/02 无线电
基于qmail的完整WEBMAIL解决方案安装详解
2006/10/09 PHP
php 学习资料零碎东西
2010/12/04 PHP
php 目录与文件处理-郑阿奇(续)
2011/07/04 PHP
php图片添加文字水印实现代码
2016/03/15 PHP
JavaScript中的私有成员
2006/09/18 Javascript
收藏一些不常用,但是有用的代码
2007/03/12 Javascript
js运动框架_包括图片的淡入淡出效果
2013/05/11 Javascript
禁用键盘上的(全局)指定键兼容iE、Chrome、火狐
2013/05/14 Javascript
ie7+背景透明文字不透明超级简单的实现方法
2014/01/17 Javascript
Jquery实现动态切换图片的方法
2015/05/18 Javascript
探讨跨域请求资源的几种方式(总结)
2016/12/02 Javascript
使用nodejs爬取前程无忧前端技能排行
2017/05/06 NodeJs
深入理解JavaScript 参数按值传递
2017/05/24 Javascript
浅谈Emergence.js 检测元素可见性的 js 插件
2017/11/18 Javascript
Vue项目中如何引入icon图标
2018/03/28 Javascript
基于js Canvas实现二次贝塞尔曲线
2018/12/25 Javascript
Node.js 实现抢票小工具 & 短信通知提醒功能
2019/10/22 Javascript
小程序双头slider选择器的实现示例
2020/03/31 Javascript
[01:14]3.19DOTA2发布会 三代刀塔人第二代
2014/03/25 DOTA
[02:27]刀塔重生降临
2015/10/14 DOTA
Python中正则表达式的用法实例汇总
2014/08/18 Python
python通过邮件服务器端口发送邮件的方法
2015/04/30 Python
python中学习K-Means和图片压缩
2017/11/20 Python
Python3最长回文子串算法示例
2019/03/04 Python
Python实现合并excel表格的方法分析
2019/04/13 Python
python并发编程多进程 模拟抢票实现过程
2019/08/20 Python
PyTorch 随机数生成占用 CPU 过高的解决方法
2020/01/13 Python
OpenCV图片漫画效果的实现示例
2020/08/18 Python
html5 canvas-1.canvas介绍(hello canvas)
2013/01/07 HTML / CSS
考试退步检讨书
2014/01/15 职场文书
小学生元旦感言
2014/02/26 职场文书
大国崛起英国观后感
2015/06/02 职场文书
小学体育组工作总结
2015/08/13 职场文书
创业计划书之农家乐
2019/10/09 职场文书
python数据分析之用sklearn预测糖尿病
2021/04/22 Python