用python处理MS Word的实例讲解


Posted in Python onMay 08, 2018

使用python工具读写MS Word文件(docx与doc文件),主要利用了python-docx包。本文给出一些常用的操作,并完成一个样例,帮助大家快速入手。

安装

pyhton处理docx文件需要使用python-docx 包,可以利用pip工具很方便的安装,pip工具在python安装路径下的Scripts文件夹中

pip install python-docx

当然你也可以选择使用easy_install或者手动方式进行安装

写入文件内容

此处我们直接给出一个样例,根据自己的需要摘取有用的内容

#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#打开文档
document = Document()
#加入不同等级的标题
document.add_heading(u'MS WORD写入测试',0)
document.add_heading(u'一级标题',1)
document.add_heading(u'二级标题',2)
#添加文本
paragraph = document.add_paragraph(u'我们在做文本测试!')
#设置字号
run = paragraph.add_run(u'设置字号、')
run.font.size = Pt(24)
#设置字体
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'
#设置中文字体
run = paragraph.add_run(u'设置中文字体、')
run.font.name=u'宋体'
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
#设置斜体
run = paragraph.add_run(u'斜体、')
run.italic = True
#设置粗体
run = paragraph.add_run(u'粗体').bold = True
#增加引用
document.add_paragraph('Intense quote', style='Intense Quote')
#增加无序列表
document.add_paragraph(
 u'无序列表元素1', style='List Bullet'
)
document.add_paragraph(
 u'无序列表元素2', style='List Bullet'
)
#增加有序列表
document.add_paragraph(
 u'有序列表元素1', style='List Number'
)
document.add_paragraph(
 u'有序列表元素2', style='List Number'
)
#增加图像(此处用到图像image.bmp,请自行添加脚本所在目录中)
document.add_picture('image.bmp', width=Inches(1.25))
#增加表格
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
#再增加3行表格元素
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = 'test'+str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = 'desc'+str(i)
#增加分页
document.add_page_break()
#保存文件
document.save(u'测试.docx')

该段代码生成的文档样式如下

用python处理MS Word的实例讲解

注:有一个问题没找到如何解决,即如何为表格设置边框线。如果您知道,还请能够指教。

读取文件内容

#coding=utf-8
from docx import Document
#打开文档
document = Document(u'测试.docx')
#读取每段资料
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
#输出并观察结果,也可以通过其他手段处理文本即可
for i in l:
 print i
#读取表格材料,并输出结果
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode('gb2312'),'\t',
  print
 print '\n'

我们仍然使用刚才我们生成的文件,可以看到,输出的结果为

用python处理MS Word的实例讲解

注意:此处我们使用gb2312编码方式读取,主要是保证中文的读写正确。一般情况下,使用的utf-8编码方式。另外,python-docx主要处理docx文件,在加载doc文件时,会出现问题,如果有大量doc文件,建议先将doc文件批量转换为docx文件,例如利用工具doc2doc

以上这篇用python处理MS Word的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在漏洞利用Python代码真的很爽
Aug 26 Python
python中黄金分割法实现方法
May 06 Python
python cx_Oracle模块的安装和使用详细介绍
Feb 13 Python
Python实现的字典值比较功能示例
Jan 08 Python
Linux-ubuntu16.04 Python3.5配置OpenCV3.2的方法
Apr 02 Python
Numpy 将二维图像矩阵转换为一维向量的方法
Jun 05 Python
python重试装饰器的简单实现方法
Jan 31 Python
python-itchat 获取微信群用户信息的实例
Feb 21 Python
详解python读取image
Apr 03 Python
python3安装crypto出错及解决方法
Jul 30 Python
python生成随机红包的实例写法
Sep 02 Python
keras 实现轻量级网络ShuffleNet教程
Jun 19 Python
基于python批量处理dat文件及科学计算方法详解
May 08 #Python
使用Python通过win32 COM实现Word文档的写入与保存方法
May 08 #Python
Ubuntu下使用python读取doc和docx文档的内容方法
May 08 #Python
儿童编程python入门
May 08 #Python
解决python大批量读写.doc文件的问题
May 08 #Python
python在每个字符后添加空格的实例
May 07 #Python
Pycharm在创建py文件时,自动添加文件头注释的实例
May 07 #Python
You might like
php判断一个数组是否为有序的方法
2015/03/27 PHP
用 JSON 处理缓存
2007/04/27 Javascript
jquery 之 $().hover(func1, funct2)使用方法
2012/06/14 Javascript
ie下$.getJSON出现问题的解决方法
2014/02/12 Javascript
Jquery实现Div上下移动示例
2014/04/23 Javascript
JavaScript动态修改弹出窗口大小的方法
2015/04/06 Javascript
vue从使用到源码实现教程详解
2016/09/19 Javascript
运用js教你轻松制作html音乐播放器
2020/04/17 Javascript
如何使用headjs来管理和异步加载js
2016/11/29 Javascript
angular中的http拦截器Interceptors的实现
2017/02/21 Javascript
zTree获取当前节点的下一级子节点数实例
2017/09/05 Javascript
D3.js实现简洁实用的动态仪表盘的示例
2018/04/04 Javascript
vue-cli脚手架搭建的项目去除eslint验证的方法
2018/09/29 Javascript
nodejs使用async模块同步执行的方法
2019/03/02 NodeJs
基于VSCode调试网页JavaScript代码过程详解
2020/07/20 Javascript
JS+Canvas实现五子棋游戏
2020/08/26 Javascript
python操作摄像头截图实现远程监控的例子
2014/03/25 Python
简单介绍Python中的try和finally和with方法
2015/05/05 Python
Python的Django REST框架中的序列化及请求和返回
2016/04/11 Python
Python数据可视化正态分布简单分析及实现代码
2017/12/04 Python
Python 3.8中实现functools.cached_property功能
2019/05/29 Python
对pytorch中的梯度更新方法详解
2019/08/20 Python
Python+opencv+pyaudio实现带声音屏幕录制
2019/12/23 Python
tensorflow 自定义损失函数示例代码
2020/02/05 Python
django自带的权限管理Permission用法说明
2020/05/13 Python
Python configparser模块操作代码实例
2020/06/08 Python
HTML5 Canvas 绘图——使用 Canvas 绘制图形图文教程 使用html5 canvas 绘制精美的图
2015/08/31 HTML / CSS
Shopee菲律宾:在线购买和出售
2019/11/25 全球购物
材料化学应届生求职信
2013/10/09 职场文书
农救科工作职责
2013/11/27 职场文书
护理专业学生的求职信范文
2013/12/11 职场文书
文明风采获奖感言
2014/02/18 职场文书
兽医医药专业求职信
2014/07/27 职场文书
初中运动会前导词
2015/07/20 职场文书
助学金申请书该怎么写?
2019/07/16 职场文书
剑指Offer之Java算法习题精讲二叉树专项训练
2022/03/21 Java/Android