Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python中join和split用法实例
Apr 14 Python
python基于phantomjs实现导入图片
May 13 Python
Python 多线程实例详解
Mar 25 Python
python正则实现提取电话功能
Feb 24 Python
使用pandas的DataFrame的plot方法绘制图像的实例
May 24 Python
使用Python编写Prometheus监控的方法
Oct 15 Python
Python批量查询关键词微信指数实例方法
Jun 27 Python
python对常见数据类型的遍历解析
Aug 27 Python
Pycharm 安装 idea VIM插件的图文教程详解
Feb 21 Python
python获取系统内存占用信息的实例方法
Jul 17 Python
python实现跨年表白神器--你值得拥有
Jan 04 Python
深入理解Python变量的数据类型和存储
Feb 01 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
PHP生成月历代码
2007/06/14 PHP
PHP Array交叉表实现代码
2010/08/05 PHP
PHP文件读写操作之文件读取方法详解
2011/01/13 PHP
php session安全问题分析
2011/06/24 PHP
php学习笔记(三)操作符与控制结构
2011/08/06 PHP
nicejforms——美化表单不用愁
2007/02/20 Javascript
js设置cookie过期及清除浏览器对应名称的cookie
2013/10/24 Javascript
JS实现的不规则TAB选项卡效果代码
2015/09/18 Javascript
jQuery和hwSlider实现内容响应式可触控滑动切换效果附源码下载(二)
2016/06/22 Javascript
JavaScript中点击事件的写法
2016/06/28 Javascript
分分钟玩转Vue.js组件
2016/10/25 Javascript
通过构造函数实例化对象的方法
2017/06/28 Javascript
js实现各浏览器全屏代码实例
2018/07/03 Javascript
pageGroup.js实现分页功能
2019/07/27 Javascript
vue下canvas裁剪图片实例讲解
2020/04/16 Javascript
详解vue组件之间的通信
2020/08/30 Javascript
vue中可编辑树状表格的实现代码
2020/10/31 Javascript
微信小程序自定义支持图片的弹窗
2020/12/21 Javascript
使用优化器来提升Python程序的执行效率的教程
2015/04/02 Python
Python装饰器使用实例:验证参数合法性
2015/06/24 Python
python递归查询菜单并转换成json实例
2017/03/27 Python
对python添加模块路径的三种方法总结
2018/10/16 Python
PyCharm设置护眼背景色的方法
2018/10/29 Python
解决运行django程序出错问题 'str'object has no attribute'_meta'
2020/07/15 Python
Avène雅漾美国官方网站:敏感肌肤护理专家
2016/10/24 全球购物
Vilebrequin美国官方网上商店:法国豪华泳装品牌
2020/02/22 全球购物
L’Artisan Parfumeur官网:法国香水品牌
2020/08/11 全球购物
安全检查验收制度
2014/01/12 职场文书
大三毕业自我鉴定
2014/01/15 职场文书
计划生育标语
2014/06/23 职场文书
个人自查自纠材料
2014/10/14 职场文书
超市食品安全承诺书
2015/04/29 职场文书
交通安全学习心得体会
2016/01/18 职场文书
MySQL中的引号和反引号的区别与用法详解
2021/10/24 MySQL
TV动画《神废柴☆偶像》公布先导PV
2022/03/20 日漫
MySql如何将查询的出来的字段进行转换
2022/06/14 MySQL