Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python中的迭代器与生成器高级用法解析
Jun 28 Python
python实现应用程序在右键菜单中添加打开方式功能
Jan 09 Python
Python中创建字典的几种方法总结(推荐)
Apr 27 Python
python删除本地夹里重复文件的方法
Nov 19 Python
浅谈python中np.array的shape( ,)与( ,1)的区别
Jun 04 Python
Python占用的内存优化教程
Jul 28 Python
Django缓存系统实现过程解析
Aug 02 Python
python列表推导和生成器表达式知识点总结
Jan 10 Python
python tkinter之 复选、文本、下拉的实现
Mar 04 Python
pycharm 快速解决python代码冲突的问题
Jan 15 Python
利用Python批量识别电子账单数据的方法
Feb 08 Python
详解python的异常捕获
Mar 03 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
PHP网站备份程序代码分享
2011/06/10 PHP
php操作路径的经典方法(必看篇)
2016/10/04 PHP
php 输出json及显示json中的中文汉字详解及实例
2016/11/09 PHP
浅析php如何实现爬取数据原理
2018/09/27 PHP
jQuery下的几个你可能没用过的功能
2010/08/29 Javascript
javascript跨域刷新实现代码
2011/01/01 Javascript
解决Extjs 4 Panel作为Window组件的子组件时出现双重边框问题
2013/01/11 Javascript
Js判断参数(String,Array,Object)是否为undefined或者值为空
2013/11/04 Javascript
用javascript关闭本窗口技巧小结
2014/09/05 Javascript
js中document.write的那点事
2014/12/12 Javascript
浅谈Jquery核心函数
2015/06/18 Javascript
JavaScript和JQuery的鼠标mouse事件冒泡处理
2015/06/19 Javascript
第一篇初识bootstrap
2016/06/21 Javascript
把普通对象转换成json格式的对象的简单实例
2016/07/04 Javascript
js验证手机号、密码、短信验证码代码工具类
2020/06/24 Javascript
JS原生轮播图的简单实现(推荐)
2017/07/22 Javascript
javascript帧动画(实例讲解)
2017/09/02 Javascript
VUE饿了么树形控件添加增删改功能的示例代码
2017/10/17 Javascript
详解node Async/Await 更好的异步编程解决方案
2018/05/10 Javascript
详解VUE调用本地json的使用方法
2019/05/15 Javascript
[01:13]DOTA2群星解读国服召集令 一起说出回归的理由
2013/07/17 DOTA
python模拟登陆阿里妈妈生成商品推广链接
2014/04/03 Python
python3.5 email实现发送邮件功能
2018/05/22 Python
Pytorch卷积层手动初始化权值的实例
2019/08/17 Python
详解python中*号的用法
2019/10/21 Python
Django实现CAS+OAuth2的方法示例
2019/10/30 Python
python import 上级目录的导入
2020/11/03 Python
css3 column实现卡片瀑布流布局的示例代码
2018/06/22 HTML / CSS
墨西哥运动服饰和鞋网上商店:Netshoes墨西哥
2016/07/28 全球购物
Dogeared官网:在美国手工制作的珠宝
2019/08/24 全球购物
公司同意接收函
2014/01/13 职场文书
机械系毕业生求职信
2014/05/28 职场文书
单位实习工作证明怎么写
2014/11/02 职场文书
2016年劳模先进事迹材料
2016/02/25 职场文书
幼儿园教师教学反思
2016/03/02 职场文书
2019入党申请书范文3篇
2019/08/21 职场文书