Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
python实现的简单猜数字游戏
Apr 04 Python
Python中的ctime()方法使用教程
May 22 Python
Python编程中的文件读写及相关的文件对象方法讲解
Jan 19 Python
Python微信企业号开发之回调模式接收微信端客户端发送消息及被动返回消息示例
Aug 21 Python
python实现二叉树的遍历
Dec 11 Python
详解Django解决ajax跨域访问问题
Aug 24 Python
Python3安装Pillow与PIL的方法
Apr 03 Python
Python字典对象实现原理详解
Jul 01 Python
Apache,wsgi,django 程序部署配置方法详解
Jul 01 Python
使用python对多个txt文件中的数据进行筛选的方法
Jul 10 Python
Python基于numpy模块实现回归预测
May 14 Python
解决pytorch读取自制数据集出现过的问题
May 31 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
PHP中动态HTML的输出技术
2006/10/09 PHP
利用static实现表格的颜色隔行显示
2006/10/09 PHP
同台服务器使用缓存APC效率高于Memcached的演示代码
2010/02/16 PHP
web目录下不应该存在多余的程序(安全考虑)
2012/05/09 PHP
THINKPHP2.0到3.0有哪些改进之处
2015/01/04 PHP
PHP反射学习入门示例
2019/06/14 PHP
laravel添加前台跳转成功页面示例
2019/10/22 PHP
解决php扩展安装不生效问题
2019/10/25 PHP
几行代码轻松搞定jquery实现flash8类似的连接效果
2007/05/03 Javascript
javascript动画对象支持加速、减速、缓入、缓出的实现代码
2012/09/30 Javascript
什么是MEAN?JavaScript编程中的MEAN是什么意思?
2014/12/18 Javascript
JavaScript深度复制(deep clone)的实现方法
2016/02/19 Javascript
JS实现根据文件字节数返回文件大小的方法
2016/08/02 Javascript
微信小程序页面传值实例分析
2017/04/19 Javascript
React组件内事件传参实现tab切换的示例代码
2018/07/04 Javascript
4个顶级开源JavaScript图表库
2018/09/29 Javascript
在 Angular-cli 中使用 simple-mock 实现前端开发 API Mock 接口数据模拟功能的方法
2018/11/28 Javascript
详解微信小程序缓存--缓存时效性
2019/05/02 Javascript
vue发送websocket请求和http post请求的实例代码
2019/07/11 Javascript
JavaScript判断数组类型的方法
2019/10/23 Javascript
[20:46]Ti4循环赛第三日VG vs DK
2014/07/12 DOTA
[04:17]DOTA2完美盛典,rOtk、BurNIng携手巴图演唱《倔强》
2017/11/28 DOTA
Python应用03 使用PyQT制作视频播放器实例
2016/12/07 Python
Python调用C语言的方法【基于ctypes模块】
2018/01/22 Python
python实现比较文件内容异同
2018/06/22 Python
python 运用Django 开发后台接口的实例
2018/12/11 Python
对python 合并 累加两个dict的实例详解
2019/01/21 Python
python与字符编码问题
2019/05/24 Python
python的pygal模块绘制反正切函数图像方法
2019/07/16 Python
Python facenet进行人脸识别测试过程解析
2019/08/16 Python
Python 使用指定的网卡发送HTTP请求的实例
2019/08/21 Python
python tkinter之顶层菜单、弹出菜单实例
2020/03/04 Python
使用python库xlsxwriter库来输出各种xlsx文件的示例
2020/09/01 Python
ZWILLING双立人法国网上商店:德国刀具锅具厨具品牌
2019/08/28 全球购物
小学教师事迹材料
2014/01/13 职场文书
2014年高中教师工作总结
2014/12/19 职场文书