Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
使用Python编写类UNIX系统的命令行工具的教程
Apr 15 Python
基于python爬虫数据处理(详解)
Jun 10 Python
Python Json序列化与反序列化的示例
Jan 31 Python
VSCode下好用的Python插件及配置
Apr 06 Python
在Python dataframe中出生日期转化为年龄的实现方法
Oct 20 Python
Python内存管理实例分析
Jul 10 Python
Python实现使用dir获取类的方法列表
Dec 24 Python
python中读入二维csv格式的表格方法详解(以元组/列表形式表示)
Apr 24 Python
pytorch cuda上tensor的定义 以及减少cpu的操作详解
Jun 23 Python
Python操作Elasticsearch处理timeout超时
Jul 17 Python
python实现xml转json文件的示例代码
Dec 30 Python
PyTorch device与cuda.device用法
Apr 03 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
网页游戏开发入门教程二(游戏模式+系统)
2009/11/02 PHP
php入门学习知识点七 PHP函数的基本应用
2011/07/14 PHP
PHP解析目录路径的3个函数总结
2014/11/18 PHP
PHP编写学校网站上新生注册登陆程序的实例分享
2016/03/21 PHP
Some tips of wmi scripting in jscript (1)
2007/04/03 Javascript
js调用iframe实现打印页面内容的方法
2014/03/04 Javascript
jquery实现当滑动到一定位置时固定效果
2014/06/17 Javascript
JavaScript中的闭包介绍
2015/03/15 Javascript
jQuery Easyui DataGrid点击某个单元格即进入编辑状态焦点移开后保存数据
2016/08/15 Javascript
angular+ionic 的app上拉加载更新数据实现方法
2017/01/16 Javascript
canvas实现探照灯效果
2017/02/07 Javascript
vue中的event bus非父子组件通信解析
2017/10/27 Javascript
详解React 的几种条件渲染以及选择
2018/10/23 Javascript
JS基于Location实现访问Url、重定向及刷新页面的方法分析
2018/12/03 Javascript
微信小程序 行的删除和增加操作实现详解
2019/09/29 Javascript
vue自定义指令和动态路由实现权限控制
2020/08/28 Javascript
[17:36]VG战队纪录片
2014/08/21 DOTA
[04:59]2018DOTA2亚洲邀请赛 4.7 Mineski夺冠时刻
2018/04/09 DOTA
python高阶爬虫实战分析
2018/07/29 Python
Python编程中flask的简介与简单使用
2018/12/28 Python
深入浅析Python 命令行模块 Click
2020/03/11 Python
python 引用传递和值传递详解(实参,形参)
2020/06/05 Python
日本订房网站,预订日本星级酒店/温泉旅馆:Relux(支持中文)
2020/01/03 全球购物
汉米尔顿手表官网:Hamilton
2020/09/13 全球购物
JSF面试题:如何管量web层中的Bean,用什么标签。如何通过jsp页面与Bean绑定在一起进行处理?
2012/10/05 面试题
医药营销专业个人自荐信
2013/09/29 职场文书
后勤岗位职责
2013/11/26 职场文书
销售经理工作职责范文
2013/12/03 职场文书
音乐学专业求职信
2014/07/22 职场文书
工会趣味活动方案
2014/08/18 职场文书
购房协议书范本(无房产证)
2014/10/07 职场文书
销售辞职信范文
2015/03/02 职场文书
大学毕业生自我评价
2015/03/02 职场文书
高中生思想道德自我评价
2015/03/09 职场文书
李强为自己工作观后感
2015/06/11 职场文书
Python爬虫入门案例之爬取二手房源数据
2021/10/16 Python