Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python通过正则表达式选取callback的方法
Jul 18 Python
python实现word 2007文档转换为pdf文件
Mar 15 Python
python 判断网络连通的实现方法
Apr 22 Python
解决Python pandas df 写入excel 出现的问题
Jul 04 Python
Sanic框架路由用法实例分析
Jul 16 Python
Python零基础入门学习之输入与输出
Apr 03 Python
selenium2.0中常用的python函数汇总
Aug 05 Python
解决Python对齐文本字符串问题
Aug 28 Python
Python使用微信接入图灵机器人过程解析
Nov 04 Python
Python使用Tkinter实现滚动抽奖器效果
Jan 06 Python
Python devel安装失败问题解决方案
Jun 09 Python
利用python对mysql表做全局模糊搜索并分页实例
Jul 12 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
php读取msn上的用户信息类
2008/12/05 PHP
5种PHP创建数组的实例代码分享
2014/01/17 PHP
推荐一本PHP程序猿都应该拜读的书
2014/12/31 PHP
ECshop 迁移到 PHP7版本时遇到的兼容性问题
2016/02/15 PHP
Laravel框架中VerifyCsrfToken报错问题的解决
2017/08/30 PHP
一个用js实现的页内搜索代码
2007/05/23 Javascript
JavaScript 快捷键设置实现代码
2009/03/13 Javascript
为Extjs加加速(javascript加速)
2010/08/19 Javascript
载入jQuery库的最佳方法详细说明及实现代码
2012/12/28 Javascript
JQuery表格内容过滤的实现方法
2013/07/05 Javascript
Javascript学习笔记之 对象篇(三) : hasOwnProperty
2014/06/24 Javascript
jquery+php实现搜索框自动提示
2014/11/28 Javascript
jquery滚动加载数据的方法
2015/03/09 Javascript
jQuery+ThinkPHP+Ajax实现即时消息提醒功能实例代码
2017/03/21 jQuery
详解nodejs express下使用redis管理session
2017/04/24 NodeJs
详解Angular 4 表单快速入门
2017/06/05 Javascript
vue主动刷新页面及列表数据删除后的刷新实例
2018/09/16 Javascript
JavaScript数据结构与算法之二叉树添加/删除节点操作示例
2019/03/01 Javascript
JavaScript内置对象之Array的使用小结
2020/05/12 Javascript
Python抓取京东图书评论数据
2014/08/31 Python
python实现DES加密解密方法实例详解
2015/06/30 Python
python PIL模块与随机生成中文验证码
2016/02/27 Python
python如何修改装饰器中参数
2018/03/20 Python
python获取程序执行文件路径的方法(推荐)
2018/04/26 Python
python计算两个地址之间的距离方法
2018/06/09 Python
python3对拉勾数据进行可视化分析的方法详解
2019/04/03 Python
python字符串反转的四种方法详解
2019/12/02 Python
通过实例解析python subprocess模块原理及用法
2020/10/10 Python
澳大利亚排名第一的儿童在线玩具商店:Toy Galaxy
2018/10/06 全球购物
KEEN美国官网:美国人气户外休闲鞋品牌
2021/03/09 全球购物
NULL是什么,它是怎么定义的
2015/05/09 面试题
工业学校毕业生自荐书
2014/01/03 职场文书
2014年元旦活动方案
2014/02/15 职场文书
制药工程专业职业生涯规划范文
2014/03/10 职场文书
国庆横幅标语
2014/10/08 职场文书
Mysql中的触发器定义及语法介绍
2022/06/25 MySQL