python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中使用语句导入模块或包的机制研究
Mar 30 Python
浅析Python中MySQLdb的事务处理功能
Sep 21 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 Python
python数据抓取分析的示例代码(python + mongodb)
Dec 25 Python
Python cookbook(数据结构与算法)将名称映射到序列元素中的方法
Mar 22 Python
python+pandas生成指定日期和重采样的方法
Apr 11 Python
python中for循环输出列表索引与对应的值方法
Nov 07 Python
python调用opencv实现猫脸检测功能
Jan 15 Python
Python3.5运算符操作实例详解
Apr 25 Python
python实现小世界网络生成
Nov 21 Python
2020新版本pycharm+anaconda+opencv+pyqt环境配置学习笔记,亲测可用
Mar 24 Python
Python实现JS解密并爬取某音漫客网站
Oct 23 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
Terran魔法科技
2020/03/14 星际争霸
打造计数器DIY三步曲(下)
2006/10/09 PHP
php xml-rpc远程调用
2008/12/19 PHP
php获取根域名方法汇总
2014/10/28 PHP
php实现简单的MVC框架实例
2015/09/23 PHP
PHP开发之归档格式phar文件概念与用法详解【创建,使用,解包还原提取】
2017/11/17 PHP
PHP实现的多维数组排序算法分析
2018/02/10 PHP
JavaScript基于setTimeout实现计数的方法
2015/05/08 Javascript
jquery遍历函数siblings()用法实例
2015/12/24 Javascript
JS调用某段SQL语句的方法
2016/10/20 Javascript
jQuery插件FusionCharts实现的2D面积图效果示例【附demo源码下载】
2017/03/06 Javascript
想用好React的你必须要知道的一些事情
2017/07/24 Javascript
jQuery实现评论模块
2020/08/19 jQuery
Python中用PIL库批量给图片加上序号的教程
2015/05/06 Python
pip matplotlib报错equired packages can not be built解决
2018/01/06 Python
python3实现字符串操作的实例代码
2019/04/16 Python
解决.ui文件生成的.py文件运行不出现界面的方法
2019/06/19 Python
python之生产者消费者模型实现详解
2019/07/27 Python
logging level级别介绍
2020/02/21 Python
Python celery原理及运行流程解析
2020/06/13 Python
numpy 矩阵形状调整:拉伸、变成一位数组的实例
2020/06/18 Python
Python QTimer实现多线程及QSS应用过程解析
2020/07/11 Python
python实现最短路径的实例方法
2020/07/19 Python
python图片合成的示例
2020/11/09 Python
CSS3绘制有活力的链接下划线
2016/07/14 HTML / CSS
世界上最大的乐谱选择:Sheet Music Plus
2020/01/18 全球购物
Zalando Lounge瑞士:时尚与生活方式购物俱乐部
2020/03/12 全球购物
DOUGLAS荷兰:购买香水和化妆品
2020/10/24 全球购物
请编程遍历页面上所有 TextBox 控件并给它赋值为 string.Empty
2015/12/03 面试题
高中毕业自我鉴定
2013/12/16 职场文书
工作总结与自我评价
2014/09/18 职场文书
县政府办公室领导班子对照检查材料思想汇报
2014/09/28 职场文书
房屋租赁协议书(标准版)
2014/10/02 职场文书
村当支部个人对照检查材料思想汇报
2014/10/06 职场文书
2016反腐倡廉警示教育心得体会
2016/01/13 职场文书
Python requests库参数提交的注意事项总结
2021/03/29 Python