python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python使用修饰器执行函数的参数检查功能示例
Sep 26 Python
浅谈Python peewee 使用经验
Oct 20 Python
详解python OpenCV学习笔记之直方图均衡化
Feb 08 Python
对pycharm代码整体左移和右移缩进快捷键的介绍
Jul 16 Python
python tkinter canvas使用实例
Nov 04 Python
详解python opencv、scikit-image和PIL图像处理库比较
Dec 26 Python
Tensorflow 卷积的梯度反向传播过程
Feb 10 Python
Python selenium抓取虎牙短视频代码实例
Mar 02 Python
Python打印特殊符号及对应编码解析
May 07 Python
使用python采集Excel表中某一格数据
May 14 Python
keras读取h5文件load_weights、load代码操作
Jun 12 Python
基于python实现百度语音识别和图灵对话
Nov 02 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
PHP的foreach中使用引用时需要注意的一个问题和解决方法
2014/05/29 PHP
PHP5全版本绕过open_basedir读文件脚本漏洞详细介绍
2015/01/20 PHP
ThinkPHP框架下微信支付功能总结踩坑笔记
2019/04/10 PHP
Javascript 继承机制实例
2009/08/12 Javascript
jQuery 核心函数以及jQuery对象
2010/03/23 Javascript
javascript实现iframe框架延时加载的方法
2014/10/30 Javascript
JavaScript实现LI列表数据绑定的方法
2015/08/04 Javascript
jquery马赛克拼接翻转效果代码分享
2015/08/24 Javascript
JS本地刷新返回上一页代码
2016/07/25 Javascript
获取JS中网页各种高宽与位置的方法总结
2016/07/27 Javascript
Js实现京东无延迟菜单效果实例(demo)
2017/06/02 Javascript
Angularjs渲染的 using 指令的星级评分系统示例
2017/11/09 Javascript
AngularJS与BootStrap模仿百度分页的示例代码
2018/05/23 Javascript
小程序ios音频播放没声音问题的解决
2018/07/11 Javascript
浅谈针对Vue相同路由不同参数的刷新问题
2018/09/29 Javascript
基于VUE实现的九宫格抽奖功能
2018/09/30 Javascript
微信小程序搜索功能(附:小程序前端+PHP后端)
2019/02/28 Javascript
使用 Element UI Table 的 slot-scope方法
2019/10/10 Javascript
nodejs开发一个最简单的web服务器实例讲解
2020/01/02 NodeJs
python三元运算符实现方法
2013/12/17 Python
使用Python简单的实现树莓派的WEB控制
2016/02/18 Python
ubuntu 16.04下python版本切换的方法
2019/06/14 Python
一文秒懂python读写csv xml json文件各种骚操作
2019/07/04 Python
python 变量初始化空列表的例子
2019/11/28 Python
简单了解Python3 bytes和str类型的区别和联系
2019/12/19 Python
python 图像的离散傅立叶变换实例
2020/01/02 Python
Python使用turtle库绘制小猪佩奇(实例代码)
2020/01/16 Python
CSS3实现彩色进度条动画的示例
2020/10/29 HTML / CSS
西班牙语在线票务市场:SuperBoletería
2019/06/10 全球购物
合伙经营协议书范本
2014/04/18 职场文书
实习生矿工检讨书
2014/10/13 职场文书
2014年采购部工作总结
2014/11/20 职场文书
2014年爱国卫生工作总结
2014/11/22 职场文书
实习单位指导教师评语
2014/12/30 职场文书
2015年支教教师工作总结
2015/07/22 职场文书
2016年秋季运动会广播稿
2015/12/21 职场文书