python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python正则匹配查询港澳通行证办理进度示例分享
Dec 27 Python
操作Windows注册表的简单的Python程序制作教程
Apr 07 Python
Python函数式编程指南(一):函数式编程概述
Jun 24 Python
python制作爬虫并将抓取结果保存到excel中
Apr 06 Python
老生常谈python函数参数的区别(必看篇)
May 29 Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 Python
python2.7使用plotly绘制本地散点图和折线图
Apr 02 Python
python实现扑克牌交互式界面发牌程序
Apr 22 Python
Python将二维列表list的数据输出(TXT,Excel)
Apr 23 Python
Anaconda+vscode+pytorch环境搭建过程详解
May 25 Python
Python的flask接收前台的ajax的post数据和get数据的方法
Apr 12 Python
python状态机transitions库详解
Jun 02 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
对象失去焦点时自己动提交数据的实现代码
2012/11/06 PHP
php中current、next与reset函数用法实例
2014/11/17 PHP
php调用KyotoTycoon简单实例
2015/04/02 PHP
PHP解析url并得到url参数方法总结
2018/10/11 PHP
PHP convert_uudecode()函数讲解
2019/02/14 PHP
PHP下载文件函数与用法示例
2019/09/27 PHP
实现png图片和png背景透明(支持多浏览器)的方法
2009/09/08 Javascript
Javascript继承(上)——对象构建介绍
2012/11/08 Javascript
在javascript中对于DOM的加强
2013/04/11 Javascript
多种方法实现JS动态添加事件
2013/11/01 Javascript
JavaScript如何实现在文本框(密码框)输入提示语
2015/12/25 Javascript
javascript截图 jQuery插件imgAreaSelect使用详解
2016/05/04 Javascript
JS中split()用法(将字符串按指定符号分割成数组)
2016/10/24 Javascript
JS中静态页面实现微信分享功能
2017/02/06 Javascript
vue-router3.0版本中 router.push 不能刷新页面的问题
2018/05/10 Javascript
详解js中Array的方法及技巧
2018/09/12 Javascript
谈谈为什么你的 JavaScript 代码如此冗长
2019/01/30 Javascript
微信小程序实现的动态设置导航栏标题功能示例
2019/01/31 Javascript
jquery.pager.js分页实现详解
2019/07/29 jQuery
[01:45]IMBATV TI4前线报道-选手到达
2014/07/07 DOTA
python中引用与复制用法实例分析
2015/06/04 Python
python将txt文件读取为字典的示例
2018/12/22 Python
OpenCV+Python识别车牌和字符分割的实现
2019/01/31 Python
python读取并写入mat文件的方法
2019/07/12 Python
python中列表的切片与修改知识点总结
2019/07/23 Python
Django框架反向解析操作详解
2019/11/28 Python
python实现高斯判别分析算法的例子
2019/12/09 Python
使用python快速实现不同机器间文件夹共享方式
2019/12/22 Python
Python 音频生成器的实现示例
2019/12/24 Python
无需JS和jQuery代码实现CSS3鼠标浮动放大图片
2016/11/21 HTML / CSS
canvas实现飞机打怪兽射击小游戏的示例代码
2018/07/09 HTML / CSS
韩国家庭购物网上商店:Nsmall
2017/05/07 全球购物
巴西宠物店在线:Geração Pet
2017/05/31 全球购物
经典团队口号
2014/06/06 职场文书
建国大业观后感800字
2015/06/01 职场文书
Python基础之赋值,浅拷贝,深拷贝的区别
2021/04/30 Python