python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
解决Python中由于logging模块误用导致的内存泄露
Apr 23 Python
在Python中使用SQLite的简单教程
Apr 29 Python
python 容器总结整理
Apr 04 Python
python中将函数赋值给变量时需要注意的一些问题
Aug 18 Python
浅谈python中copy和deepcopy中的区别
Oct 23 Python
python将文本中的空格替换为换行的方法
Mar 19 Python
python如何拆分含有多种分隔符的字符串
Mar 20 Python
解决python报错MemoryError的问题
Jun 26 Python
浅谈Python大神都是这样处理XML文件的
May 31 Python
python腾讯语音合成实现过程解析
Aug 01 Python
flask实现验证码并验证功能
Dec 05 Python
python爬虫搭配起Bilibili唧唧的流程分析
Dec 01 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
PHP 命令行工具 shell_exec, exec, passthru, system详细使用介绍
2011/09/11 PHP
PHP使用CURL实现对带有验证码的网站进行模拟登录的方法
2014/07/23 PHP
PHP实现取得HTTP请求的原文
2014/08/18 PHP
使用Yii2实现主从数据库设置
2016/11/20 PHP
js简单实现HTML标签Select联动带跳转
2013/10/23 Javascript
js加载之使用DOM方法动态加载Javascript文件
2013/11/08 Javascript
javascript中apply和call方法的作用及区别说明
2014/02/14 Javascript
jquery实现的树形目录实例
2015/06/26 Javascript
AngularJS实用开发技巧(推荐)
2016/07/13 Javascript
js轮盘抽奖实例分析
2020/04/17 Javascript
jQuery实现右键菜单、遮罩等效果代码
2016/09/27 Javascript
Angular 中 select指令用法详解
2016/09/29 Javascript
微信小程序 前端源码逻辑和工作流详解
2016/10/08 Javascript
微信小程序 侧滑删除(左滑删除)
2017/05/23 Javascript
ionic3 懒加载
2017/08/16 Javascript
微信小程序中button组件的边框设置的实例详解
2017/09/27 Javascript
详解如何使用router-link对象方式传递参数?
2019/05/02 Javascript
7个好用的JavaScript技巧分享(译)
2019/05/07 Javascript
了解javascript中的Dom操作
2019/05/27 Javascript
[00:15]天涯墨客终极技能展示
2018/08/25 DOTA
Python实现的下载网页源码功能示例
2017/06/13 Python
详解Python装饰器
2019/03/25 Python
python 弹窗提示警告框MessageBox的实例
2019/06/18 Python
将Pytorch模型从CPU转换成GPU的实现方法
2019/08/19 Python
django-xadmin根据当前登录用户动态设置表单字段默认值方式
2020/03/13 Python
python开发前景如何
2020/06/11 Python
Dower & Hall官网:英国小众轻奢珠宝品牌
2019/01/31 全球购物
全球领先的在线cosplay服装商店:RoleCosplay
2020/01/18 全球购物
资产经营总监岗位职责
2013/12/04 职场文书
庆中秋节主题活动方案
2014/02/03 职场文书
幼儿园六一儿童节文艺汇演主持词
2014/03/21 职场文书
关于清明节的演讲稿
2014/09/13 职场文书
2014年综治维稳工作总结
2014/11/17 职场文书
2014年优秀班主任工作总结
2014/12/16 职场文书
Windows11里微软已经将驱动程序安装位置A盘删除
2021/11/21 数码科技
Vue监视数据的原理详解
2022/02/24 Vue.js