python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
django实现前后台交互实例
Aug 07 Python
Python中实现switch功能实例解析
Jan 11 Python
Python实现识别图片内容的方法分析
Jul 11 Python
手把手教你如何安装Pycharm(详细图文教程)
Nov 28 Python
详解Django将秒转换为xx天xx时xx分
Sep 27 Python
Python下利用BeautifulSoup解析HTML的实现
Jan 17 Python
Python的pygame安装教程详解
Feb 10 Python
解决Jupyter因卸载重装导致的问题修复
Apr 10 Python
keras自定义回调函数查看训练的loss和accuracy方式
May 23 Python
Python 没有main函数的原因
Jul 10 Python
Python pexpect模块及shell脚本except原理解析
Aug 03 Python
python爬虫搭配起Bilibili唧唧的流程分析
Dec 01 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
建立文件交换功能的脚本(三)
2006/10/09 PHP
php中substr()函数参数说明及用法实例
2014/11/15 PHP
PHP多进程编程总结(推荐)
2016/07/18 PHP
修改yii2.0用户登录使用的user表为其它的表实现方法(推荐)
2017/08/01 PHP
PHP实现的解汉诺塔问题算法示例
2018/08/06 PHP
一个符号插入器 中用到的js代码
2007/09/04 Javascript
Javascript 中文字符串处理额外注意事项
2009/11/15 Javascript
ExtJs GridPanel简单的增删改实现代码
2010/08/26 Javascript
addEventListener()第三个参数useCapture (Boolean)详细解析
2013/11/07 Javascript
js操作table示例(个人心得)
2013/11/29 Javascript
JavaScript操作XML文件之XML读取方法
2015/06/09 Javascript
vue2 中如何实现动态表单增删改查实例
2017/06/09 Javascript
Koa代理Http请求的示例代码
2018/10/10 Javascript
详解Vue、element-ui、axios实现省市区三级联动
2019/05/07 Javascript
对layui中table组件工具栏的使用详解
2019/09/19 Javascript
python判断、获取一张图片主色调的2个实例
2014/04/10 Python
一则python3的简单爬虫代码
2014/05/26 Python
Python环境下搭建属于自己的pip源的教程
2016/05/05 Python
一个Python最简单的接口自动化框架
2018/01/02 Python
在PyCharm中三步完成PyPy解释器的配置的方法
2018/10/29 Python
基于python全局设置id 自动化测试元素定位过程解析
2019/09/04 Python
python实现while循环打印星星的四种形状
2019/11/23 Python
k-means 聚类算法与Python实现代码
2020/06/01 Python
Python实现验证码识别
2020/06/15 Python
python高级特性简介
2020/08/13 Python
浅谈对python中if、elif、else的误解
2020/08/20 Python
关于HTML5 Placeholder新标签低版本浏览器下不兼容的问题分析及解决办法
2016/01/27 HTML / CSS
绢花、人造花和人造花卉:BLOOM
2019/08/07 全球购物
试述DBMS的主要功能
2016/11/13 面试题
大学生未来职业生涯规划书
2014/02/15 职场文书
老师的检讨书
2014/02/23 职场文书
2015年护士节慰问信
2015/03/23 职场文书
教导处教学工作总结
2015/08/12 职场文书
课题研究阶段性总结
2015/08/13 职场文书
Python Pandas 删除列操作
2022/03/16 Python
SpringBoot2零基础到精通之异常处理与web原生组件注入
2022/03/22 Java/Android