编程 Python

python如何实现word批量转HTML

Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX，安装方法（使用pip进行安装），命令如下：

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word（.docx）文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容，主要是出现过代码工具被网络上的人给进行贩卖，特此说了注释。

1、通过os类库，获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置：%s" % file_path)

2、通过函数进行获取数据，并对目录下文件进行判断，只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢，我们做了一个判断的操作，主要是防止文件名称上出现空格的问题，因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档，那么程序直接就跳出了，不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法，下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单，在类库中已经帮我们做好的功能，只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的，可以将获取的内容数据直接存入数据库中，在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容，更多关于python word转html的资料请关注三水点靠木其它相关文章！

python如何实现word批量转HTML

- Author -

申霖

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python连接字符串的方法小结

Jul 13 Python

详解Python网络爬虫功能的基本写法

Jan 28 Python

Python批量更改文件名的实现方法

Oct 29 Python

PyCharm代码回滚,恢复历史版本的解决方法

Oct 22 Python

浅析python的优势和不足之处

Nov 20 Python

Python Matplotlib实现三维数据的散点图绘制

Mar 19 Python

Python3将数据保存为txt文件的方法

Sep 12 Python

python 通过手机号识别出对应的微信性别(实例代码)

Dec 22 Python

Python SSL证书验证问题解决方案

Jan 13 Python

基于virtualenv创建python虚拟环境过程图解

Mar 30 Python

如何将PySpark导入Python的放实现(2种)

Apr 26 Python

python数字图像处理数据类型及颜色空间转换

Jun 28 Python

Python识别验证码的实现示例

Sep 30 #Python

Python列表嵌套常见坑点及解决方案

Sep 30 #Python

python实现感知机模型的示例

Sep 30 #Python

python 实现关联规则算法Apriori的示例

Sep 30 #Python

Python之字典添加元素的几种方法

Sep 30 #Python

Python之字典对象的几种创建方法

Sep 30 #Python

python 实现朴素贝叶斯算法的示例

Sep 30 #Python

You might like

用PHP函数解决SQL injection

2006/10/09 PHP

在字符串中把网址改成超级链接

2006/10/09 PHP

PHP自定义函数收代码

2010/08/01 PHP

基于PHP5魔术常量与魔术方法的详解

2013/06/13 PHP

PHP中spl_autoload_register函数的用法总结

2013/11/07 PHP

thinkphp连贯操作实例分析

2014/11/22 PHP

Javascript技术技巧大全（五）

2007/01/22 Javascript

修改jQuery.Autocomplete插件支持中文输入法避免TAB、ENTER键失效、导致表单提交

2009/10/11 Javascript

javascript实现的使用方向键控制光标在table单元格中切换

2010/11/17 Javascript

jQuery动态添加 input type=file的实现代码

2012/06/14 Javascript

JS图片预加载 JS实现图片预加载应用

2012/12/03 Javascript

jquery 定位input元素的几种方法小结

2013/07/28 Javascript

jquery选择符快速提取web表单数据示例

2014/03/27 Javascript

对JavaScript的全文搜索实现相关度评分的功能的方法

2015/06/24 Javascript

浅谈window对象的scrollBy()方法

2015/07/15 Javascript

详解JavaScript中jQuery和Ajax以及JSONP的联合使用

2015/08/13 Javascript

javascript 动态修改css样式方法汇总(四种方法)

2015/08/27 Javascript

javascript实现下雪效果【实例代码】

2016/05/03 Javascript

EasyUI Tree树组件无限循环的解决方法

2017/09/27 Javascript

Vue cli3 库模式搭建组件库并发布到 npm的流程

2018/10/12 Javascript

vue实现中部导航栏布局功能

2019/07/30 Javascript

Angular 多模块项目构建过程

2020/02/13 Javascript

[31:33]2014 DOTA2国际邀请赛中国区预选赛 TongFu VS DT 第一场

2014/05/23 DOTA

[54:30]Liquid vs Newbee 2019国际邀请赛小组赛 BO2 第二场 8.15

2019/08/16 DOTA

Python向Excel中插入图片的简单实现方法

2018/04/24 Python

详解tensorflow载入数据的三种方式

2018/04/24 Python

Python中print和return的作用及区别解析

2019/05/05 Python

python sklearn库实现简单逻辑回归的实例代码

2019/07/01 Python

HTML5新增form控件和表单属性实例代码详解

2019/05/15 HTML / CSS

蔻驰西班牙官网：COACH西班牙

2019/01/16 全球购物

英国旅行箱包和行李箱购物网站：Travel Luggage & Cabin Bags

2019/08/26 全球购物

adidas泰国官网：adidas TH

2020/07/11 全球购物

意大利和国际奢侈品牌购物网站：Suitnegozi.com

2021/01/15 全球购物

优秀本科毕业生自荐信

2014/07/04 职场文书

经典导游欢迎词

2015/01/26 职场文书

Redis集群新增、删除节点以及动态增加内存的方法

2021/09/04 Redis