python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python连接字符串的方法小结
Jul 13 Python
详解Python网络爬虫功能的基本写法
Jan 28 Python
Python批量更改文件名的实现方法
Oct 29 Python
PyCharm代码回滚,恢复历史版本的解决方法
Oct 22 Python
浅析python的优势和不足之处
Nov 20 Python
Python Matplotlib实现三维数据的散点图绘制
Mar 19 Python
Python3将数据保存为txt文件的方法
Sep 12 Python
python 通过手机号识别出对应的微信性别(实例代码)
Dec 22 Python
Python SSL证书验证问题解决方案
Jan 13 Python
基于virtualenv创建python虚拟环境过程图解
Mar 30 Python
如何将PySpark导入Python的放实现(2种)
Apr 26 Python
python数字图像处理数据类型及颜色空间转换
Jun 28 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
用PHP函数解决SQL injection
2006/10/09 PHP
在字符串中把网址改成超级链接
2006/10/09 PHP
PHP自定义函数收代码
2010/08/01 PHP
基于PHP5魔术常量与魔术方法的详解
2013/06/13 PHP
PHP中spl_autoload_register函数的用法总结
2013/11/07 PHP
thinkphp连贯操作实例分析
2014/11/22 PHP
Javascript技术技巧大全(五)
2007/01/22 Javascript
修改jQuery.Autocomplete插件 支持中文输入法 避免TAB、ENTER键失效、导致表单提交
2009/10/11 Javascript
javascript实现的使用方向键控制光标在table单元格中切换
2010/11/17 Javascript
jQuery动态添加 input type=file的实现代码
2012/06/14 Javascript
JS图片预加载 JS实现图片预加载应用
2012/12/03 Javascript
jquery 定位input元素的几种方法小结
2013/07/28 Javascript
jquery选择符快速提取web表单数据示例
2014/03/27 Javascript
对JavaScript的全文搜索实现相关度评分的功能的方法
2015/06/24 Javascript
浅谈window对象的scrollBy()方法
2015/07/15 Javascript
详解JavaScript中jQuery和Ajax以及JSONP的联合使用
2015/08/13 Javascript
javascript 动态修改css样式方法汇总(四种方法)
2015/08/27 Javascript
javascript实现下雪效果【实例代码】
2016/05/03 Javascript
EasyUI Tree树组件无限循环的解决方法
2017/09/27 Javascript
Vue cli3 库模式搭建组件库并发布到 npm的流程
2018/10/12 Javascript
vue实现中部导航栏布局功能
2019/07/30 Javascript
Angular 多模块项目构建过程
2020/02/13 Javascript
[31:33]2014 DOTA2国际邀请赛中国区预选赛 TongFu VS DT 第一场
2014/05/23 DOTA
[54:30]Liquid vs Newbee 2019国际邀请赛小组赛 BO2 第二场 8.15
2019/08/16 DOTA
Python向Excel中插入图片的简单实现方法
2018/04/24 Python
详解tensorflow载入数据的三种方式
2018/04/24 Python
Python中print和return的作用及区别解析
2019/05/05 Python
python sklearn库实现简单逻辑回归的实例代码
2019/07/01 Python
HTML5新增form控件和表单属性实例代码详解
2019/05/15 HTML / CSS
蔻驰西班牙官网:COACH西班牙
2019/01/16 全球购物
英国旅行箱包和行李箱购物网站:Travel Luggage & Cabin Bags
2019/08/26 全球购物
adidas泰国官网:adidas TH
2020/07/11 全球购物
意大利和国际奢侈品牌购物网站:Suitnegozi.com
2021/01/15 全球购物
优秀本科毕业生自荐信
2014/07/04 职场文书
经典导游欢迎词
2015/01/26 职场文书
Redis集群新增、删除节点以及动态增加内存的方法
2021/09/04 Redis