python 将html转换为pdf的几种方法


Posted in Python onDecember 29, 2020

将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的“打印”功能直接将网页打印输出为 PDF。

但是如果有多个网页就不好办了。

二进制软件

网络上存在很多将 HTML 转换为 PDF 的软件和工具。比较著名的有 Carelib、wkhtmltopdf。

whtmltopdf

wkhtmltopdf 真是一个优秀的 HTML 转换 PDF 工具。其借助 Qt 的 WebKit 渲染引擎,将 HTML 文档渲染导出为 PDF 文档或图像。

python 将html转换为pdf的几种方法

功能十分完善,但是由于使用的渲染引擎是 Qt 的 WebKit,其没法对 ES6 的 JavaScript 代码提供支持,导致一些采用 ES6 编写的 HTML 页面渲染不出实际的效果来,导致州的先生最终放弃了它。

Carelib

Carelib 是一个电子书管理软件,其中提供了各类文档的转换工具,所以可以借助其电子书转换工具来实现 HTMl 到 PDF 的转换。

这些都是用于桌面环境的二进制软件,如果要在 Python 中使用,要么使用 Popen() 方法调用这些二进制软件的命令,要么使用一些第三方的封装模块,比如:pdfkit、pypandoc 等,这些第三方模块通过集成调用上述二进制软件,封装了一些方便 Python 调用的接口。

纯 Python 库实现

上面介绍的那些 Python 第三方模块虽然可以很好的进行 HTML 到 PDF 的转换工作,但是都需要额外在计算机上安装其他的二进制软件,很多小伙伴并不喜欢这种调用方式。

不依赖于二进制软件的实现,有如下的方案:

xhtml2pdf

这是一个基于 ReportLab、html5lib、PyPDF2 等 Python 模块构建的 HTML 到 PDF 转换模块。能够很好的支持 HTML5 、CSS2.1 和部分 CSS3 语法。

因为是基于 Report Lab 模块进行的开发,其对中文的支持在某些环境下会有问题。而且由于开发人员的变更,模块的功能出现了一些断层。但是仍然是一个非常棒的 HTML 转 PDF 模块。

weasyprint

这是一个用于 HTML 和 CSS 的可视化渲染引擎,可以将 HTML 文档导出为打印标准的 PDF 文件。

xhtml2pdf 模块也曾推荐使用这个模块来进行 HTML 转换 PDF 的工作。

这个模块功能很强大、效果很出色,但是,模块的依赖项太多了:

python 将html转换为pdf的几种方法

州的先生至今没有在 Windows 电脑上安装成功过!

浏览器方案

在上述两种方案中,二进制程序的可控制性稍有不足,而纯 Python 实现的渲染解析则在功能上和依赖上不是有友好。

处理上述两种方案,我们还能采用第三种方式进行 HTMl 到 PDF 的转换。那就是借助 Web 自动化测试的浏览器内核和 Qt for Python 的 Web 引擎 来实现。

Web 自动化的浏览器内核

使用 Python 的小伙伴经常会使用 Selenium、pyppeteer 这两个 Web 自动化测试的模块来进行数据采集和 Web 自动化测试工作。

这两个模块都是用来驱动一个真实的浏览器来进行网页的操作。正是基于此,我们可以调用浏览器中打印相关的 API 接口,来实现 HTML 转 PDF 的功能。

例如,在 pyppeteer 中可以按照下面示例的方式,打开一个 HTML 文档,然后将其转换为 PDF 文档:

python 将html转换为pdf的几种方法

Qt 的 Web 引擎

在 Qt5 中,Qt 使用新的 Chromium 内核代替了老旧的 WebKit 作为 Web 的渲染引擎。使得在 Qt 中进行可以现代化的浏览器开发。

借助于 Qt 的 Python 实现(PyQt5 系列 和 PySide2 系列),我们可以直接调用 Qt 中的 Web 引擎相关的接口。

其中 QtWebEngineWidgets 子模块中的 QWebEngineView() 类提供了 printToPdf 方法供我们将网页打印为 PDF 文档,所以基于此,我们也可以使用 PyQt5 或 PySide2 进行 HTML 转换 PDF,示例如下所示:

python 将html转换为pdf的几种方法

最后

在上面,州的先生介绍了 3 种在 Python 中转换 HTML 文档为 PDF 文档的方案,每种方案都有各自的优势和不足,正确地评估自己的需求然后选择合适的方案,也能弥补其不足。

以上就是python 将html转换为pdf的几种方法的详细内容,更多关于python 将html转换为pdf的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python使用urllib2模块获取gravatar头像实例
Dec 18 Python
Python编程实现的简单神经网络算法示例
Jan 26 Python
对python插入数据库和生成插入sql的示例讲解
Nov 14 Python
Django组件cookie与session的具体使用
Jun 05 Python
Django中的FBV和CBV用法详解
Sep 15 Python
Series和DataFrame使用简单入门
Nov 13 Python
python return逻辑判断表达式实现解析
Dec 02 Python
PHP基于phpqrcode类库生成二维码过程解析
May 28 Python
基于Python3读写INI配置文件过程解析
Jul 23 Python
Python操作Word批量生成合同的实现示例
Aug 28 Python
Pycharm快捷键配置详细整理
Oct 13 Python
python scipy 稀疏矩阵的使用说明
May 26 Python
python实现ping命令小程序
Dec 28 #Python
如何用python 操作zookeeper
Dec 28 #Python
Pycharm在指定目录下生成文件和删除文件的实现
Dec 28 #Python
Python用Jira库来操作Jira
Dec 28 #Python
python性能测试工具locust的使用
Dec 28 #Python
Python+kivy BoxLayout布局示例代码详解
Dec 28 #Python
python字典与json转换的方法总结
Dec 28 #Python
You might like
详细介绍PHP应用提速面面观
2006/10/09 PHP
php实现字符串首字母转换成大写的方法
2015/03/17 PHP
PHP+mysql防止SQL注入的方法小结
2019/04/27 PHP
Thinkphp5 自定义上传文件名的实现方法
2019/07/23 PHP
在laravel5.2中实现点击用户头像更改头像的方法
2019/10/14 PHP
PHP上传图片到数据库并显示的实例代码
2019/12/20 PHP
双击滚屏-常用推荐
2006/11/29 Javascript
漂亮的提示信息(带箭头)
2007/03/21 Javascript
javascript里模拟sleep(两种实现方式)
2013/01/25 Javascript
关于backbone url请求中参数带有中文存入数据库是乱码的快速解决办法
2016/06/13 Javascript
Vue使用NProgress的操作过程解析
2019/10/10 Javascript
[01:46]2018完美盛典章节片——坚守
2018/12/17 DOTA
详解Python中的strftime()方法的使用
2015/05/22 Python
Python实现多进程共享数据的方法分析
2017/12/04 Python
python画出三角形外接圆和内切圆的方法
2018/01/25 Python
python开发之anaconda以及win7下安装gensim的方法
2019/07/05 Python
python之生产者消费者模型实现详解
2019/07/27 Python
python破解bilibili滑动验证码登录功能
2019/09/11 Python
Python中Subprocess的不同函数解析
2019/12/10 Python
JupyterNotebook 输出窗口的显示效果调整方法
2020/04/13 Python
pytorch VGG11识别cifar10数据集(训练+预测单张输入图片操作)
2020/06/24 Python
无需压缩软件,用python帮你操作压缩包
2020/08/17 Python
python中pyplot基础图标函数整理
2020/11/10 Python
CSS3 对过渡(transition)进行调速以及延时
2020/10/21 HTML / CSS
Myprotein葡萄牙官方网站:英国优质运动营养品牌
2016/09/12 全球购物
定制别致的瑜伽垫:Sugarmat
2019/06/21 全球购物
北大青鸟学生求职信
2013/09/24 职场文书
平面设计岗位职责
2013/12/14 职场文书
法院授权委托书范文
2014/08/02 职场文书
吃空饷专项整治方案
2014/10/27 职场文书
外贸业务员岗位职责
2015/02/13 职场文书
2016年校园植树节广播稿
2015/12/17 职场文书
如何用Laravel包含你自己的帮助函数
2021/05/27 PHP
SpringMVC 整合SSM框架详解
2021/08/30 Java/Android
CSS中实现动画效果-附案例
2022/02/28 HTML / CSS
Java详细解析==和equals的区别
2022/04/07 Java/Android