python 将html转换为pdf的几种方法


Posted in Python onDecember 29, 2020

将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的“打印”功能直接将网页打印输出为 PDF。

但是如果有多个网页就不好办了。

二进制软件

网络上存在很多将 HTML 转换为 PDF 的软件和工具。比较著名的有 Carelib、wkhtmltopdf。

whtmltopdf

wkhtmltopdf 真是一个优秀的 HTML 转换 PDF 工具。其借助 Qt 的 WebKit 渲染引擎,将 HTML 文档渲染导出为 PDF 文档或图像。

python 将html转换为pdf的几种方法

功能十分完善,但是由于使用的渲染引擎是 Qt 的 WebKit,其没法对 ES6 的 JavaScript 代码提供支持,导致一些采用 ES6 编写的 HTML 页面渲染不出实际的效果来,导致州的先生最终放弃了它。

Carelib

Carelib 是一个电子书管理软件,其中提供了各类文档的转换工具,所以可以借助其电子书转换工具来实现 HTMl 到 PDF 的转换。

这些都是用于桌面环境的二进制软件,如果要在 Python 中使用,要么使用 Popen() 方法调用这些二进制软件的命令,要么使用一些第三方的封装模块,比如:pdfkit、pypandoc 等,这些第三方模块通过集成调用上述二进制软件,封装了一些方便 Python 调用的接口。

纯 Python 库实现

上面介绍的那些 Python 第三方模块虽然可以很好的进行 HTML 到 PDF 的转换工作,但是都需要额外在计算机上安装其他的二进制软件,很多小伙伴并不喜欢这种调用方式。

不依赖于二进制软件的实现,有如下的方案:

xhtml2pdf

这是一个基于 ReportLab、html5lib、PyPDF2 等 Python 模块构建的 HTML 到 PDF 转换模块。能够很好的支持 HTML5 、CSS2.1 和部分 CSS3 语法。

因为是基于 Report Lab 模块进行的开发,其对中文的支持在某些环境下会有问题。而且由于开发人员的变更,模块的功能出现了一些断层。但是仍然是一个非常棒的 HTML 转 PDF 模块。

weasyprint

这是一个用于 HTML 和 CSS 的可视化渲染引擎,可以将 HTML 文档导出为打印标准的 PDF 文件。

xhtml2pdf 模块也曾推荐使用这个模块来进行 HTML 转换 PDF 的工作。

这个模块功能很强大、效果很出色,但是,模块的依赖项太多了:

python 将html转换为pdf的几种方法

州的先生至今没有在 Windows 电脑上安装成功过!

浏览器方案

在上述两种方案中,二进制程序的可控制性稍有不足,而纯 Python 实现的渲染解析则在功能上和依赖上不是有友好。

处理上述两种方案,我们还能采用第三种方式进行 HTMl 到 PDF 的转换。那就是借助 Web 自动化测试的浏览器内核和 Qt for Python 的 Web 引擎 来实现。

Web 自动化的浏览器内核

使用 Python 的小伙伴经常会使用 Selenium、pyppeteer 这两个 Web 自动化测试的模块来进行数据采集和 Web 自动化测试工作。

这两个模块都是用来驱动一个真实的浏览器来进行网页的操作。正是基于此,我们可以调用浏览器中打印相关的 API 接口,来实现 HTML 转 PDF 的功能。

例如,在 pyppeteer 中可以按照下面示例的方式,打开一个 HTML 文档,然后将其转换为 PDF 文档:

python 将html转换为pdf的几种方法

Qt 的 Web 引擎

在 Qt5 中,Qt 使用新的 Chromium 内核代替了老旧的 WebKit 作为 Web 的渲染引擎。使得在 Qt 中进行可以现代化的浏览器开发。

借助于 Qt 的 Python 实现(PyQt5 系列 和 PySide2 系列),我们可以直接调用 Qt 中的 Web 引擎相关的接口。

其中 QtWebEngineWidgets 子模块中的 QWebEngineView() 类提供了 printToPdf 方法供我们将网页打印为 PDF 文档,所以基于此,我们也可以使用 PyQt5 或 PySide2 进行 HTML 转换 PDF,示例如下所示:

python 将html转换为pdf的几种方法

最后

在上面,州的先生介绍了 3 种在 Python 中转换 HTML 文档为 PDF 文档的方案,每种方案都有各自的优势和不足,正确地评估自己的需求然后选择合适的方案,也能弥补其不足。

以上就是python 将html转换为pdf的几种方法的详细内容,更多关于python 将html转换为pdf的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
对于Python编程中一些重用与缩减的建议
Apr 14 Python
Django中利用filter与simple_tag为前端自定义函数的实现方法
Jun 15 Python
python字典DICT类型合并详解
Aug 17 Python
Python内建函数之raw_input()与input()代码解析
Oct 26 Python
pycharm运行和调试不显示结果的解决方法
Nov 30 Python
Django框架实现的分页demo示例
May 25 Python
python连接、操作mongodb数据库的方法实例详解
Sep 11 Python
python实现提取str字符串/json中多级目录下的某个值
Feb 27 Python
python中读入二维csv格式的表格方法详解(以元组/列表形式表示)
Apr 24 Python
python中os.path.join()函数实例用法
May 26 Python
怎么用Python识别手势数字
Jun 07 Python
Python创建SQL数据库流程逐步讲解
Sep 23 Python
python实现ping命令小程序
Dec 28 #Python
如何用python 操作zookeeper
Dec 28 #Python
Pycharm在指定目录下生成文件和删除文件的实现
Dec 28 #Python
Python用Jira库来操作Jira
Dec 28 #Python
python性能测试工具locust的使用
Dec 28 #Python
Python+kivy BoxLayout布局示例代码详解
Dec 28 #Python
python字典与json转换的方法总结
Dec 28 #Python
You might like
php中通过curl检测页面是否被百度收录
2013/09/27 PHP
Win7下手动安装apache2.2、php5.4笔记
2015/04/03 PHP
PHP中each与list用法分析
2016/01/08 PHP
thinkPHP框架RBAC实现原理分析
2019/02/01 PHP
Laravel框架实现的使用smtp发送邮件功能示例
2019/03/12 PHP
javascript attachEvent和addEventListener使用方法
2009/03/19 Javascript
JavaScript prototype属性使用说明
2010/05/13 Javascript
JS 如果改变span标签的是否隐藏属性
2011/10/06 Javascript
Get中文乱码IE浏览器Get中文乱码解决方案
2013/12/26 Javascript
了不起的node.js读书笔记之例程分析
2014/12/22 Javascript
jQuery实现仿微软首页感应鼠标变化滑动窗口效果
2015/10/08 Javascript
详解JavaScript基于面向对象之继承实例
2015/12/16 Javascript
JavaScript中实现键值对应的字典与哈希表结构的示例
2016/06/12 Javascript
在微信小程序中渲染HTML内容的方法示例
2018/09/28 Javascript
JavaScript ES 模块的使用
2020/11/12 Javascript
Python数据库的连接实现方法与注意事项
2016/02/27 Python
Python简单遍历字典及删除元素的方法
2016/09/18 Python
python实现BackPropagation算法
2017/12/14 Python
python3 读写文件换行符的方法
2018/04/09 Python
Python 中导入csv数据的三种方法
2018/11/01 Python
在tensorflow中设置使用某一块GPU、多GPU、CPU的操作
2020/02/07 Python
详解移动端Html5页面中1px边框的几种解决方法
2018/07/24 HTML / CSS
卡塔尔航空官方网站:Qatar Airways
2017/02/08 全球购物
金牌葡萄酒俱乐部:Gold Medal Wine Club
2017/11/02 全球购物
美国在线乐器和设备商店:Musician’s Friend
2018/07/06 全球购物
英国户外服装、鞋类和设备的领先零售商:Millets
2020/10/12 全球购物
作为网站管理者应当如何防范XSS
2014/08/16 面试题
农田水利实习自我鉴定
2013/09/19 职场文书
群众路线教育查摆剖析材料
2014/10/10 职场文书
繁星春水读书笔记
2015/06/30 职场文书
小学英语教学经验交流材料
2015/11/02 职场文书
倡议书怎么写?
2019/04/11 职场文书
python的列表生成式,生成器和generator对象你了解吗
2022/03/16 Python
国产动画《万圣街》日语配音版制作决定!
2022/03/20 国漫
Mysql中mvcc各场景理解应用
2022/08/05 MySQL
TS 类型收窄教程示例详解
2022/09/23 Javascript