Python 实现网页自动截图的示例讲解


Posted in Python onMay 17, 2018

背景介绍

最近在为部门编写一个自动化测试工具,工具涉及到一个功能,即 将自动化测试生成的html报告截图,作为邮件正文,html文件上传到web服务器以链接形式添加到邮件中,最后发送邮件。

任务难点

之前从未接触过页面自动截图相关的方面,因此如何自动进行页面截图成为本地调研方向。

方案思考

在刚接到这个任务时,并不认同目前的方案。曾经一度认为,将html报告的内容写入邮件正文,即可通过html的形式发送邮件了。经过尝试后发现,邮件不支持带javascript的html。因此,选择了预览html并自动截图的方案。

编程语言

python 2.7

使用方案 :

selenium + phantomjs

方案介绍

实现自动预览html并截图有以下几个步骤:

1. 浏览器打开html

2. 对浏览器页面进行截图

3. 将截图保存到指定位置

最初,笔者使用了这个实现方案:

(1).使用webbrowser 库打开默认浏览器,显示url

Python 实现网页自动截图的示例讲解

(2).使用PIL.ImageGrab库的对屏幕进行进行截图

Python 实现网页自动截图的示例讲解

到此为止,笔者已经获得html的预览截图,一切似乎很顺利,但接下来

发现了以下几个问题:

(1).打开默认浏览器时,默认浏览器是什么,浏览器处于什么状态都不知晓。

(2).浏览器显示html,会有一个显示的打开浏览器,浏览器打开html的动作出现,如果用户此时产生了其他动作,必定会对之后的截图产生影响。

(3).屏幕截图,将整个屏幕都进行截图,截图中除了html页面正文,同时也包含了浏览器等当前屏幕包含的所有元素,暴漏了用户隐私。

(4).如果页面较大,页面会产生上下翻页的效果,屏幕截图无法应对此种页面,截图看到的报告只有一部分。

基于上述问题,笔者放弃了这个看起来简单有效的方案。从而

对方案挖掘了一些深层需求:

(1).打开浏览器必须隐式调用,用户无法看到工具在做什么,从而不会通过误操作对工具产生影响。

(2).截图必须针对浏览器页面正文 ,保证无其他冗余信息,且截到页面全图根据这些需求,笔者经过一系列尝试终于发现了selenium + phantomjs。

python selenium : 是python对浏览器自动化测试框架selenium的扩展,selenium库支持了selenium所包含大部分功能。

phantomjs : 是一个无界面的,可脚本编程的webkit浏览器,python selenium同样提供对phantomjs的支持。

接下来一切就很容易了:

(1).安装python selenium 库,推荐使用pip快速安装最新版本

(2).下载phantomjs.exe,将其添加到环境变量 path 中 。方便起见可以直接放在python的安装目录根目录下

(3).编写测试代码

Python 实现网页自动截图的示例讲解

简单讲解一下代码:

fromselenium importwebdriver     #从selenium库导入webdirver

brower=webdriver.PhantomJS()    #使用webdirver.PhantomJS()方法新建一个phantomjs的对象,这里会使用到phantomjs.exe,环境变量path中找不到phantomjs.exe,则会报错

brower.get(url)           #使用get()方法,打开指定页面。注意这里是phantomjs是无界面的,所以不会有任何页面显示

brower.maximize_window()      #设置phantomjs浏览器全屏显示

brower.save_screenshot(picName)   #使用save_screenshot将浏览器正文部分截图,即使正文本分无法一页显示完全,save_screenshot也可以完全截图

brower.close()           #关闭phantomjs浏览器,不要忽略了这一步,否则你会在任务浏览器中发现许多phantomjs进程

执行了上述代码后,我们看一下截图效果吧:

Python 实现网页自动截图的示例讲解

以上这篇Python 实现网页自动截图的示例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python科学计算环境推荐——Anaconda
Jun 30 Python
Python实现Linux下守护进程的编写方法
Aug 22 Python
分析在Python中何种情况下需要使用断言
Apr 01 Python
python创建和删除目录的方法
Apr 29 Python
Python 专题二 条件语句和循环语句的基础知识
Mar 19 Python
Python格式化输出%s和%d
May 07 Python
python list转矩阵的实例讲解
Aug 04 Python
Python DataFrame.groupby()聚合函数,分组级运算
Sep 18 Python
Python切片操作去除字符串首尾的空格
Apr 22 Python
Python自动化操作实现图例绘制
Jul 09 Python
使用Python pip怎么升级pip
Aug 11 Python
python中print格式化输出的问题
Apr 16 Python
Python操作Sql Server 2008数据库的方法详解
May 17 #Python
Python读写及备份oracle数据库操作示例
May 17 #Python
Python selenium抓取微博内容的示例代码
May 17 #Python
Python实现的查询mysql数据库并通过邮件发送信息功能
May 17 #Python
Python实现读取txt文件并转换为excel的方法示例
May 17 #Python
cmd运行python文件时对结果进行保存的方法
May 16 #Python
Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
May 16 #Python
You might like
一些关于PHP的知识
2006/11/17 PHP
php Session存储到Redis的方法
2013/11/04 PHP
ThinkPHP模板判断输出Defined标签用法详解
2014/06/30 PHP
php+mysql删除指定编号员工信息的方法
2015/01/14 PHP
Yii中实现处理前后台登录的新方法
2015/12/28 PHP
Yii2 加载css、js 载静态资源的方法
2017/03/10 PHP
php使用curl实现ftp文件下载功能
2017/05/16 PHP
imgAreaSelect 中文文档帮助说明
2011/10/08 Javascript
JS 模态对话框和非模态对话框操作技巧汇总
2013/04/15 Javascript
解析javascript 数组以及json元素的添加删除
2013/06/26 Javascript
简单时间提示DEMO从0开始一直进行计时
2013/11/19 Javascript
JavaScript初学者建议:不要去管浏览器兼容
2014/02/04 Javascript
jQuery插件slicebox实现3D动画图片轮播切换特效
2015/04/12 Javascript
禁止按回车键提交表单的方法
2015/06/11 Javascript
jQuery实现可兼容IE6的淡入淡出效果告警提示功能示例
2017/09/20 jQuery
python爬取安居客二手房网站数据(实例讲解)
2017/10/19 Javascript
vue项目添加多页面配置的步骤详解
2019/05/22 Javascript
如何使用JS console.log()技巧提高工作效率
2020/10/14 Javascript
python执行get提交的方法
2015/04/29 Python
Python面向对象类的继承实例详解
2018/06/27 Python
Python中文编码知识点
2019/02/18 Python
python判断自身是否正在运行的方法
2019/08/08 Python
Numpy中对向量、矩阵的使用详解
2019/10/29 Python
在Python中使用MySQL--PyMySQL的基本使用方法
2019/11/19 Python
python的json包位置及用法总结
2020/06/21 Python
Python logging模块进行封装实现原理解析
2020/08/07 Python
基于Python爬取搜狐证券股票过程解析
2020/11/18 Python
美国孕妇装品牌:Destination Maternity
2018/02/04 全球购物
Sunglasses Shop瑞典:欧洲领先的太阳镜网上商店
2018/04/22 全球购物
澳大利亚家庭花园和DIY工具网店:VidaXL
2019/05/03 全球购物
五水共治一句话承诺
2014/05/30 职场文书
院党委组织查摆问题对照检查材料思想汇报2014
2014/10/08 职场文书
警察正风肃纪剖析材料
2014/10/16 职场文书
Python极值整数的边界探讨分析
2021/09/15 Python
「海贼王」112.9万粉丝纪念图标公布
2022/03/21 日漫
nginx location 带斜杠【 / 】与不带的区别
2022/04/13 Servers