Node使用Selenium进行前端自动化操作的代码实现


Posted in Javascript onOctober 10, 2019

前言:

最近项目中有类似的需求:需要对前端项目中某一个用户下的产品数据进行批量的处理。手动处理的流程大概是首先登录系统,获取到当前用户下的产品列表,点击产品列表的中产品项进入详情页,对该产品进行一系列的操作,然后保存退出。因为当前有20多万条数据,手动一条一条的处理不太现实,所以希望通过写脚本的方式来进行处理。

需求分析

其实这个需求还算比较简单,需要实现的点主要有三个,一是如何进行登录,获取登录信息,查询当前用户下的产品数据;二是如何知道当前数据是否处理完,然后退出当前的处理流程;三是如何异步的处理一批数据。

所以需要做的工作就是模拟登录,调用产品列表的查询接口获取产品ID集合,然后循环遍历当前的集合,通过产品ID跳转产品详情页面,模拟页面按钮的点击操作,监听处理完成的动作,退出当前的流程。

Selenium 介绍

What is Selenium?
Selenium automates browsers. That's it! What you do with that power is entirely up to you. Primarily, it is for automating web applications for testing purposes, but is certainly not limited to just that. Boring web-based administration tasks can (and should!) be automated as well.
Selenium has the support of some of the largest browser vendors who have taken (or are taking) steps to make Selenium a native part of their browser. It is also the core technology in countless other browser automation tools, APIs and frameworks.

翻译过来大致意思就是: Selenium 可以自动化操作浏览器。怎么去使用Selenium 的功能完全取决于我们自己。它主要还是使用在web应用的自动化测试上。但是他的功能并不仅限于此。那些枯燥的基于web的管理任务也可以自动化。很多流行的浏览器都采取了一些措施来支持Selenium实现本地化。它也是很多浏览器自动化工具、API自动化以及框架的核心技术。

Selenium 主要分 Selenium WebDriver 以及 Selenium IDE。我主要结合Node来介绍 Selenium WebDriver 的安装使用。本文主要介绍Selenium 结合 Node 的安装使用。需要进行深入研究的同学请自行查看官网文档。

Node 环境搭建

1. node的安装在此不再赘述。点击链接查看官网下载安装方法。
2. express安装

$ npx express-generator

或者

$ npm install -g express-generator

创建项目:

$ express --view=ejs selenium-start
$ cd selenium-start
$ yarn

启动项目:

$ DEBUG=myapp:* yarn start

至此,Node 项目创建完毕。接下来我们就可以在项目中集成Selenium WebDriver

Selenium WebDriver 集成

1. 安装selenium-webdriver

yarn add selenium-webdriver

2. 下载安装支持不同浏览器的驱动。(此处只介绍Chrome驱动)

[ChromeDriver][3]
下载并解压文件,同时把解压的执行文件放置到 /usr/bin目录下。或者设置相应的PATH路径,确保可执行文件在PATH路径中。

开始使用

进入我们刚才创建的项目文件夹,目录如下:

Node使用Selenium进行前端自动化操作的代码实现

页面添加一个开始按钮,以及给按钮添加事件。

找到 views/index.ejs, 添加如下代码:(为了方便操作,引入了jquery, axios, 所以需要下载准备好)

Node使用Selenium进行前端自动化操作的代码实现

Node使用Selenium进行前端自动化操作的代码实现

添加对应的路由

Node使用Selenium进行前端自动化操作的代码实现

在app.js文件中,引入路由chromeDriver

var chromeDriverRouter = require('./routes/chromeDriver');
 app.use('/chromeDriver', chromeDriverRouter);

引入selenium-webdriver

在routes/chromeDirver.js文件中,我们添加了一个方法handleBaiDuDriver,这个方法用于处理模拟百度搜索自动化的一些测试。

首先我们需要在文件顶部引入selenium-webdriver

const {Builder, By, Key, until} = require('selenium-webdriver');

 // Builder: 用于创建一个WebDriver实例。
 // By: 表示通过什么方式来查找页面的元素。
   // By.className( name ) → By
   // By.css( selector ) → By
   // By.id( id ) → By
   // By.js( script, ...var_args ) → function(WebDriver): Promise
   // By.linkText( text ) → By
   // By.name( name ) → By
   // By.partialLinkText( text ) → By
 // Key: 表示键盘上一系列的按键。
 // until: 定义了一些工具类的方法。

然后书写我们的方法体里的内容。

const handleBaiDuDriver = async () => {
   let driver = await new Builder().forBrowser('chrome').build();
   try {
     await driver.get('http://www.baidu.com');
 
     await driver.findElement(By.id('kw')).sendKeys('webdriver', Key.RETURN);//正常使用
 
     await driver.findElement(By.id('su')).click();
 
     await driver.wait(until.titleIs('百度一下,你就知道'), 1000);
     
   } catch (error) {
     console.log(error)
   } finally {
     await driver.sleep(2000);
     await driver.quit();
   }
 }

启动服务,查看效果。

启动服务之后,我梦能看到如下的界面。

Node使用Selenium进行前端自动化操作的代码实现

点击页面中的【点击开始】按钮,最终能够看到如下的界面,为了演示我做了两秒的延迟。生成的gif图有9M多,无法上传。后续可以下载源码运行看效果。

Node使用Selenium进行前端自动化操作的代码实现

获取登录信息

以上是selenium-webdriver的简单集成。在之前我们提到过实际需求中如何获取登录信息的问题。在访问产品列表页面的时候需要进行登录校验。如果没有登录则会跳转界面。由于我们的登录页是通过iframe来嵌套引入的。由于暂时还没有了解如何处理iframe里的操作,所以没法去模拟用户名密码的输入。

查看API文档,WebDriver 会有一个manage方法:

this.manage() → Options

该方法会返回一个Options实例,具有如下的方法:

Node使用Selenium进行前端自动化操作的代码实现

其中有对cookie的操作方法。所以可以通过首次输入用户信息并进行缓存的方式来实现登录态的保存。在下一次再打开页面的时候直接从缓存里获取cookie信息,并通过addCookie方法进行cookie的设置。但是由于我不知道什么时候、多长时间登录才会成功,所以在获取cookie的时候需要通过不断循环的方式去获取,直到拿到cookie。当然可以设置一个超时时间。超时之后就退出当前driver。

// 缓存cookie
 async function setCookies(driver) {
   const manage = driver.manage();
   let sleepTime = 6000;
   await driver.sleep(sleepTime);
   let cookies = null
   try {
     cookies = await manage.getCookies();  
   } catch (error) {
   }
   while (!cookies || !findSessionIdFromCookies(cookies)) {
     await driver.sleep(2000)
     sleepTime += 2000;
     try {
       cookies = await manage.getCookies();
     } catch (error) {
     }
   }
   if (cookies && findSessionIdFromCookies(cookies)) {
     cache.cookies = cookies; // cache是全局用于缓存cookie的对象
     cache.cookiesStr = cache.cookies.map((cookie) => {
       return `${cookie.name}=${cookie.value}`
     }).join(';');
   }
   return cookies;
 }
 
 
 // 设置cookie
 async function initCookies(driver) {
   const cookies = cache.cookies;
   if (cookies && cookies.length > 0) {
     await driver.manage().deleteAllCookies();
     for (let i = 0 ; i < cookies.length; i++) {
       cookie = cookies[i];
       await driver.manage().addCookie(cookie);    
     };
   }
 }

获取到cookie 信息之后就可以请求产品列表以及通过产品ID进入产品详情页。然后再模拟页面按钮点击操作即可。

Github地址

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Javascript 相关文章推荐
js实现点小图看大图效果的思路及示例代码
Oct 28 Javascript
js 定时器setTimeout无法调用局部变量的解决办法
Nov 28 Javascript
Window.Open如何在同一个标签页打开
Jun 20 Javascript
js实现拖拽效果(构造函数)
Dec 14 Javascript
JavaScript数组的栈方法与队列方法详解
May 26 Javascript
概述如何实现一个简单的浏览器端js模块加载器
Dec 07 Javascript
vue基于mint-ui实现城市选择三级联动
Jun 30 Javascript
vue.js实现标签页切换效果
Jun 07 Javascript
一次微信小程序内地图的使用实战记录
Sep 09 Javascript
基于JS+HTML实现弹窗提示是否确认提交功能
Jun 17 Javascript
解决Vue中的生命周期beforeDestory不触发的问题
Jul 21 Javascript
JavaScript WeakMap使用详解
Feb 05 Javascript
Vue 开发必须知道的36个技巧(小结)
Oct 09 #Javascript
浅谈vue项目用到的mock数据接口的两种方式
Oct 09 #Javascript
Vue3.0数据响应式原理详解
Oct 09 #Javascript
Vue分页插件的前后端配置与使用
Oct 09 #Javascript
vue3修改link标签默认icon无效问题详解
Oct 09 #Javascript
将RGB值转换为灰度值的简单算法
Oct 09 #Javascript
基于Vue 撸一个指令实现拖拽功能
Oct 09 #Javascript
You might like
php使用array_rand()函数从数组中随机选择一个或多个元素
2014/04/28 PHP
smarty模板引擎中变量及变量修饰器用法实例
2015/01/22 PHP
php获取Google机器人访问足迹的方法
2015/04/15 PHP
解决windows上php xdebug 无法调试的问题
2020/02/19 PHP
PHP强制转化的形式整理
2020/05/22 PHP
深入理解JavaScript定时机制
2010/10/29 Javascript
jquery调用wcf并展示出数据的方法
2011/07/07 Javascript
window.open关于浏览器拦截问题分析及解决方法
2013/02/05 Javascript
JS延迟加载加快页面打开速度示例代码
2013/12/30 Javascript
JQuery与Ajax调用新浪API获取短网址的代码
2014/02/07 Javascript
node.js中的console.dir方法使用说明
2014/12/10 Javascript
Knockout自定义绑定创建方法
2015/12/26 Javascript
基于bootstrap实现广告轮播带图片和文字效果
2016/07/22 Javascript
利用Javascript实现BMI计算器
2016/08/16 Javascript
Node.js连接MongoDB数据库产生的问题
2017/02/08 Javascript
基于JavaScript实现复选框的全选和取消全选
2017/02/09 Javascript
javascript九宫格图片随机打乱位置的实现方法
2017/03/15 Javascript
Angular 4 指令快速入门教程
2017/06/07 Javascript
Angularjs实现页面模板清除的方法
2018/07/20 Javascript
axios使用拦截器统一处理所有的http请求的方法
2018/11/02 Javascript
Openlayers显示瓦片网格信息的方法
2020/09/28 Javascript
微信小程序实现自定义底部导航
2020/11/18 Javascript
用Python代码来绘制彭罗斯点阵的教程
2015/04/03 Python
Python的Tornado框架的异步任务与AsyncHTTPClient
2016/06/27 Python
浅谈python下tiff图像的读取和保存方法
2018/12/04 Python
从0开始的Python学习014面向对象编程(推荐)
2019/04/02 Python
通过Turtle库在Python中绘制一个鼠年福鼠
2020/02/03 Python
Python Opencv 通过轨迹(跟踪)栏实现更改整张图像的背景颜色
2020/03/09 Python
美国女性卫生用品公司:Thinx
2017/06/30 全球购物
巴西男士胡须和头发护理产品商店:Beard
2017/11/13 全球购物
宣传部部长竞选演讲稿
2014/04/26 职场文书
优秀班组长事迹
2014/05/31 职场文书
思想品德评语大全
2014/12/31 职场文书
优化经济发展环境工作总结
2015/08/11 职场文书
golang 实用库gotable的具体使用
2021/07/01 Golang
python自动化测试之Selenium详解
2022/03/13 Python