node puppeteer(headless chrome)实现网站登录


Posted in Javascript onMay 09, 2018

puppeteer简介

puppeteer是Chrome团队开发的一个node库,可以通过api来控制浏览器的行为,比如点击,跳转,刷新,在控制台执行js脚本等等。有了这个神器,写个爬虫,自动签到,网页截图,生成pdf,自动化测试什么的,都不在话下。

puppeteer的简单例子

代码来自官网:

const puppeteer = require('puppeteer');
 
(async () => {
 const browser = await puppeteer.launch();//打开浏览器
 const page = await browser.newPage();//打开一个空白页
 await page.goto('https://example.com');//在地址栏输入网址并等待加载
 await page.screenshot({path: 'example.png'});//截个图
 
 await browser.close();//关掉浏览器
})();

阅读上述代码,我们可以发现,1,代码中每一步都是异步操作,2,每一步操作都对应实际使用浏览器的一个行为。理解这两点对使用这个库有很大帮助。另外,比较常用的两个对象就是browser和page对象,对象上有一堆用来操作两个对象的方法。接下来,我们就写一个登录网站的小demo。

没有验证码的网站

对于没有验证码的网站,基本上就是输入账号,输入密码,点击登录这三步,需要用到page对象的两个方法:type用来在输入框中输入信息,click用来点击登录。下面以登录豆瓣为例来举个例子:

const puppeteer = require('puppeteer');
const account = `123456@qq.com`;
const password = `123456`;
(async () => {
 const browser = await puppeteer.launch();//打开浏览器
 const page = await browser.newPage();//打开一个空白页
 await page.goto('https://www.douban.com/');//打开豆瓣网站
 await page.type('#form_email', account);  
 await page.type('#form_password', password);
 await page.click('.bn-submit');
 await page.waitForNavigation({
  waitUntil: 'load'
 });//等待页面加载出来,等同于window.onload
 await page.screenshot({path: 'example.png'});//截个图
 await browser.close();//关掉浏览器
})();

有人说,我怎么知道到底有没有登录成功呢,一种调试的办法就是使用screenshot,如果你看到的是一个验证码页面,说明没有登录成功,还有一种办法像下面这样:

const browser = await puppeteer.launch({headless: false});//打开有界面的浏览器

传入headless:false后会真的打开一个浏览器的界面,这样你就可以实时看到代码执行到什么地方了。接下来我们说说碰到验证码时怎么办。

有验证码的网站

node puppeteer(headless chrome)实现网站登录

碰到有验证码的网站,可以将headless设成false,借助界面输入验证码,同时监听页面加载事件,实现登录,代码如下:

...

 await page.waitForNavigation({
  waitUntil: 'load'
 });//等待页面加载出来,等同于window.onload


//代码中监听跳转事件
if(page.url() === 'https://www.douban.com/accounts/login'){ 
   //登录不成功
  console.log('需要输入验证码');
  //等待再一次跳转
  while(true){
    await page.waitForNavigation({
      waitUntil: 'load'
    })
    console.log(page.url())
    if(page.url() === 'https://www.douban.com/'){
      console.log('登录成功');
      break;
    }
  }
 }

整体思路就是写也个循环,不断监听页面跳转,直到浏览器登录成功后跳转到首页为止。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Javascript 相关文章推荐
jQuery选择器中含有空格的使用示例及注意事项
Aug 25 Javascript
javascript自定义函数参数传递为字符串格式
Jul 29 Javascript
JavaScript中的标签语句用法分析
Feb 10 Javascript
js实现鼠标划过给div加透明度的方法
May 25 Javascript
JS遍历页面所有对象属性及实现方法
Aug 01 Javascript
浅谈vue中使用图片懒加载vue-lazyload插件详细指南
Oct 23 Javascript
Vue组件的使用教程详解
Jan 05 Javascript
Vue插件从封装到发布的完整步骤记录
Feb 28 Javascript
vue.js实现数据库的JSON数据输出渲染到html页面功能示例
Aug 03 Javascript
create-react-app中添加less支持的实现
Nov 15 Javascript
环形加载进度条封装(Vue插件版和原生js版)
Dec 04 Javascript
jQuery实现全选、反选和不选功能的方法详解
Dec 04 jQuery
JS中移除非数字最多保留一位小数
May 09 #Javascript
JS关于刷新页面的相关总结
May 09 #Javascript
Vue引入jquery实现平滑滚动到指定位置
May 09 #jQuery
webstorm中vue语法的支持详解
May 09 #Javascript
JavaScript DOM元素常见操作详解【添加、删除、修改等】
May 09 #Javascript
Vue中使用vee-validate表单验证的方法
May 09 #Javascript
VeeValidate在vue项目里表单校验应用案例
May 09 #Javascript
You might like
刷新PHP缓冲区为你的站点加速
2015/10/10 PHP
php数据库的增删改查 php与javascript之间的交互
2017/08/31 PHP
你的编程语言可以这样做吗?
2006/09/07 Javascript
JS 参数传递的实际应用代码分析
2009/09/13 Javascript
js function定义函数使用心得
2010/04/15 Javascript
jQuery LigerUI 使用教程表格篇(1)
2012/01/18 Javascript
JavaScript程序员应该知道的45个实用技巧
2014/03/04 Javascript
Jquery解析Json格式数据过程代码
2014/10/17 Javascript
jquery树形菜单效果的简单实例
2016/06/06 Javascript
js的各种排序算法实现(总结)
2016/07/23 Javascript
js 原型对象和原型链理解
2017/02/09 Javascript
JS检测数组类型的方法小结
2017/03/14 Javascript
Vue中在新窗口打开页面及Vue-router的使用
2018/06/13 Javascript
基于jQuery使用Ajax动态执行模糊查询功能
2018/07/05 jQuery
在vue项目中正确使用iconfont的方法
2018/09/28 Javascript
node app 打包工具pkg的具体使用
2019/01/17 Javascript
JavaScript使用面向对象实现的拖拽功能详解
2019/06/12 Javascript
JavaScript编写开发动态时钟
2020/07/29 Javascript
JQuery Ajax如何实现注册检测用户名
2020/09/25 jQuery
[01:01:35]Optic vs paiN 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
Python编程实现控制cmd命令行显示颜色的方法示例
2017/08/14 Python
python登录并爬取淘宝信息代码示例
2017/12/09 Python
Python编写Windows Service服务程序
2018/01/04 Python
python装饰器深入学习
2018/04/06 Python
对pandas replace函数的使用方法小结
2018/05/18 Python
Python 中 -m 的典型用法、原理解析与发展演变
2019/11/11 Python
python利用datetime模块计算程序运行时间问题
2020/02/20 Python
深入浅析Python 命令行模块 Click
2020/03/11 Python
python安装后的目录在哪里
2020/06/21 Python
美国伊甸园兄弟种子公司:Eden Brothers
2018/07/01 全球购物
法学个人求职信范文
2014/01/27 职场文书
会计岗位说明书
2014/07/29 职场文书
2014年银行员工工作总结
2014/11/12 职场文书
2014年个人思想工作总结
2014/11/27 职场文书
教学质量月活动总结
2015/05/11 职场文书
安全知识竞赛主持词
2015/06/30 职场文书