如何用JavaScript检测当前浏览器是无头浏览器


Posted in Javascript onApril 27, 2021

什么是无头浏览器(headless browser)?

无头浏览器是指可以在图形界面情况下运行的浏览器。我可以通过编程来控制无头浏览器自动执行各种任务,比如做测试,给网页截屏等。

为什么叫“无头”浏览器?

“无头”这个词来源于最初的“无头计算机(Headless computer)”。维基百科关于的“无头计算机”词条:

无头系统(headless system)是指已配置为无须显示器(即“头”)、键盘和鼠标操作的计算机系统或设备。无头系统通常通过网络连接控制,但也有部分无头系统的设备需要通过RS-232串行连接进行设备的管理。服务器通常采用无头模式以降低运作成本。

为什么要检测无头浏览器?

除了之前提到的两种无害的使用案例,无头浏览器可以被用来自动执行恶意任务。最常见的形式是做网络爬虫,或伪装访问量,或探测网站漏洞。

一个非常流行的无头浏览器是Phantomjs,因为它是基于 Qt框架,所以跟我们常见的浏览器相比有很多不同的特征,因此有很多方法判断出它。

但是,从chrome 59开始,谷歌发布了一款无头谷歌浏览器。它跟Phantomjs不同,它是基于正统的谷歌浏览器开发出来的,不是基于其它的框架,这让程序很难区分出它是正常浏览器还是无头浏览器。

下面,我们将介绍几种判断程序是运行在普通浏览器还是无头浏览器里的方法。

检测无头浏览器

注意:这些方法只是在四种设备 (2 Linux, 2 Mac) 里测试过,也就是说, 肯定还有其他很多方法检测无头浏览器。

User agent

先介绍使用做最常见的一种判断浏览器种类的方法,检查User agent。在linux计算机里Chrome version 59无头浏览器的User agent值是:

“Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (Khtml, like Gecko) HeadlessChrome/59.0.3071.115 Safari/537.36”

于是,我们可以这样检测是否是无头Chrome浏览器:

if (/HeadlessChrome/.test(window.navigator.userAgent)) {
  console.log("Chrome headless detected");
 }

User agent 也可以从 HTTP headers 里获取。然而,这两种情况都很容易伪造。

插件 Plugins

navigator.plugins 会返回一个数组,里面是当前浏览器里的插件信息。通常,普通Chrome浏览器有一些缺省插件,比如 Chrome PDF viewer 或 Google Native Client。相反,在无头模式里,没有任何插件,返回的是个空数组。

if(navigator.plugins.length == 0) {
  console.log("It may be Chrome headless");
}

语言

在谷歌浏览器里,有两个JavaScript属性可以获取当前浏览器的语言设置: navigator.language 和 navigator.languages。头一个是指浏览器界面的语言,后一个返回的是个数组,里面存储的是浏览器用户的所有次选语言。然而,在无头模式里,navigator.languages 返回的是个空字符串。

if(navigator.languages == "") {
  console.log("Chrome headless detected");
}

WebGL

WebGL 提供了一组能在htmlcanvas 里执行3D渲染的API。通过这些API,我们可以查询出图形驱动的 vendor 和 renderer 。

在linux上的普通谷歌浏览器里,我们获得的 renderer 和 vendor 值为: “Google SwiftShader” 和 “Google Inc.”。

而在无头模式里,我们获得的一个是 “Mesa OffScreen”——它是没有使用任何 window 系统的渲染技术的名称,和 “Brian Paul” ——开源 Mesa 图形库的最初的程序。

var canvas = document.createElement('canvas');
 var gl = canvas.getContext('webgl');
  
 var debugInfo = gl.getExtension('WEBGL_debug_renderer_info');
 var vendor = gl.getParameter(debugInfo.UNMASKED_VENDOR_WEBGL);
 var renderer = gl.getParameter(debugInfo.UNMASKED_RENDERER_WEBGL);
  
 if(vendor == "Brian Paul" && renderer == "Mesa OffScreen") {
  console.log("Chrome headless detected");
 }

并不是所有版本的无头浏览器都有同样的这两个值。然而目前在无头浏览器里是“Mesa Offscreen” 和 “Brian Paul” 这两个值

浏览器特征

Modernizr 可以探测出当前浏览器对HTML和css各种特性的支持程度。我发现,普通Chrome和无头Chrome里唯一的区别是,无头模式下没有 hairline 特征,它是用来检测是否支持 hidpi/retina hairlines的

if(!Modernizr["hairline"]) {
  console.log("It may be Chrome headless");
}

加载失败的图片

最后,我发现的最后一个方法,也是看起来最有效的方法,切入点是检查浏览器里不能正常加载的图片的高和宽。

在正常的Chrome里,未成功加载的图片的大小跟浏览器的zoom有关,但肯定不是零。而在无头Chrome浏览器里,这种图片的宽和高都是0。

var body = document.getElementsByTagName("body")[0];
var image = document.createElement("img");
image.src = "http://iloveponeydotcom32188.jg";
image.setAttribute("id", "fakeimage");
body.appendChild(image);
image.onerror = function(){
	if(image.width == 0 && image.height == 0) {
		console.log("Chrome headless detected");
	}
}

以上就是如何用JavaScript检测当前浏览器是无头浏览器的详细内容,更多关于JavaScript的资料请关注三水点靠木其它相关文章!

Javascript 相关文章推荐
提高javascript效率 一次判断,而不要次次判断
Mar 30 Javascript
Node.js node-schedule定时任务隔多少分钟执行一次的方法
Feb 10 Javascript
浅谈jQuery中height与width
Jul 06 Javascript
基于jQuery实现搜索关键字自动匹配功能
Mar 26 Javascript
详解jQuery中的DOM操作
Dec 23 Javascript
jQuery、zepto、js常用小技巧
Feb 12 Javascript
使用Browserify来实现CommonJS的浏览器加载方法
May 14 Javascript
解决vue-cli中stylus无法使用的问题方法
Jun 19 Javascript
Node.js 使用AngularJS的方法示例
May 11 Javascript
浅谈微信JS-SDK 微信分享接口开发(介绍版)
Aug 15 Javascript
vue.js实现简单购物车功能
May 30 Javascript
vue项目或网页上实现文字转换成语音播放功能
Jun 09 Javascript
如何利用js在两个html窗口间通信
Apr 27 #Javascript
如何使JavaScript休眠或等待
Apr 27 #Javascript
JavaScript 实现页面滚动动画
如何用JS实现网页瀑布流布局
分享几个JavaScript运算符的使用技巧
Apr 24 #Javascript
JavaScript 防篡改对象的用法示例
Apr 24 #Javascript
jquery插件实现悬浮的菜单
You might like
PHP动态变静态原理
2006/11/25 PHP
修改ThinkPHP缓存为Memcache的方法
2014/06/25 PHP
WordPress自定义时间显示格式
2015/03/27 PHP
laravel实现Auth认证,登录、注册后的页面回跳方法
2019/09/30 PHP
Extjs4 GridPanel 的几种样式使用介绍
2013/04/18 Javascript
window.location.href = window.location.href 跳转无反应 a超链接onclick事件写法
2013/08/21 Javascript
Javascript倒计时页面跳转实例小结
2013/09/11 Javascript
getJSON调用后台json数据时函数被调用两次的原因猜想
2013/09/29 Javascript
JavaScript中的console.time()函数详细介绍
2014/12/29 Javascript
jQuery功能函数详解
2015/02/01 Javascript
jquery心形点赞关注效果的简单实现
2016/11/14 Javascript
浅谈jquery选择器 :first与:first-child的区别
2016/11/20 Javascript
微信小程序定位当前城市的方法
2018/07/19 Javascript
react中Suspense的使用详解
2019/09/01 Javascript
JavaScript实现原型封装轮播图
2020/12/27 Javascript
Python中Iterator迭代器的使用杂谈
2016/06/20 Python
浅谈编码,解码,乱码的问题
2016/12/30 Python
tornado 多进程模式解析
2018/01/15 Python
python 实现对文件夹内的文件排序编号
2018/04/12 Python
Python利用openpyxl库遍历Sheet的实例
2018/05/03 Python
Python 爬虫之Beautiful Soup模块使用指南
2018/07/05 Python
python实战教程之自动扫雷
2018/07/13 Python
Python使用mongodb保存爬取豆瓣电影的数据过程解析
2019/08/14 Python
Pytorch反向求导更新网络参数的方法
2019/08/17 Python
Python笔记之facade模式
2019/11/20 Python
pycharm配置安装autopep8自动规范代码的实现
2021/03/02 Python
HTML5 使用 sessionStorage 进行页面传值的方法
2018/07/02 HTML / CSS
四方通行旅游网:台湾订房、出国旅游
2017/09/20 全球购物
瑞典度假品牌:OAS
2019/05/28 全球购物
SQL中where和having的区别
2012/06/17 面试题
四川internet信息高速公路(C#)笔试题
2012/02/29 面试题
介绍一下结构化程序设计方法和面向对象程序设计方法的区别
2012/06/27 面试题
毕业生求职信
2014/06/10 职场文书
财务经理岗位职责
2015/01/31 职场文书
Spring Boot两种全局配置和两种注解的操作方法
2021/06/29 Java/Android
MySQL数据库之内置函数和自定义函数 function
2022/06/16 MySQL