通过V8源码看一个关于JS数组排序的诡异问题


Posted in Javascript onAugust 14, 2017

前言

前几天一个朋友在微信里面问我一个关于 JS 数组排序的问题。通过该问题发现了一些之前没发现的内容,下面话不多少了,来一起看看详细的介绍吧。

原始数组如下:

var data = [
 {value: 4}, 
 {value: 2}, 
 {value: undefined}, 
 {value: undefined}, 
 {value: 1}, 
 {value: undefined}, 
 {value: undefined}, 
 {value: 7}, 
 {value: undefined}, 
 {value: 4}
];

data 是个数组,数组的每一项都是一个拥有 value 作为 key 的对象,值为数字或者 undefined。

data
 .sort((x, y) => x.value - y.value)
 .map(x => x.value);

对数组的 value 进行排序,然后把排完序的数组进行 flat 处理。得到的结果如下:

[2, 4, undefined, undefined, 1, undefined, undefined, 7, undefined, 4]

显然这没有达到我们的目的。

现在我们修改一下排序,挑战一下函数的调用顺序:先对数组进行扁平化(flat)处理,然后再排序。

data
 .map(x => x.value)
 .sort((x, y) => x - y)

这时我们得到的结果和之前截然不同:

[1, 2, 4, 4, 7, undefined, undefined, undefined, undefined, undefined]

遇到这种情况第一感觉肯定是要去看看 ECMA 规范,万一是 JS 引擎的 bug 呢。

在 ES6 规范 22.1.3.24 节写道:

Calling comparefn(a,b) always returns the same value v when given a specific pair of values a and b as its two arguments. Furthermore, Type(v) is Number, and v is not NaN. Note that this implies that exactly one of a < b, a = b, and a > b will be true for a given pair of a and b.

简单翻译一下就是:第二个参数 comparefn 返回一个数字,并且不是 NaN。一个注意事项是,对于参与比较的两个数 a 小于 b、a 等于 b、a 大于 b 这三种情况必须有一个为 true。

所以严格意义上来说,这段代码是有 bug 的,因为比较的结果出现了 NaN。

在 MDN 文档上还有一个细节:

如果 comparefn(a, b) 等于 0, a 和 b 的相对位置不变。备注:ECMAScript 标准并不保证这一行为,而且也不是所有浏览器都会遵守。

翻译成编程术语就是:sort 排序算法是不稳定排序。

其实我们最疑惑的问题上,上面两行代码为什么会输出不同的结果。我们只能通过查看 V8 源码去找答案了。

V8 对数组排序是这样进行的:

如果没有定义 comparefn 参数,则生成一个(高能预警,有坑啊):

comparefn = function (x, y) {
 if (x === y) return 0;
 if (%_IsSmi(x) && %_IsSmi(y)) {
 return %SmiLexicographicCompare(x, y);
 }
 x = TO_STRING(x); // <----- 坑
 y = TO_STRING(y); // <----- 坑
 if (x == y) return 0;
 else return x < y ? -1 : 1;
};

然后定义了一个插入排序算法:

function InsertionSort(a, from, to) {
 for (var i = from + 1; i < to; i++) {
 var element = a[i];
 for (var j = i - 1; j >= from; j--) {
  var tmp = a[j];
  var order = comparefn(tmp, element);
  if (order > 0) { // <---- 注意这里
  a[j + 1] = tmp;
  } else {
  break;
  }
 }
 a[j + 1] = element;
}

为什么是插入排序?V8 为了性能考虑,当数组元素个数少于 10 个时,使用插入排序;大于 10 个时使用快速排序。

后面还定义了快速排序函数和其它几个函数,我就不一一列出了。

函数都定义完成后,开始正式的排序操作:

// %RemoveArrayHoles returns -1 if fast removal is not supported.
var num_non_undefined = %RemoveArrayHoles(array, length);

if (num_non_undefined == -1) {
 // There were indexed accessors in the array.
 // Move array holes and undefineds to the end using a Javascript function
 // that is safe in the presence of accessors.
 num_non_undefined = SafeRemoveArrayHoles(array);
}

中间的注释:Move array holes and undefineds to the end using a Javascript function。排序之前会把数组里面的 undefined 移动到最后。因此第二个排序算法会把 undefined 移动到最后,然后对剩余的数据 [4,2,1,7,4] 进行排序。

而在第一种写法时,数组的每一项都是一个 Object,然后最 Object 调用 x.value - y.value 进行计算,当 undefined 参与运算时比较的结果是 NaN。

当返回 NaN 时 V8 怎么处理的呢?我前面标注过,再贴一次:

var order = comparefn(tmp, element);
if (order > 0) { // <---- 这里
 a[j + 1] = tmp;
} else {
 break;
}

NaN > 0 为 false,执行了 else 分支代码。

思考题,以下代码的结果:

[1, 23, 2, 3].sort()

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
js 字符串转化成数字的代码
Jun 29 Javascript
Document.location.href和.replace的区别示例介绍
Mar 04 Javascript
引入autocomplete组件时JS报未结束字符串常量错误
Mar 19 Javascript
JS实现的竖向折叠菜单代码
Oct 21 Javascript
JS触摸事件、手势事件详解
May 04 Javascript
JavaScript实现购物车基本功能
Jul 21 Javascript
Three.js如何用轨迹球插件(trackball)增加对模型的交互功能详解
Sep 25 Javascript
vue结合element-ui使用示例
Jan 24 Javascript
深入浅析ng-bootstrap 组件集中 tabset 组件的实现分析
Jul 19 Javascript
JavaScript中的null和undefined用法解析
Sep 30 Javascript
Vue的props父传子的示例代码
May 20 Javascript
ant design vue中日期选择框混合时间选择器的用法说明
Oct 27 Javascript
关于Vue Webpack2单元测试示例详解
Aug 14 #Javascript
一篇文章让你彻底弄懂JS的事件冒泡和事件捕获
Aug 14 #Javascript
Vue.js如何实现路由懒加载浅析
Aug 14 #Javascript
JavaScript中的return布尔值的用法和原理解析
Aug 14 #Javascript
一个Js文件函数中调用另一个Js文件函数的方法演示
Aug 14 #Javascript
利用纯JS实现像素逐渐显示的方法示例
Aug 14 #Javascript
jQuery 实时保存页面动态添加的数据的示例
Aug 14 #jQuery
You might like
php通用防注入程序 推荐
2011/02/26 PHP
解析百度搜索结果link?url=参数分析 (全)
2012/10/09 PHP
phpMyAdmin自动登录和取消自动登录的配置方法
2014/05/12 PHP
ThinkPHP自动转义存储富文本编辑器内容导致读取出错的解决方法
2014/08/08 PHP
PHP5.4起内置web服务器使用方法
2016/08/09 PHP
一个非常实用的php文件上传类
2017/07/04 PHP
jquery 触发a链接点击事件解决方案
2013/05/02 Javascript
javascript运行机制之this详细介绍
2014/02/07 Javascript
JQuery使用$.ajax和checkbox实现下次不在通知功能
2015/04/16 Javascript
JQuery插入DOM节点的方法
2015/06/11 Javascript
微信小程序 swiper组件详解及实例代码
2016/10/25 Javascript
AngularJS指令中的绑定策略实例分析
2016/12/14 Javascript
详解nodejs 文本操作模块-fs模块(五)
2016/12/23 NodeJs
深入理解Vue-cli搭建项目后的目录结构探秘
2017/07/13 Javascript
原生JS实现自定义滚动条效果
2020/10/27 Javascript
JS库之ParticlesJS使用简介
2017/09/12 Javascript
在element-ui的select下拉框加上滚动加载
2019/04/18 Javascript
解决vue-router 二级导航默认选中某一选项的问题
2019/11/01 Javascript
Vue 路由间跳转和新开窗口的方式(query、params)
2019/12/25 Javascript
vue使用原生swiper代码实例
2020/02/05 Javascript
pandas.cut具体使用总结
2019/06/24 Python
PyCharm专业最新版2019.1安装步骤(含激活码)
2019/10/09 Python
TensorFlow设置日志级别的几种方式小结
2020/02/04 Python
django admin管理工具自定义时间区间筛选器DateRangeFilter介绍
2020/05/19 Python
Python绘图之柱形图绘制详解
2020/07/28 Python
澳大利亚音乐商店:Bava’s Music City
2019/05/05 全球购物
C++:memset ,memcpy和strcpy的根本区别
2013/04/27 面试题
服务生自我鉴定
2014/01/22 职场文书
十佳青年个人事迹材料
2014/01/28 职场文书
简洁的英文求职信范文
2014/05/03 职场文书
大一新生期末自我评价
2014/09/12 职场文书
工商局局长个人对照检查材料思想汇报
2014/09/23 职场文书
寝室长工作失责检讨书
2014/10/06 职场文书
Django一小时写出账号密码管理系统
2021/04/29 Python
Python包argparse模块常用方法
2021/06/04 Python
redis的list数据类型相关命令介绍及使用
2022/01/18 Redis