一致性哈希算法以及其PHP实现详细解析


Posted in PHP onAugust 24, 2013

在做服务器负载均衡时候可供选择的负载均衡的算法有很多,包括:  轮循算法(Round Robin)、哈希算法(HASH)、最少连接算法(Least Connection)、响应速度算法(Response Time)、加权法(Weighted )等。其中哈希算法是最为常用的算法.

典型的应用场景是: 有N台服务器提供缓存服务,需要对服务器进行负载均衡,将请求平均分发到每台服务器上,每台机器负责1/N的服务。

常用的算法是对hash结果取余数 (hash() mod N):对机器编号从0到N-1,按照自定义的hash()算法,对每个请求的hash()值按N取模,得到余数i,然后将请求分发到编号为i的机器。但这样的算法方法存在致命问题,如果某一台机器宕机,那么应该落在该机器的请求就无法得到正确的处理,这时需要将当掉的服务器从算法从去除,此时候会有(N-1)/N的服务器的缓存数据需要重新进行计算;如果新增一台机器,会有N /(N+1)的服务器的缓存数据需要进行重新计算。对于系统而言,这通常是不可接受的颠簸(因为这意味着大量缓存的失效或者数据需要转移)。那么,如何设计一个负载均衡策略,使得受到影响的请求尽可能的少呢?

在Memcached、Key-Value Store、Bittorrent DHT、LVS中都采用了Consistent Hashing算法,可以说Consistent Hashing 是分布式系统负载均衡的首选算法。

1、Consistent Hashing算法描述

下面以Memcached中的Consisten Hashing算法为例说明。
由于hash算法结果一般为unsigned int型,因此对于hash函数的结果应该均匀分布在[0,232-1]间,如果我们把一个圆环用232 个点来进行均匀切割,首先按照hash(key)函数算出服务器(节点)的哈希值, 并将其分布到0~232的圆上。

用同样的hash(key)函数求出需要存储数据的键的哈希值,并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器(节点)上。

一致性哈希算法以及其PHP实现详细解析 Consistent Hashing原理示意图

新增一个节点的时候,只有在圆环上新增节点逆时针方向的第一个节点的数据会受到影响。删除一个节点的时候,只有在圆环上原来删除节点顺时针方向的第一个节点的数据会受到影响,因此通过Consistent Hashing很好地解决了负载均衡中由于新增节点、删除节点引起的hash值颠簸问题。

一致性哈希算法以及其PHP实现详细解析 Consistent Hashing添加服务器示意图

虚拟节点(virtual nodes):之所以要引进虚拟节点是因为在服务器(节点)数较少的情况下(例如只有3台服务器),通过hash(key)算出节点的哈希值在圆环上并不是均匀分布的(稀疏的),仍然会出现各节点负载不均衡的问题。虚拟节点可以认为是实际节点的复制品(replicas),本质上与实际节点实际上是一样的(key并不相同)。引入虚拟节点后,通过将每个实际的服务器(节点)数按照一定的比例(例如200倍)扩大后并计算其hash(key)值以均匀分布到圆环上。在进行负载均衡时候,落到虚拟节点的哈希值实际就落到了实际的节点上。由于所有的实际节点是按照相同的比例复制成虚拟节点的,因此解决了节点数较少的情况下哈希值在圆环上均匀分布的问题。

一致性哈希算法以及其PHP实现详细解析 

虚拟节点对Consistent Hashing结果的影响

从上图可以看出,在节点数为10个的情况下,每个实际节点的虚拟节点数为实际节点的100-200倍的时候,结果还是很均衡的。

第3段中有这些文字:“但这样的算法方法存在致命问题,如果某一台机器宕机,那么应该落在该机器的请求就无法得到正确的处理,这时需要将当掉的服务器从算法从去除,此时候会有(N-1)/N的服务器的缓存数据需要重新进行计算;”

为何是 (N-1)/N 呢?解释如下:

比如有 3 台机器,hash值 1-6 在这3台上的分布就是:
host 1: 1 4
host 2: 2 5
host 3: 3 6
如果挂掉一台,只剩两台,模数取 2 ,那么分布情况就变成:
host 1: 1 3 5
host 2: 2 4 6

可以看到,还在数据位置不变的只有2个: 1,2,位置发生改变的有4个,占共6个数据的比率是 4/6 = 2/3这样的话,受影响的数据太多了,势必太多的数据需要重新从 DB 加载到 cache 中,严重影响性能

【consistent hashing 的办法】
上面提到的 hash 取模,模数取的比较小,一般是负载的数量,而 consistent hashing 的本质是将模数取的比较大,为 2的32次方减1,即一个最大的 32 位整数。然后,就可以从容的安排数据导向了,那个图还是挺直观的。
以下部分为一致性哈希算法的一种PHP实现。点击下载

PHP 相关文章推荐
新版PHP将向Java靠拢
Oct 09 PHP
桌面中心(三)修改数据库
Oct 09 PHP
PHP完整的日历类(CLASS)
Nov 27 PHP
PHP+ACCESS 文章管理程序代码
Jun 21 PHP
php中时间轴开发(刚刚、5分钟前、昨天10:23等)
Oct 03 PHP
PHP运行SVN命令显示某用户的文件更新记录的代码
Jan 03 PHP
php获取英文姓名首字母的方法
Jul 13 PHP
PHP socket 模拟POST 请求实例代码
Jul 18 PHP
php文件类型MIME对照表(比较全)
Oct 07 PHP
超强多功能php绿色集成环境详解
Jan 25 PHP
简单谈谈PHP面向对象之标识对象
Jun 27 PHP
PHP高效获取远程图片尺寸和大小的实现方法
Oct 20 PHP
PHP如何利用P3P实现跨域
Aug 24 #PHP
PHP引用符&的用法详细解析
Aug 22 #PHP
新手菜鸟必读:session与cookie的区别
Aug 22 #PHP
PHP mysql与mysqli事务使用说明 分享
Aug 17 #PHP
php中url传递中文字符,特殊危险字符的解决方法
Aug 17 #PHP
测试PHP连接MYSQL成功与否的代码
Aug 16 #PHP
PHP 通过Socket收发十六进制数据的实现代码
Aug 16 #PHP
You might like
提高PHP编程效率的53个要点(经验小结)
2010/09/04 PHP
php-fpm.conf配置文件中文说明详解及重要参数说明
2018/10/10 PHP
JavaScript While 循环基础教程
2007/04/05 Javascript
JQuery 遮罩层实现(mask)实现代码
2010/01/09 Javascript
js 巧妙去除数组中的重复项
2010/01/25 Javascript
NodeJS的模块写法入门(实例代码)
2012/03/07 NodeJs
对于this和$(this)的个人理解
2013/09/08 Javascript
常用的JavaScript验证正则表达式汇总
2013/11/26 Javascript
巧用replace将文字表情替换为图片
2014/04/17 Javascript
js实现简单的省市县三级联动效果实例
2016/02/18 Javascript
Node.js开发者必须了解的4个JS要点
2016/02/21 Javascript
基于BootStrap Metronic开发框架经验小结【九】实现Web页面内容的打印预览和保存操作
2016/05/12 Javascript
jquery实现网页定位导航
2016/08/23 Javascript
BootStrap入门教程(一)之可视化布局
2016/09/19 Javascript
通过JS获取Request.QueryString()参数的值实现方法
2016/09/27 Javascript
Web纯前端“旭日图”实现元素周期表
2017/03/10 Javascript
JavaScript面向对象精要(下部)
2017/09/12 Javascript
js代码规范之Eslint安装与配置详解
2018/09/08 Javascript
微信接入之获取用户头像的方法步骤
2019/09/23 Javascript
详解如何在Javascript中使用Object.freeze()
2020/10/18 Javascript
python距离测量的方法
2018/03/06 Python
Django models.py应用实现过程详解
2019/07/29 Python
python实现倒计时小工具
2019/07/29 Python
keras导入weights方式
2020/06/12 Python
英国汽车和货车租赁网站:Hertz英国
2016/09/02 全球购物
荷兰在线钓鱼商店:Raven
2019/06/26 全球购物
水利公司纪检监察自我鉴定
2014/02/25 职场文书
服务口号大全
2014/06/11 职场文书
三月学雷锋活动总结
2014/06/26 职场文书
施工单位安全责任书
2014/07/24 职场文书
2014年医德医风工作总结
2014/11/13 职场文书
少年派的奇幻漂流观后感
2015/06/08 职场文书
HTML5+CSS+JavaScript实现捉虫小游戏设计和实现
2021/10/16 HTML / CSS
MYSQL 运算符总结
2021/11/11 MySQL
flex弹性布局详解
2022/03/20 HTML / CSS
mysql使用instr达到in(字符串)的效果
2022/04/03 MySQL