编程 Python

基于python实现雪花算法过程详解

Posted in Python onNovember 16, 2019

这篇文章主要介绍了基于python实现雪花算法过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Snowflake是Twitter提出来的一个算法，其目的是生成一个64bit的整数:

基于python实现雪花算法过程详解

1bit:一般是符号位，不做处理
41bit:用来记录时间戳，这里可以记录69年，如果设置好起始时间比如今年是2018年，那么可以用到2089年，到时候怎么办？要是这个系统能用69年，我相信这个系统早都重构了好多次了。
10bit:10bit用来记录机器ID，总共可以记录1024台机器，一般用前5位代表数据中心，后面5位是某个数据中心的机器ID
12bit:循环位，用来对同一个毫秒之内产生不同的ID，12位可以最多记录4095个，也就是在同一个机器同一毫秒最多记录4095个，多余的需要进行等待下毫秒。

上面只是一个将64bit划分的标准，当然也不一定这么做，可以根据不同业务的具体场景来划分，比如下面给出一个业务场景：

服务目前QPS10万，预计几年之内会发展到百万。
当前机器三地部署，上海，北京，深圳都有。
当前机器10台左右，预计未来会增加至百台。
这个时候我们根据上面的场景可以再次合理的划分62bit,QPS几年之内会发展到百万，那么每毫秒就是千级的请求，目前10台机器那么每台机器承担百级的请求，为了保证扩展，后面的循环位可以限制到1024，也就是2^10，那么循环位10位就足够了。

机器三地部署我们可以用3bit总共8来表示机房位置，当前的机器10台，为了保证扩展到百台那么可以用7bit 128来表示，时间位依然是41bit,那么还剩下64-10-3-7-41-1 = 2bit,还剩下2bit可以用来进行扩展。

基于python实现雪花算法过程详解

时钟回拨

因为机器的原因会发生时间回拨，我们的雪花算法是强依赖我们的时间的，如果时间发生回拨，有可能会生成重复的ID，在我们上面的nextId中我们用当前时间和上一次的时间进行判断，如果当前时间小于上一次的时间那么肯定是发生了回拨，算法会直接抛出异常.

# Twitter's Snowflake algorithm implementation which is used to generate distributed IDs.
# https://github.com/twitter-archive/snowflake/blob/snowflake-2010/src/main/scala/com/twitter/service/snowflake/IdWorker.scala

import time
import logging

from .exceptions import InvalidSystemClock


# 64位ID的划分
WORKER_ID_BITS = 5
DATACENTER_ID_BITS = 5
SEQUENCE_BITS = 12

# 最大取值计算
MAX_WORKER_ID = -1 ^ (-1 << WORKER_ID_BITS) # 2**5-1 0b11111
MAX_DATACENTER_ID = -1 ^ (-1 << DATACENTER_ID_BITS)

# 移位偏移计算
WOKER_ID_SHIFT = SEQUENCE_BITS
DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS
TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS

# 序号循环掩码
SEQUENCE_MASK = -1 ^ (-1 << SEQUENCE_BITS)

# Twitter元年时间戳
TWEPOCH = 1288834974657


logger = logging.getLogger('flask.app')


class IdWorker(object):
  """
  用于生成IDs
  """

  def __init__(self, datacenter_id, worker_id, sequence=0):
    """
    初始化
    :param datacenter_id: 数据中心（机器区域）ID
    :param worker_id: 机器ID
    :param sequence: 其实序号
    """
    # sanity check
    if worker_id > MAX_WORKER_ID or worker_id < 0:
      raise ValueError('worker_id值越界')

    if datacenter_id > MAX_DATACENTER_ID or datacenter_id < 0:
      raise ValueError('datacenter_id值越界')

    self.worker_id = worker_id
    self.datacenter_id = datacenter_id
    self.sequence = sequence

    self.last_timestamp = -1 # 上次计算的时间戳

  def _gen_timestamp(self):
    """
    生成整数时间戳
    :return:int timestamp
    """
    return int(time.time() * 1000)

  def get_id(self):
    """
    获取新ID
    :return:
    """
    timestamp = self._gen_timestamp()

    # 时钟回拨
    if timestamp < self.last_timestamp:
      logging.error('clock is moving backwards. Rejecting requests until {}'.format(self.last_timestamp))
      raise InvalidSystemClock

    if timestamp == self.last_timestamp:
      self.sequence = (self.sequence + 1) & SEQUENCE_MASK
      if self.sequence == 0:
        timestamp = self._til_next_millis(self.last_timestamp)
    else:
      self.sequence = 0

    self.last_timestamp = timestamp

    new_id = ((timestamp - TWEPOCH) << TIMESTAMP_LEFT_SHIFT) | (self.datacenter_id << DATACENTER_ID_SHIFT) | \
         (self.worker_id << WOKER_ID_SHIFT) | self.sequence
    return new_id

  def _til_next_millis(self, last_timestamp):
    """
    等到下一毫秒
    """
    timestamp = self._gen_timestamp()
    while timestamp <= last_timestamp:
      timestamp = self._gen_timestamp()
    return timestamp

if __name__ == '__main__':
  worker = IdWorker(1, 2, 0)
  print(worker.get_id())

同文件夹下建立exceptions.py

class InvalidSystemClock(Exception):
  """
  时钟回拨异常
  """
  pass

配置文件中添加,对应的是机器ID和序列号

# Snowflake ID Worker 参数
  DATACENTER_ID = 0
  WORKER_ID = 0
  SEQUENCE = 0

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

基于python实现雪花算法过程详解

- Author -

太虚真人

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python多线程编程方式分析示例详解

Dec 06 Python

Python运用于数据分析的简单教程

Mar 27 Python

Python简单实现网页内容抓取功能示例

Jun 07 Python

Python实现读取SQLServer数据并插入到MongoDB数据库的方法示例

Jun 09 Python

Python WSGI的深入理解

Aug 01 Python

利用anaconda保证64位和32位的python共存

Mar 09 Python

基于python二叉树的构造和打印例子

Aug 09 Python

Pytorch 使用 nii数据做输入数据的操作

May 26 Python

详解使用Python写一个向数据库填充数据的小工具(推荐)

Sep 11 Python

Python关于拓扑排序知识点讲解

Jan 04 Python

matplotlib事件处理基础(事件绑定、事件属性)

Feb 03 Python

Python大数据之使用lxml库解析html网页文件示例

Nov 16 #Python

Python大数据之从网页上爬取数据的方法详解

Nov 16 #Python

简单了解Pandas缺失值处理方法

Nov 16 #Python

python selenium 执行完毕关闭chromedriver进程示例

Nov 15 #Python

浅谈Django2.0 加xadmin踩的坑

Nov 15 #Python

Django 实现xadmin后台菜单改为中文

Nov 15 #Python

django使用xadmin的全局配置详解

Nov 15 #Python

You might like

smarty中先strip_tags过滤html标签后truncate截取文章运用

2010/10/25 PHP

php截取字符串并保留完整xml标签的函数代码

2013/02/06 PHP

PHP环境中Memcache的安装和使用

2015/11/05 PHP

微信支付扫码支付php版

2016/07/22 PHP

thinkPHP5.0框架独立配置与动态配置方法

2017/03/17 PHP

PHP实现二维数组（或多维数组）转换成一维数组的常见方法总结

2019/12/04 PHP

Js 本页面传值实现代码

2009/05/17 Javascript

jquery tablesorter.js 支持中文表格排序改进

2009/12/09 Javascript

一个简单的JavaScript数据缓存系统实现代码

2010/10/24 Javascript

jQuery Trim去除字符串首尾空字符的实现方法说明

2014/02/11 Javascript

调用jQuery滑出效果时闪烁的解决方法

2014/03/27 Javascript

express的中间件bodyParser详解

2014/12/04 Javascript

JavaScript中的对象序列化介绍

2014/12/30 Javascript

利用Javascript实现简单的转盘抽奖

2017/02/13 Javascript

layui文件上传实现代码

2017/05/20 Javascript

mui开发中获取单选按钮、复选框的值(实例讲解)

2017/07/24 Javascript

React中jquery引用的实现方法

2017/09/12 jQuery

ES6与CommonJS中的模块处理的区别

2018/06/13 Javascript

使用 Element UI Table 的 slot-scope方法

2019/10/10 Javascript

Vue中key的作用示例代码详解

2020/06/10 Javascript

[06:04]DOTA2国际邀请赛纪录片：Just For LGD

2013/08/11 DOTA

Python实现对一个函数应用多个装饰器的方法示例

2018/02/09 Python

Python3中正则模块re.compile、re.match及re.search函数用法详解

2018/06/11 Python

详解Python静态网页爬取获取高清壁纸

2019/04/23 Python

Python第三方库face_recognition在windows上的安装过程

2019/05/03 Python

python matplotlib库绘制条形图练习题

2019/08/10 Python

python实现音乐播放和下载小程序功能

2020/04/26 Python

HTML5本地存储localStorage、sessionStorage基本用法、遍历操作、异常处理等

2014/05/08 HTML / CSS

斯洛伐克家具和时尚装饰品购物网站：Butlers.sk

2019/09/08 全球购物

实习护理工作自我评价

2013/09/25 职场文书

热能动力工程毕业生自荐信

2013/11/07 职场文书

欢迎标语大全

2014/06/21 职场文书

农村婚庆主持词

2015/06/29 职场文书

2015年音乐教学工作总结

2015/07/22 职场文书

党员学习中国梦心得体会

2016/01/05 职场文书

javascript进阶篇深拷贝实现的四种方式

2022/07/07 Javascript