mysql实现的雪花算法-百分百源码网

mysql实现的雪花算法

发布时间：09/01 来源：未知浏览：关键词：

【相关学习引荐：mysql视频教程】

一、为什么要用雪花算法

1、问题发生的背景

现如今越来越多的公司都在用分布式、微效劳，那么对应的就会针对不一样的效劳停止数据库拆分，然后当数据量上来的时候也会停止分表，那么随之而来的就是分表今后id的问题。

例如此前单体项目中一个表中的数据主键id都是自增的，mysql是利用autoincrement来实现自增，而oracle是利用序列来实现的，但是当单表数据量上来今后就要停止水平分表，阿里java开发倡议是单表大于500w的时候就要分表，但是详细还是得看业务，假如索援用的号的话，单表千万的数据也是可以的。水平分表就是将一张表的数据分成多张表，那么问题就来了假如还是依照之前的自增来做主键id，那么就会显现id反复，这个时候就得思考用什么方案来解决分布式id的问题了。

2、解决方案

2.1、数据库表

可以在某个库中专门保护一张表，然后每次不管哪个表需要自增id的时候都去查这个表的记载，然后用for update锁表，然后取到的值加一，然后返回今后把再把值记载到表中，但是这个办法适合并发量比力小的项目，因此每次都得锁表。

2.2、redis

由于redis是单线程的，可以在redis中保护一个键值对，然后哪个表需要直接去redis中取值然后加一，但是这个跟上面一样由于单线程都是对高并发的支撑不高，只适合并发量小的项目。

2.3、uuid

可以使用uuid作为不反复主键id，但是uuid有个问题就是其是无序的字符串，假如使用uuid当做主键，那么主键索引就会失效。

2.4、雪花算法

雪花算法是解决分布式id的一个高效的方案，大部分互联网公司都在使用雪花算法，当然还有公司本人实现其他的方案。

二、雪花算法

1、道理

雪花算法就是使用64位long类型的数据储备id，最高位一位储备0或者1,0代表整数，1代表负数，一样都是0，所以最高位不变，41位储备毫秒级时间戳，10位储备机器码（包罗5位datacenterId和5位workerId），12储备序列号。这样最大2的10次方的机器，也就是1024台机器，最多每毫秒每台机器发生2的12次方也就是4096个id。（下面有代码实现）

但是一样我们没有那么多台机器，所以我们也可以使用53位来储备id。为什么要用53位？

由于我们几乎都是跟web页面打交道，就需要跟js打交道，js支撑最大的整型范畴为53位，超越这个范畴就会丧失精度，53之内可以直接由js读取，超越53位就需要转换成字符串才能包管js处置准确。53储备的话，32位储备秒级时间戳，5位储备机器码，16位储备序列化，这样每台机器每秒可以生产65536个不反复的id。

2、缺陷

由于雪花算法严峻依靠时间，所以当发生效劳器时钟回拨的问题是会致使大概发生反复的id。当然几乎没有公司会修改效劳器时间，修改今后会致使各种问题，公司甘愿新加一台效劳器也不肯意修改效劳器时间，但是不排除非凡状况。

怎样解决时钟回拨的问题？可以对序列化的初始值设定步长，每次触发时钟回拨事件，则其初始步长就加1w，可以鄙人面代码的第85行来实现，将sequence的初始值设定为10000。

三、代码实现

64位的代码实现：

package com.yl.common;
/**
 * Twitter_Snowflake<br>
 * SnowFlake的构造如下(每部分用-分开):<br>
 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>
 * 1位标识，由于long根本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一样是正数，最高位是0<br>
 * 41位时间截(毫秒级)，留意，41位时间截不是储备当前时间的时间截，而是储备时间截的差值（当前时间截 - 开端时间截)
 * 得到的值），这里的的开端时间截，一样是我们的id生成器开端使用的时间，由我们程序来指定的（如下下面程序IdWorker类的startTime属性）。41位的时间截，可以使用69年，年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69<br>
 * 10位的数据机器位，可以摆设在1024个节点，包罗5位datacenterId和5位workerId<br>
 * 12位序列，毫秒内的计数，12位的计数次序号支撑每个节点每毫秒(统一机器，统一时间截)发生4096个ID序号<br>
 * 加起来恰好64位，为一个Long型。<br>
 * SnowFlake的长处是，团体上依照时间自增排序，并且整个分布式系统内不会发生ID碰撞(由数据中心ID和机器ID作区分)，并且效力较高，经测试，SnowFlake每秒能够发生26万ID摆布。
 */
public class SnowflakeIdWorker {

 // ==============================Fields===========================================
 /** 开端时间截 (2020-01-01) */
 private final long twepoch = 1577808000000L;

 /** 机器id所占的位数 */
 private final long workerIdBits = 5L;

 /** 数据标识id所占的位数 */
 private final long datacenterIdBits = 5L;

 /** 支撑的最大机器id，结果是31 (这个移位算法可以很快的运算出几位二进制数所能表示的最大十进制数) */
 private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

 /** 支撑的最大数据标识id，结果是31 */
 private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);

 /** 序列在id中占的位数 */
 private final long sequenceBits = 12L;

 /** 机器ID向左移12位 */
 private final long workerIdShift = sequenceBits;

 /** 数据标识id向左移17位(12+5) */
 private final long datacenterIdShift = sequenceBits + workerIdBits;

 /** 时间截向左移22位(5+5+12) */
 private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

 /** 生成序列的掩码，这里为4095 (0b111111111111=0xfff=4095) */
 private final long sequenceMask = -1L ^ (-1L << sequenceBits);

 /** 工作机器ID(0~31) */
 private long workerId;

 /** 数据中心ID(0~31) */
 private long datacenterId;

 /** 毫秒内序列(0~4095) */
 private long sequence = 0L;

 /** 上次生成ID的时间截 */
 private long lastTimestamp = -1L;

 //==============================Constructors=====================================
 /**
 * 结构函数
 * @param workerId 工作ID (0~31)
 * @param datacenterId 数据中心ID (0~31)
 */
 public SnowflakeIdWorker(long workerId, long datacenterId) {
 if (workerId > maxWorkerId || workerId < 0) {
 throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
 }
 if (datacenterId > maxDatacenterId || datacenterId < 0) {
 throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
 }
 this.workerId = workerId;
 this.datacenterId = datacenterId;
 }

 // ==============================Methods==========================================
 /**
 * 获得下一个ID (该办法是线程平安的)
 * @return SnowflakeId
 */
 public synchronized long nextId() {
 long timestamp = timeGen();

 //假如当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出非常
 if (timestamp < lastTimestamp) {
 throw new RuntimeException(
  String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
 }

 //假如是统一时间生成的，则停止毫秒内序列
 if (lastTimestamp == timestamp) {
 sequence = (sequence + 1) & sequenceMask;
 //毫秒内序列溢出
 if (sequence == 0) {
 //堵塞到下一个毫秒,获得新的时间戳
 timestamp = tilNextMillis(lastTimestamp);
 }
 }
 //时间戳改动，毫秒内序列重置
 else {
 sequence = 0L;
 }

 //上次生成ID的时间截
 lastTimestamp = timestamp;

 //移位并通过或运算拼到一起组成64位的ID
 return ((timestamp - twepoch) << timestampLeftShift) //
 | (datacenterId << datacenterIdShift) //
 | (workerId << workerIdShift) //
 | sequence;
 }

 /**
 * 堵塞到下一个毫秒，直到获得新的时间戳
 * @param lastTimestamp 上次生成ID的时间截
 * @return 当前时间戳
 */
 protected long tilNextMillis(long lastTimestamp) {
 long timestamp = timeGen();
 while (timestamp <= lastTimestamp) {
 timestamp = timeGen();
 }
 return timestamp;
 }

 /**
 * 返回以毫秒为单位的当前时间
 * @return 当前时间(毫秒)
 */
 protected long timeGen() {
 return System.currentTimeMillis();
 }

 //==============================Test=============================================
 /** 测试 */
 public static void main(String[] args) {
 SnowflakeIdWorker idWorker = new SnowflakeIdWorker(0, 0);
 
 for (int i = 0; i < 100; i++) {
 long id = idWorker.nextId();
 System.out.println(id);
 }
 }
}

补充知识：雪花算法实现分布式自增长ID

我就废话不多说了，大家还是直接看代码吧~

/**
 * <p>名称：IdWorker.java</p>
 * <p>描写：分布式自增长ID</p>
 * <pre>
 * Twitter的 Snowflake　JAVA实现方案
 * </pre>
 * 中心代码为其IdWorker这个类实现，其道理构造如下，我离别用一个0表示一位，用—分割开部分的作用：
 * 1||0---0000000000 0000000000 0000000000 0000000000 0 --- 00000 ---00000 ---000000000000
 * 在上面的字符串中，第一位为未使用（实际上也可作为long的符号位），接下来的41位为毫秒级时间，
 * 然后5位datacenter标识位，5位机器ID（并不算标识符，实际是为线程标识），
 * 然后12位该毫秒内的当前毫秒内的计数，加起来恰好64位，为一个Long型。
 * 这样的好处是，团体上依照时间自增排序，并且整个分布式系统内不会发生ID碰撞（由datacenter和机器ID作区分），
 * 并且效力较高，经测试，snowflake每秒能够发生26万ID摆布，完全知足需要。
 * <p>
 * 64位ID (42(毫秒)+5(机器ID)+5(业务编码)+12(反复累加))
 *
 * @author Polim
 */
public class IdWorker {
 // 时间起始标志点，作为基准，一样取系统的比来时间（一旦肯定不克不及变更）
 private final static long twepoch = 1288834974657L;
 // 机器标识位数
 private final static long workerIdBits = 5L;
 // 数据中心标识位数
 private final static long datacenterIdBits = 5L;
 // 机器ID最大值
 private final static long maxWorkerId = -1L ^ (-1L << workerIdBits);
 // 数据中心ID最大值
 private final static long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
 // 毫秒内自增位
 private final static long sequenceBits = 12L;
 // 机器ID偏左移12位
 private final static long workerIdShift = sequenceBits;
 // 数据中心ID左移17位
 private final static long datacenterIdShift = sequenceBits + workerIdBits;
 // 时间毫秒左移22位
 private final static long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

 private final static long sequenceMask = -1L ^ (-1L << sequenceBits);
 /* 上次生产id时间戳 */
 private static long lastTimestamp = -1L;
 // 0，并发操纵
 private long sequence = 0L;

 private final long workerId;
 // 数据标识id部分
 private final long datacenterId;

 public IdWorker(){
 this.datacenterId = getDatacenterId(maxDatacenterId);
 this.workerId = getMaxWorkerId(datacenterId, maxWorkerId);
 }
 /**
 * @param workerId
 *  工作机器ID
 * @param datacenterId
 *  序列号
 */
 public IdWorker(long workerId, long datacenterId) {
 if (workerId > maxWorkerId || workerId < 0) {
  throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
 }
 if (datacenterId > maxDatacenterId || datacenterId < 0) {
  throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
 }
 this.workerId = workerId;
 this.datacenterId = datacenterId;
 }
 /**
 * 猎取下一个ID
 *
 * @return
 */
 public synchronized long nextId() {
 long timestamp = timeGen();
 if (timestamp < lastTimestamp) {
  throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
 }

 if (lastTimestamp == timestamp) {
  // 当前毫秒内，则+1
  sequence = (sequence + 1) & sequenceMask;
  if (sequence == 0) {
  // 当前毫秒内计数满了，则等候下一秒
  timestamp = tilNextMillis(lastTimestamp);
  }
 } else {
  sequence = 0L;
 }
 lastTimestamp = timestamp;
 // ID偏移组合生成终究的ID，并返回ID
 long nextId = ((timestamp - twepoch) << timestampLeftShift)
  | (datacenterId << datacenterIdShift)
  | (workerId << workerIdShift) | sequence;

 return nextId;
 }

 private long tilNextMillis(final long lastTimestamp) {
 long timestamp = this.timeGen();
 while (timestamp <= lastTimestamp) {
  timestamp = this.timeGen();
 }
 return timestamp;
 }

 private long timeGen() {
 return System.currentTimeMillis();
 }

 /**
 * <p>
 * 猎取 maxWorkerId
 * </p>
 */
 protected static long getMaxWorkerId(long datacenterId, long maxWorkerId) {
 StringBuffer mpid = new StringBuffer();
 mpid.append(datacenterId);
 String name = ManagementFactory.getRuntimeMXBean().getName();
 if (!name.isEmpty()) {
  /*
  * GET jvmPid
  */
  mpid.append(name.split("@")[0]);
 }
 /*
 * MAC + PID 的 hashcode 猎取16个低位
 */
 return (mpid.toString().hashCode() & 0xffff) % (maxWorkerId + 1);
 }

 /**
 * <p>
 * 数据标识id部分
 * </p>
 */
 protected static long getDatacenterId(long maxDatacenterId) {
 long id = 0L;
 try {
  InetAddress ip = InetAddress.getLocalHost();
  NetworkInterface network = NetworkInterface.getByInetAddress(ip);
  if (network == null) {
  id = 1L;
  } else {
  byte[] mac = network.getHardwareAddress();
  id = ((0x000000FF & (long) mac[mac.length - 1])
   | (0x0000FF00 & (((long) mac[mac.length - 2]) << 8))) >> 6;
  id = id % (maxDatacenterId + 1);
  }
 } catch (Exception e) {
  System.out.println(" getDatacenterId: " + e.getMessage());
 }
 return id;
 }


}