分享一个开源一个新的雪花算法(雪花漂移)

简介:   IdGenerator介绍  用一种全新的雪花漂移算法,让ID更短、生成速度更快。  核心在于缩短ID长度的同时,还能保持每毫秒并发处理量(50W/0.1s),且能保持伸缩能力。  需求来源  1.作为架构设计的你,想要解决数据库主键唯一的问题。  2.你希望这个主键是用最少的存储空间,索引速度更快。  3.你还会考虑在分库分表(合库合表)的时候,主键值能直接使用,并能反映业务时序。

  IdGenerator介绍

  用一种全新的雪花漂移算法,让ID更短、生成速度更快。

  核心在于缩短ID长度的同时,还能保持每毫秒并发处理量(50W/0.1s),且能保持伸缩能力。

  需求来源

  1.作为架构设计的你,想要解决数据库主键唯一的问题。

  2.你希望这个主键是用最少的存储空间,索引速度更快。

  3.你还会考虑在分库分表(合库合表)的时候,主键值能直接使用,并能反映业务时序。

  4.如果这样的主键值太长,超过前端 JS Number 类型最大值,估计你会把 Long 型转换为 String 型,你会觉得有点不正常。

  5.自增Guid占用空间大,可能也不是你想要的。

  6.你希望系统能运行 100 年以上。

  传统算法问题

  1.生成的ID太长。

  2.并发量不够。

  3.不能解决时间回拨问题。

  4.不支持后补生成前序ID。

  5.依赖外部缓存系统。

  新算法特点

  1.输出整形数字,ID更短,是传统算法的几倍,用50年都不会超过 js Number类型最大值。(默认配置WorkerId是6bit,自增数是6bit)

  2.生成速度更快,0.1秒可生成50万个。(i7笔记本,默认算法配置6bit+6bit)

  3.支持时间回拨处理。比如Linux服务器时间回拨1秒,本算法能自动适应生成临界时间的唯一ID。

  4.支持手工插入新ID。当业务需要在历史时间生成新ID时,用本算法的预留位每秒能生成5000个。

  5.漂移时对外异步发通知事件。让调用方确切知道算法漂移记录,Log并发调用量。

  6.不依赖任何外部缓存和数据库。(但WorkerId必须由外部指定)

  性能数据

  (参数:10位自增序列,1000次漂移最大值)

  连续请求量

  5K

  5W

  50W

  传统雪花算法

  0.0045s

  0.053s

  0.556s

  雪花漂移算法

  0.0015s

  0.012s

  0.11s

  效果

  1.js Number 类型最大数值:9007199254740992,本算法在保持并发性能(5W+/0.01s)和最大64个WorkerId(6bit)的同时,能用70年才到 js Number Max 值。

  2.增加WorkerId位数到8bit(128节点)时,15年达到 js Number Max 值。

  3.极致性能:500W/1s。

  4.所有测试数据均基于8代低压i7计算。

  适用范围

  1.小型、中型、大型需要全局唯一Id(不用Guid)的项目。

  2.分布式项目。

  3.不想将 Long 型转 String 给前端用的项目。(若前端支持bigint,则可不转类型)

  大型分布式使用建议

  1.可扩大 WorkerIdBitLength 到最多20位,支持 1,048,576 个节点,且不影响上述并发性能(50W/0.1s)。

  2.采用中心化 IdGenerator 集群,给节点生成可用 Id 列表,存入 Redis 队列供节点消费。此时64个中心化节点数足够大型互联网项目使用。

  如何处理时间回拨

  1.当发生系统时间回拨的时候,算法采用过去时序的预留序数(0-5)生成新的ID。

  2.默认每秒可生成100个(速度可调整)。

  3.回拨生成的ID序号,默认靠前,也可以调整为靠后。

  4.允许时间回拨至本算法预设基数(参数可调,默认大于1年)。

  能用多久

  1.在默认配置下,ID可用 71000 年不重复。

  2.在支持 1024 个工作节点时,ID可用 4480 年不重复。

  3.在支持 4096 个工作节点时,ID可用 1120 年不重复。

  4.以上所有工作节点,均拥有 50W/0.1s 最大处理速度。

  代码示例文件说明

  1.SnowWorkerM1.cs 是雪花漂移算法。

  2.SnowWorkerM2.cs 是传统雪花算法。

  雪花漂移算法

  var options=new IdGeneratorOptions()

  {

  // 设置WorkerId,二手手游账号默认最大2^16-1

  WorkerId=1

  };

  var newId=new YitIdGenerator(options).NewLong();

  传统雪花算法

  var options=new IdGeneratorOptions()

  {

  Method=2, // 默认1

  WorkerId=1

  };

  var newId=new YitIdGenerator(options).NewLong();

  options说明

  options参数(Method、StartTime除外)只支持漂移算法,不支持传统雪花算法。

  public class IdGeneratorOptions

  {

  ///

  /// 雪花计算方法

  /// (1|2)

  ///

  public short Method { get; set; }=1;

  ///

  /// 开始时间(UTC格式)

  /// 不能超过当前系统时间

  ///

  public DateTime StartTime { get; set; }=DateTime.MinValue;

  ///

  /// 机器码

  /// 与 WorkerIdBitLength 有关系

  ///

  public ushort WorkerId { get; set; }=0;

  ///

  /// 机器码位长

  /// 范围:2-21(要求:序列数位长+机器码位长不超过22)。

  /// 建议范围:6-12。

  ///

  public byte WorkerIdBitLength { get; set; }=6;

  ///

  /// 序列数位长

  /// 范围:2-21(要求:序列数位长+机器码位长不超过22)。

  /// 建议范围:6-14。

  ///

  public byte SeqBitLength { get; set; }=6;

  ///

  /// 最大序列数(含)

  /// (由SeqBitLength计算的最大值)

  ///

  public int MaxSeqNumber { get; set; }=0;

  ///

  /// 最小序列数(含)

  /// 默认11,不小于5,不大于MaxSeqNumber-2

  ///

  public ushort MinSeqNumber { get; set; }=11;

  ///

  /// 最大漂移次数(含),

  /// 默认2000,推荐范围500-10000(与计算能力有关)

  ///

  public int TopOverCostCount { get; set; }=2000;

  生成的ID

  默认配置:

  WorkerId=6 (最多64个工作节点)

  SeqBitLength=6

  ID示例:

  129053495681099 (默认配置运行1年)

  387750301904971 (默认配置运行3年)

  646093214093387 (默认配置运行5年)

  9007199254740992 (js Number 最大值)

  开源地址:开源地址:

  gitee/yitter/idgenerator

目录
相关文章
|
存储 人工智能 自然语言处理
Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
Delta-CoMe是由清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法。该算法通过结合低秩分解和低比特量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。Delta-CoMe特别适用于处理数学、代码和多模态等复杂任务,并在推理速度上有所提升。
361 6
Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法
|
算法 数据处理 数据安全/隐私保护
|
算法 数据库
|
数据采集 算法 安全
CVPR 2024:给NeRF开透视眼!稀疏视角下用X光进行三维重建,9类算法工具包全开源
【6月更文挑战第28天】CVPR 2024亮点:SAX-NeRF框架开源!融合X光与NeRF,提升3D重建效果。X3D数据集验证,Lineformer+MLG策略揭示物体内部结构,增强几何理解。虽有计算成本及泛化挑战,但为计算机视觉和医学影像开辟新路径。[论文链接](https://arxiv.org/abs/2311.10959)**
676 5
|
算法 数据可视化 网络安全
清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法
【6月更文挑战第27天】清华大学等高校发布了开源工具MarkLLM,这是首个专注于大语言模型水印的工具包,支持近10种先进算法。该工具统一了水印实现,便于比较和使用,旨在促进水印技术在保障信息真实性和网络安全上的应用。MarkLLM提供直观界面、可视化及自动化评估,推动了大模型水印研究的进步。[论文链接:](https://arxiv.org/abs/2405.10051)**
578 5
|
算法 数据中心 Python
基于python雪花算法工具类Snowflake-来自chatGPT
基于python雪花算法工具类Snowflake-来自chatGPT
371 4
|
算法 Java
基于java雪花算法工具类SnowflakeIdUtils-来自chatGPT
基于java雪花算法工具类SnowflakeIdUtils-来自chatGPT
736 3
|
文字识别 算法 Java
文本,保存图片09,一个可以用id作为图片名字的pom插件,利用雪花算法生成唯一的id
文本,保存图片09,一个可以用id作为图片名字的pom插件,利用雪花算法生成唯一的id
|
算法 PHP 数据中心
基于php雪花算法工具类Snowflake -来自chatGPT
基于php雪花算法工具类Snowflake -来自chatGPT
298 2
|
算法 数据中心 C++
基于C++雪花算法工具类Snowflake -来自chatGPT
基于C++雪花算法工具类Snowflake -来自chatGPT
229 1