记一次订单号重复的事故,快看看你的 UUID 在并发下还正确吗

简介: 记一次订单号重复的事故,快看看你的 UUID 在并发下还正确吗

去年年底的时候,我们线上出了一次事故,这个事故的表象是这样的:

 

系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照 订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以 这次系统升级一定要解决掉。

 

经手的同事之前也改过几次,不过效果始终不好:总会出现订单号重复的问题, 所以趁着这次问题我好好的理了一下我同事写的代码。

 

这里简要展示下当时的代码:

 

/**    * OD单号生成    * 订单号生成规则:OD + yyMMddHHmmssSSS + 5位数(商户ID3位+随机数2位) 22位    */   public static String getYYMMDDHHNumber(String merchId){          StringBuffer orderNo = new StringBuffer(new SimpleDateFormat("yyMMddHHmmssSSS").format(new Date()));          if(StringUtils.isNotBlank(merchId)){              if(merchId.length()>3){                  orderNo.append(merchId.substring(0,3));              }else {                  orderNo.append(merchId);              }          }          int orderLength = orderNo.toString().length();          String randomNum = getRandomByLength(20-orderLength);          orderNo.append(randomNum);          return orderNo.toString();   }        /** 生成指定位数的随机数 **/      public static String getRandomByLength(int size){          if(size>8 || size<1){              return "";          }          Random ne = new Random();          StringBuffer endNumStr = new StringBuffer("1");          StringBuffer staNumStr = new StringBuffer("9");          for(int i=1;i<size;i++){              endnumstr.append("0");              stanumstr.append("0");          }          int randomnum = ne.nextint(integer.valueof(stanumstr.tostring()))+integer.valueof(endnumstr.tostring());          return string.valueof(randomnum);      }< pre=""></size;i++){              endnumstr.append("0");              stanumstr.append("0");          }          int randomnum = ne.nextint(integer.valueof(stanumstr.tostring()))+integer.valueof(endnumstr.tostring());          return string.valueof(randomnum);      }<>

 

可以看到,这段代码写的其实不怎么好,代码部分暂且不议,代码中使订单号不重复的主要因素点是随机数和毫秒,可是这里的随机数只有两位

 

在高并发环境下极容易出现重复问题,同时毫秒这一选择也不是很好,在多核CPU多线程下,一定时间内(极小的)这个毫秒可以说是固定不变的(测试验证过),所以这里我先以100个并发测试下这个订单号生成,测试代码如下:

 

    public static void main(String[] args) {
        final String merchId = "12334";
        List orderNos = Collections.synchronizedList(new ArrayList());
        IntStream.range(0,100).parallel().forEach(i->{
            orderNos.add(getYYMMDDHHNumber(merchId));
        });

 

      List filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

 

      System.out.println("生成订单数:"+orderNos.size());        System.out.println("过滤重复后订单数:"+filterOrderNos.size());        System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));    }

 

果然,测试的结果如下:

 

生成订单数:100过滤重复后订单数:87重复订单数:13

 

当时我就震惊🤯了,一百个并发里面竟然有13个重复的!!!,我赶紧让同事先不要发版,这活儿我接了!

 

对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的,我大概花了6+分钟和同事商量了下业务场景,决定做如下更改:

 

  • 去掉商户ID的传入(按同事的说法,传入商户ID也是为了防止重复订单的,事实证明并没有叼用)
  • 毫秒仅保留三位(缩减长度同时保证应用切换不存在重复的可能)
  • 使用线程安全的计数器做数字递增(三位数最低保证并发800不重复,代码中我给了4位)
  • 更换日期转换为java8的日期类以格式化(线程安全及代码简洁性考量)

 

经过以上思考后我的最终代码是:

 

/** 订单号生成(NEW) **/    private static final AtomicInteger SEQ = new AtomicInteger(1000);    private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");    private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");    public static String generateOrderNo(){        LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);        if(SEQ.intValue()>9990){            SEQ.getAndSet(1000);        }        return  dataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement();    }

 

当然代码写完成了可不能这么随随便便结束了,现在得走一个测试main函数看看:

 

public static void main(String[] args) {

 

      List orderNos = Collections.synchronizedList(new ArrayList());        IntStream.range(0,8000).parallel().forEach(i->{            orderNos.add(generateOrderNo());        });

 

      List filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

 

      System.out.println("生成订单数:"+orderNos.size());        System.out.println("过滤重复后订单数:"+filterOrderNos.size());        System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));    }    /**        测试结果:        生成订单数:8000        过滤重复后订单数:8000        重复订单数:0    **/

 

真好,一次就成功了,可以直接上线了。。。

 

然而,我回过头来看以上代码,虽然最大程度解决了并发单号重复的问题,不过对于我们的系统架构还是有一个潜在的隐患:如果当前应用有多个实例(集群)难道就没有重复的可能了?

 

鉴于此问题就必然需要一个有效的解决方案,所以这时我就思考:多个实例应用订单号如何区分开呢?以下为我思考的大致方向:

 

  • 使用UUID(在第一次生成订单号时初始化一个)
  • 使用redis记录一个增长ID
  • 使用数据库表维护一个增长ID
  • 应用所在的网络IP
  • 应用所在的端口号
  • 使用第三方算法(雪花算法等等)
  • 使用进程ID(某种程度下是一个可行的方案)

 

在此我想了下,我们的应用是跑在docker里面,而且每个docker容器内的应用端口都一样,不过网路IP不会存在重复的问题,至于进程也有存在重复的可能,对于UUID的方式之前吃过亏,总之吧,redis或DB也算是一种比较好的方式,不过独立性较差。。。

 

同时还有一个因素也很重要,就是所有涉及到订单号生成的应用都是在同一台宿主机(linux实体服务器)上, 所以就目前的系统架构我选用了IP的方式。

 

一下是我的代码:

 

import org.apache.commons.lang3.RandomUtils;

 

import java.net.InetAddress;import java.time.LocalDateTime;import java.time.ZoneId;import java.time.format.DateTimeFormatter;import java.util.ArrayList;import java.util.Collections;import java.util.List;import java.util.concurrent.atomic.AtomicInteger;import java.util.stream.Collectors;import java.util.stream.IntStream;

 

public class OrderGen2Test {

 

  /** 订单号生成 **/    private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");    private static final AtomicInteger SEQ = new AtomicInteger(1000);    private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");    public static String generateOrderNo(){        LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);        if(SEQ.intValue()>9990){            SEQ.getAndSet(1000);        }        return  dataTime.format(DF_FMT_PREFIX)+ getLocalIpSuffix()+SEQ.getAndIncrement();    }

 

  private volatile static String IP_SUFFIX = null;    private static String getLocalIpSuffix (){        if(null != IP_SUFFIX){            return IP_SUFFIX;        }        try {            synchronized (OrderGen2Test.class){                if(null != IP_SUFFIX){                    return IP_SUFFIX;                }                InetAddress addr = InetAddress.getLocalHost();                //  172.17.0.4  172.17.0.199 ,                String hostAddress = addr.getHostAddress();                if (null != hostAddress && hostAddress.length() > 4) {                    String ipSuffix = hostAddress.trim().split("\\.")[3];                    if (ipSuffix.length() == 2) {                        IP_SUFFIX = ipSuffix;                        return IP_SUFFIX;                    }                    ipSuffix = "0" + ipSuffix;                    IP_SUFFIX = ipSuffix.substring(ipSuffix.length() - 2);                    return IP_SUFFIX;                }                IP_SUFFIX = RandomUtils.nextInt(10, 20) + "";                return IP_SUFFIX;            }        }catch (Exception e){            System.out.println("获取IP失败:"+e.getMessage());            IP_SUFFIX =  RandomUtils.nextInt(10,20)+"";            return IP_SUFFIX;        }    }

 

 

  public static void main(String[] args) {        List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());        IntStream.range(0,8000).parallel().forEach(i->{            orderNos.add(generateOrderNo());        });

 

      List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

 

      System.out.println("订单样例:"+ orderNos.get(22));        System.out.println("生成订单数:"+orderNos.size());        System.out.println("过滤重复后订单数:"+filterOrderNos.size());        System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));    }}

 

/**  订单样例:20082115575546011022  生成订单数:8000  过滤重复后订单数:8000  重复订单数:0**/

 

# 最后

 

代码说明及几点建议

 

  • generateOrderNo()方法内不需要加锁,因为AtomicInteger内使用的是CAS自旋转锁(保证可见性的同时也保证原子性,具体的请自行了解)
  • getLocalIpSuffix()方法内不需要对不为null的逻辑加同步锁(双向校验锁,整体是一种安全的单例模式)
  • 本人实现的方式并不是解决问题的唯一方式,具体解决问题需要视当前系统架构具体而论
  • 任何测试都是必要的,我同事在前几次尝试解决这个问题后都没有自测,不测试有损开发专业性!
相关文章
|
5月前
|
人工智能 监控 中间件
深入解析|Cursor编程实践经验分享
本文是近两个月的实践总结,结合在实际工作中的实践聊一聊Cursor的表现。记录在该过程中遇到的问题以及一些解法。问题概览(for 服务端): 不如我写的快?写的不符合预期? Cursor能完成哪些需求?这个需求可以用Cursor,那个需求不能用Cursor? 历史代码分析浅显,不够深入理解? 技术方案设计做的不够好,细节缺失,生成代码的可用性不够满意?
1266 10
深入解析|Cursor编程实践经验分享
|
NoSQL Java Redis
面试官:项目中如何实现分布式锁?
面试官:项目中如何实现分布式锁?
337 7
面试官:项目中如何实现分布式锁?
|
分布式计算 DataWorks MaxCompute
DataWorks产品使用合集之怎么更改ODPS表的生命周期为永久
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
SQL DataWorks 安全
DataWorks产品使用合集之怎么注释代码块
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
385 0
|
数据可视化 Java API
【Spring Boot 快速入门】五、Spring Boot集成Swagger UI
【Spring Boot 快速入门】五、Spring Boot集成Swagger UI
1547 0
【Spring Boot 快速入门】五、Spring Boot集成Swagger UI
|
设计模式 Java
深入理解设计模式!六大设计原则的分析与介绍
本篇文章开始介绍程序架构设计中的设计模式,介绍了设计模式的基本概念以及23设计模式。主要介绍了设计模式中的六大设计原则。开闭原则,里氏代换原则,依赖倒转原则,接口隔离原则,迪米特原则和合成复用原则。这几大原则是设计模式使用的基础,在使用设计模式时,应该牢记这六大原则。
7213 0
深入理解设计模式!六大设计原则的分析与介绍
|
SQL NoSQL Java
商品超买超卖问题分析及实战
商品超买超卖问题分析及实战
1875 0
商品超买超卖问题分析及实战
|
机器学习/深度学习
时序预测 | MATLAB实现基于CNN-LSTM卷积长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)
时序预测 | MATLAB实现基于CNN-LSTM卷积长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)
|
SQL 分布式计算 编译器
MaxCompute ODPS重装上阵, IF ELSE分支语句
MaxCompute通过脚本模式支持IF ELSE分支语句,让程序根据条件自动选择执行逻辑,支持更好的处理因数据不同而需要采用不同策略的业务场景产生的复杂SQL,提高开发者编程的灵活性!
1425 2
|
Cloud Native 测试技术 数据库
【TICA解读】架构设计的本质:如何确定服务的边界
【TICA解读】架构设计的本质:如何确定服务的边界
429 0
【TICA解读】架构设计的本质:如何确定服务的边界