一次订单号重复引起的事故,把我坑惨了!

开发 后端
系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以这次系统升级一定要解决掉。

 [[347594]]

我们线上出了一次事故,这个事故的表象是这样的:

系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以这次系统升级一定要解决掉。

经手的同事之前也改过几次,不过效果始终不好,总会出现订单号重复的问题,所以趁着这次问题我好好的理了一下我同事写的代码。

这里简要展示下当时的代码: 

  1. /**  
  2.  * OD单号生成  
  3.  * 订单号生成规则:OD + yyMMddHHmmssSSS + 5位数(商户ID3位+随机数2位) 22位  
  4.  */  
  5. public static String getYYMMDDHHNumber(String merchId){  
  6.       StringBuffer orderNo = new StringBuffer(new SimpleDateFormat("yyMMddHHmmssSSS").format(new Date()));  
  7.       if(StringUtils.isNotBlank(merchId)){  
  8.           if(merchId.length()>3){  
  9.               orderNo.append(merchId.substring(0,3));  
  10.           }else {  
  11.               orderNo.append(merchId);  
  12.           }  
  13.       }  
  14.       int orderLength = orderNo.toString().length();  
  15.       String randomNum = getRandomByLength(20-orderLength);  
  16.       orderNo.append(randomNum);  
  17.       return orderNo.toString();  
  18.  
  19.   /** 生成指定位数的随机数 **/  
  20.   public static String getRandomByLength(int size){  
  21.       if(size>8 || size<1){  
  22.           return "";  
  23.       }  
  24.       Random ne = new Random();  
  25.       StringBuffer endNumStr = new StringBuffer("1");  
  26.       StringBuffer staNumStr = new StringBuffer("9");  
  27.       for(int i=1;i<size;i++){  
  28.           endNumStr.append("0");  
  29.           staNumStr.append("0");  
  30.       }  
  31.       int randomNum = ne.nextInt(Integer.valueOf(staNumStr.toString()))+Integer.valueOf(endNumStr.toString());  
  32.       return String.valueOf(randomNum);  
  33.   }       

可以看到,这段代码写的其实不怎么好,代码部分暂且不议,代码中使订单号不重复的主要因素点是随机数和毫秒,可是这里的随机数只有两位,在高并发环境下极容易出现重复问题。

同时毫秒这一选择也不是很好,在多核CPU多线程下,一定时间内(极小的)这个毫秒可以说是固定不变的(测试验证过),所以这里我先以100个并发测试下这个订单号生成。

测试代码如下: 

  1. public static void main(String[] args) {  
  2.     final String merchId = "12334" 
  3.     List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());  
  4.     IntStream.range(0,100).parallel().forEach(i-> 
  5.         orderNos.add(getYYMMDDHHNumber(merchId));  
  6.     });  
  7.     List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());  
  8.     System.out.println("生成订单数:"+orderNos.size());  
  9.     System.out.println("过滤重复后订单数:"+filterOrderNos.size());  
  10.     System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));  

果然,测试的结果如下: 

  1. 生成订单数:100  
  2. 过滤重复后订单数:87  
  3. 重复订单数:13 

当时我就震惊🤯了,一百个并发里面竟然有13个重复的!!!

我赶紧让同事先不要发版,这活儿我接了!

对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的,我大概花了6+分钟和同事商量了下业务场景,决定做如下更改:

  •  去掉商户ID的传入(按同事的说法,传入商户ID也是为了防止重复订单的,事实证明并没有叼用)
  •  毫秒仅保留三位(缩减长度同时保证应用切换不存在重复的可能)
  •  使用线程安全的计数器做数字递增(三位数最低保证并发800不重复,代码中我给了4位)
  •  更换日期转换为java8的日期类以格式化(线程安全及代码简洁性考量,可以点击这里进行阅读详情)

经过以上思考后我的最终代码是: 

  1. /** 订单号生成(NEW) **/  
  2. private static final AtomicInteger SEQ = new AtomicInteger(1000);  
  3. private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");  
  4. private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");  
  5. public static String generateOrderNo(){  
  6.     LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);  
  7.     if(SEQ.intValue()>9990){  
  8.         SEQ.getAndSet(1000);  
  9.     }  
  10.     return  dataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement();  

当然代码写完成了可不能这么随随便便结束了,现在得走一个测试main函数看看: 

  1. public static void main(String[] args) {  
  2.     List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());  
  3.     IntStream.range(0,8000).parallel().forEach(i-> 
  4.         orderNos.add(generateOrderNo());  
  5.     });  
  6.     List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());  
  7.     System.out.println("生成订单数:"+orderNos.size());  
  8.     System.out.println("过滤重复后订单数:"+filterOrderNos.size());  
  9.     System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));  
  10.  
  11. /**  
  12.   测试结果:   
  13.   生成订单数:8000  
  14.   过滤重复后订单数:8000  
  15.   重复订单数:0  
  16. **/ 

真好,一次就成功了,可以直接上线了。。。

然而,我回过头来看以上代码,虽然最大程度解决了并发单号重复的问题,不过对于我们的系统架构还是有一个潜在的隐患:如果当前应用有多个实例(集群)难道就没有重复的可能了?

鉴于此问题就必然需要一个有效的解决方案,所以这时我就思考:多个实例应用订单号如何区分开呢?

以下为我思考的大致方向:

  •  使用UUID(在第一次生成订单号时初始化一个)
  •  使用redis记录一个增长ID
  •  使用数据库表维护一个增长ID
  •  应用所在的网络IP
  •  应用所在的端口号
  •  使用第三方算法(雪花算法等等)
  •  使用进程ID(某种程度下是一个可行的方案)

在此我想了下,我们的应用是跑在docker里面,而且每个docker容器内的应用端口都一样,不过网路IP不会存在重复的问题,至于进程也有存在重复的可能,对于UUID的方式之前吃过亏,远之吧,redis或DB也算是一种比较好的方式,不过独立性较差。。。

同时还有一个因素也很重要,就是所有涉及到订单号生成的应用都是在同一台宿主机(linux实体服务器)上, 所以就目前的系统架构我选用了IP的方式。

以下是我的代码: 

  1. import org.apache.commons.lang3.RandomUtils;  
  2. import java.net.InetAddress;  
  3. import java.time.LocalDateTime;  
  4. import java.time.ZoneId;  
  5. import java.time.format.DateTimeFormatter;  
  6. import java.util.ArrayList;  
  7. import java.util.Collections;  
  8. import java.util.List; 
  9. import java.util.concurrent.atomic.AtomicInteger;  
  10. import java.util.stream.Collectors;  
  11. import java.util.stream.IntStream;  
  12. public class OrderGen2Test {  
  13.     /** 订单号生成 **/  
  14.     private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");  
  15.     private static final AtomicInteger SEQ = new AtomicInteger(1000);  
  16.     private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");  
  17.     public static String generateOrderNo(){  
  18.         LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);  
  19.         if(SEQ.intValue()>9990){  
  20.             SEQ.getAndSet(1000); 
  21.          }  
  22.         return  dataTime.format(DF_FMT_PREFIX)+ getLocalIpSuffix()+SEQ.getAndIncrement();  
  23.     }  
  24.     private volatile static String IP_SUFFIX = null 
  25.     private static String getLocalIpSuffix (){  
  26.         if(null != IP_SUFFIX){  
  27.             return IP_SUFFIX;  
  28.         }  
  29.         try { 
  30.              synchronized (OrderGen2Test.class){  
  31.                 if(null != IP_SUFFIX){  
  32.                     return IP_SUFFIX;  
  33.                 }  
  34.                 InetAddress addr = InetAddress.getLocalHost();  
  35.                 //  172.17.0.4  172.17.0.199 ,  
  36.                 String hostAddress = addr.getHostAddress();  
  37.                 if (null != hostAddress && hostAddress.length() > 4) {  
  38.                     String ipSuffix = hostAddress.trim().split("\\.")[3];  
  39.                     if (ipSuffix.length() == 2) {  
  40.                         IP_SUFFIX = ipSuffix 
  41.                         return IP_SUFFIX;  
  42.                     }  
  43.                     ipSuffix = "0" + ipSuffix;  
  44.                     IP_SUFFIX = ipSuffix.substring(ipSuffix.length() - 2);  
  45.                     return IP_SUFFIX;  
  46.                 }  
  47.                 IP_SUFFIX = RandomUtils.nextInt(10, 20) + "";  
  48.                 return IP_SUFFIX;  
  49.             }  
  50.         }catch (Exception e){  
  51.             System.out.println("获取IP失败:"+e.getMessage());  
  52.             IP_SUFFIX =  RandomUtils.nextInt(10,20)+"";  
  53.             return IP_SUFFIX;  
  54.         }  
  55.     }  
  56.     public static void main(String[] args) {  
  57.         List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());  
  58.         IntStream.range(0,8000).parallel().forEach(i-> 
  59.             orderNos.add(generateOrderNo());  
  60.         });  
  61.         List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());  
  62.         System.out.println("订单样例:"+ orderNos.get(22));  
  63.         System.out.println("生成订单数:"+orderNos.size());  
  64.         System.out.println("过滤重复后订单数:"+filterOrderNos.size());  
  65.         System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));  
  66.     }  
  67.  
  68. /**  
  69.   订单样例:20082115575546011022  
  70.   生成订单数:8000  
  71.   过滤重复后订单数:8000  
  72.   重复订单数:0  
  73. **/ 

最后,代码说明及几点建议

  •  generateOrderNo()方法内不需要加锁,因为AtomicInteger内使用的是CAS自旋转锁(保证可见性的同时也保证原子性,具体的请自行了解)
  •  getLocalIpSuffix()方法内不需要对不为null的逻辑加同步锁(双向校验锁,整体是一种安全的单例模式)
  •  本人实现的方式并不是解决问题的唯一方式,具体解决问题需要视当前系统架构具体而论
  •  任何测试都是必要的,我同事在前几次尝试解决这个问题后都没有自测,不测试有损开发专业性!

好了,本文到这里了,如果你想看往期同事牛逼系列干货,可以关注公众号Java技术栈进行阅读。 

责任编辑:庞桂玉 来源: Java技术栈
相关推荐

2021-12-28 06:55:09

事故订单号绩效

2024-03-14 10:30:05

缓存场景DEMO

2024-10-14 12:05:56

2021-07-01 06:58:12

高并发订单号SCM

2019-08-23 08:09:18

订单号生成数据库ID

2024-06-04 08:19:34

2022-07-11 13:58:14

数据库业务流程系统

2023-01-16 14:49:00

MongoDB数据库

2021-12-27 07:25:13

项目软件开发

2022-09-07 09:09:13

高并发架构

2021-03-19 09:04:15

订单事故系统

2024-09-04 08:55:56

2019-08-15 11:11:38

Java数据库设计

2022-06-30 19:00:00

高可用KeepalivedLinux

2021-03-05 22:41:55

CDH集群CDH集群

2020-08-24 07:34:39

网络超时请求

2021-12-02 07:50:30

NFS故障内存

2022-11-03 16:10:29

groovyfullGC

2020-03-20 08:00:32

代码程序员追求

2022-05-12 09:52:09

网络架构HTTP跨域保护机制
点赞
收藏

51CTO技术栈公众号