用单库自增键来生成id了,后期怎么分库?哎,这个坑大!

开发 开发工具 前端
今天和大家一起简单探讨下,id生成要考虑哪些要素。画外音:别误会,不是说“自增id”不好,是说它与业务耦合了,难以升级。

星球水友“写代码的”提问:

沈老师,我们现在用户中心是单库单表,uid使用数据库自增主键,uid被很多业务关联,不能变化。

现在用户中心数据量逐步变大,有分库需求了,如何由单库升级为多库,保持历史uid不变,并且新生成的数据不冲突,有什么好办法么?

==问题描述完==

应该有不少公司都会利用数据库“插入数据自动自增id”来作为业务id,这种方法会使得业务与id生成强耦合,导致id生成算法难以升级。

今天和大家一起简单探讨下,id生成要考虑哪些要素。画外音:别误会,不是说“自增id”不好,是说它与业务耦合了,难以升级。

[[275323]]

一、id生成要考虑的技术点

几乎所有业务,都会有一个业务唯一标识:

  • 用户标识:uid(user-id)
  • 消息标识:mid(msg-id)
  • 订单标识:oid(order-id)

这个标识,在存储系统里通常是主键,主键使用聚集索引(clustered-index),即在物理存储上以这个id排序。于是,对这个id有:唯一性,趋势递增性的要求。

画外音:索引《1分钟了解不同索引的差异》。

这个标识,也经常被用来做流量负载均衡,数据负载均衡的依据,即这个id必须在统计上必须是完全随机的。于是,对这个id有:随机性的要求。

同时,id生成算法升级,理论上对业务系统是透明的。于是,对这个id的生成有:独立性需求。

为了保证id生成的上述特性,要有一个:

  1. uint64_t GenID() 

的独立方法(或者独立接口)来生成id,生成id具体做什么用,该方法不关心,可以是用来做uid,也可以是用来做oid,甚至log-id。

当然,id生成的具体细节,业务也不用关心。即,GenID()的内部实现,可以是利用数据库的自增id,也可以使用时间递增,目前行业内最流行的,是仿照snowflake生成分布式id。

这个封装,屏蔽了id生成的细节,保留方案升级的可能性,是系统设计中,解耦的体现。 如果使用了此类方法生成业务id,数据库由单库扩展多库就很容易了:

  • 确定一个路由算法,例如hash取模;
  • 将单库中的数据,通过这个路由算法迁移到多库中去,以实现单库数据量的减少;
  • 通过这个路由算法寻找数据(读);
  • 通过这个路由算法插入数据(写);

假如架构设计前期没有提前考虑独立的id生成,后期又要实施单库拆多库,该怎么办呢?

二、针对星球水友提到的例子

历史的坑已经铸成,没有解耦id生成方法,而且也没法批量修改id,该怎么办呢?

假设由单库拆分为3库,可以这么玩:

做一个1主2从数据库集群,相当于每条数据复制成了3份;

  • 将路由算法,设为取模hash算法,%3;
  • 第一个库,%3=0,把余1和余2的uid删掉;
  • 第二个库,%3=1,把余0和余2的uid删掉;
  • 第三个库,%3=2,把余0和余1的uid删掉;
  • 将每个库的自增步长设置为3,这样每个库的id生成就不会重复了;
  • 升级用户中心,按照路由算法查询uid数据;

搞定,拆库扩容达成:

  • 单库数据量下降为了原来的1/3;
  • 读写实例个数扩充为了原来的3倍;
  • 并且id生成与查询都不会冲突;

希望这个取巧的方法对你有帮助。

但更希望,大伙提前考虑id生成的唯一性、随机性、趋势递增性、独立性。

系统性考虑问题,知其然,知其所以然。

【本文为51CTO专栏作者“58沈剑”原创稿件,转载请联系原作者】

戳这里,看该作者更多好文

 

责任编辑:赵宁宁 来源: 51CTO
相关推荐

2024-11-11 00:00:06

MySQLID数据类型

2022-11-08 19:30:52

DjangoID自增

2011-01-18 09:47:33

自增ID

2020-08-21 13:15:29

开发技能代码

2018-12-14 15:35:20

MySQL索引数据库

2010-03-29 14:09:12

Oracle ID 自

2009-02-04 08:52:55

动态页面XMLXSL

2023-11-30 09:09:53

数据库Java

2023-10-17 09:41:04

自增主键MySQL

2023-10-24 15:27:33

Mysql自增主键

2024-06-14 08:34:36

2020-03-28 15:50:18

数据库自增ID维护

2022-06-24 09:22:15

MySQL自增id

2022-06-03 08:12:52

InnoDB插入MySQL

2020-07-17 07:15:38

数据库ID代码

2024-01-17 14:42:24

分库分表数据库数据分片

2019-09-18 15:49:06

MySQL数据库面试官

2024-07-01 09:00:16

2011-08-19 09:45:02

DB4O设置自增ID

2010-04-30 12:15:42

Oracle自增ID
点赞
收藏

51CTO技术栈公众号