在MySQL中用UUID当主键,被组长给喷了!

数据库 MySQL
由于 UUID 是由 MAC 地址、时间戳、随机数等信息生成的,因此 UUID 具有极高的唯一性,可以说是几乎不可能重复,但是在实际实现过程中,UUID有多种实现版本,他们的唯一性指标也不尽相同。

我们在使用MySQL的时候,主键的选择上一般有两种,那就是UUID和自增主键ID,使用这两个做主键各自都有哪些优缺点呢?为什么建议优先使用自增主键ID呢?

UUID唯一吗

UUID(Universally Unique Identifier)全局唯一标识符,是指在一台机器上生成的数字,它的目标是保证对在同一时空中的所有机器都是唯一的。

UUID 的生成是基于一定算法,通常使用的是随机数生成器或者基于时间戳的方式,生成的 UUID 由 32 位 16 进制数表示,共有 128 位(标准的UUID格式为:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx (8-4-4-4-12),共32个字符)

由于 UUID 是由 MAC 地址、时间戳、随机数等信息生成的,因此 UUID 具有极高的唯一性,可以说是几乎不可能重复,但是在实际实现过程中,UUID有多种实现版本,他们的唯一性指标也不尽相同。

UUID在具体实现上,有多个版本,有基于时间的UUID V1,基于随机数的 UUID V4等。

Java中的java.util.UUID生成的UUID是V3和V4两种:

Version 4 这种是最简单的(也是我们最常用的),只是基于随机数生成的,但是也是最不靠谱的。适合数据量不是特别大的场景下。

Version 3是基于名称空间的,所以在一定范围内是唯一的,而且如果有需要生成重复UUID的场景的话,这两种是可以实现的。

UUID的好处

很多人选择UUID作为主键,其实也是有一定道理的,那就是UUID有几何好处:

  • 全局唯一:使用不同的算法生成,虽然不能100%保证唯一,但是在非并发场景下几乎可以保证在全球范围内唯一,避免了多台机器之间主键冲突的问题。
  • 不可预测性:随机生成的 UUID 很难被猜测出来,对于需要保密性的应用场景较为适用。
  • 分布式:由于可以在不同的机器上生成 UUID,因此可以用于分布式系统中,如分库分表场景。

UUID的缺点

但是,如果只是因为这几个好处就选择UUID当做主键ID的话,那么也不是很好的方案,因为他的缺点也比较明显,如:

存储空间比较大:UUID 通常以字符串形式存储,占用的存储空间比较大。

不适合范围查询:因为不是自增的,所以在做范围查询的时候是不支持的。

不方便展示:主键ID有的时候会需要在系统间、或者前台页面展示,如果是UUID的话,就因为比较长、并且没有任何业务含义,所以不方便展示。

查询效率低:

在UUID列上创建索引,因为他很长,所以索引的大小会变得非常大。大的索引会占用更多的磁盘空间,导致缓存命中率下降,进而增加了磁盘I/O的需求。此外,大的索引还会导致查询时的内存开销增加。

当使用UUID进行排序时,新的UUID值通常会插入到叶子节点的中间位置。这可能导致B+树的页分裂和平衡操作频繁进行,从而增加了写入的开销。每次分裂或平衡都涉及到数据的重新排序和移动,这会影响查询的性能。

自增ID

在 MySQL 中,可以通过设置 AUTO_INCREMENT 属性实现ID的自增长,通常可以用来作为主键ID。

使用自增ID做主键的好处是:

  • 存储空间:ID是数字,所以占用的位数要比UUID小多了,所以在存储空间上也节省很多。
  • 查询效率:ID 是递增的,因此在使用 B+Tree 索引时,查询效率较高。
  • 方便展示:因为ID比较短,方便展示。
  • 分页方便:因为ID是连续自增的,所以在分页的时候,可以通过ID解决深度分页的问题。

但是,使用自增主键做主键ID也存在一定的问题

  • 分库分表:当我们做分库分表的时候,就没办法依赖一张表的自增主键来做主键ID了,这样就会发生重复导致冲突的问题
  • 可预测:因为ID是顺序自增的,所以是可以预测的,这就给系统带来了一定的安全风险。
  • 可能用尽:自增id的话可能是int、bigint等,但是他们都是有范围的,有可能会用尽

总结

所以,在实际选型过程中,大家需要结合自己的实际业务做选择。

简单的业务场景,数据量不大,增删改查也不频繁,可以选择用UUID。

内部系统,数据量增删改查频繁,有频繁的分页查询和展示等需求,优先选择自增主键ID。

对外系统,数据量不大,也可以选用自增主键ID。

对外系统,数据量大,分库分表,则考虑使用雪花算法生成全局唯一ID。

责任编辑:姜华 来源: Hollis
相关推荐

2024-04-09 08:55:54

MySQL产品模型

2021-04-12 07:32:01

数据库

2020-09-08 09:04:26

uuidMySQL主键

2021-11-05 12:40:43

Python类型语言代码

2021-04-27 19:26:16

代码项目工具

2024-05-29 09:05:17

2022-08-09 08:29:50

TIOBE编程语言排行榜程序员

2023-07-19 21:48:45

2021-02-15 22:07:18

项目策略模式

2021-04-29 07:56:06

LinuxTypeScript项目

2020-08-31 11:20:53

MySQLuuidid

2020-12-24 11:40:04

微信更新移动应用

2024-10-24 09:22:30

2021-03-11 16:45:29

TCP程序C语言

2016-08-08 15:03:54

腾讯云电商腾讯云天御系统

2019-02-12 15:00:32

Javascript命令式编程前端

2020-12-14 13:39:39

AI人工智能算法

2013-06-20 11:11:00

程序员经理

2021-07-30 20:34:28

LinuxFedorabpftrace

2020-12-14 15:26:38

AIAI算法
点赞
收藏

51CTO技术栈公众号