生成全局唯一ID的雪花算法原理
雪花算法是一种用于生成全局唯一ID的算法,最初由Twitter开发,用于解决分布式系统中生成ID的问题。其核心思想是将一个64位的长整型ID划分成多个部分,每个部分用于表示不同的信息,确保了生成的ID在分布式环境下的唯一性。
ID结构
- 符号位(1位):始终为0,用于保证ID为正数。
- 时间戳(41位):表示生成ID的时间戳,精确到毫秒级。
- 工作节点ID(10位):表示生成ID的机器的唯一标识。
- 序列号(12位):表示在同一毫秒内生成的多个ID的序列号。
生成步骤
- 获取当前时间戳,精确到毫秒级。
- 如果当前时间小于上次生成ID的时间,或者在同一毫秒内生成的ID数量超过最大值,等待下一毫秒再继续生成。
- 如果当前时间等于上次生成ID的时间,序列号自增1。
- 如果当前时间大于上次生成ID的时间,序列号重新从0开始。
- 将各个部分的值组合,得到最终的64位ID。
Go实现雪花算法的高并发ID生成器
package main
import (
"fmt"
"sync"
"time"
)
const (
workerBits = 10
sequenceBits = 12
workerMax = -1 ^ (-1 << workerBits)
sequenceMask = -1 ^ (-1 << sequenceBits)
timeShift = workerBits + sequenceBits
workerShift = sequenceBits
epoch = 1609459200000
)
type Snowflake struct {
mu sync.Mutex
lastTime int64
workerID int64
sequence int64
}
func NewSnowflake(workerID int64) *Snowflake {
if workerID < 0 || workerID > workerMax {
panic(fmt.Sprintf("worker ID must be between 0 and %d", workerMax))
}
return &Snowflake{
lastTime: time.Now().UnixNano() / 1e6,
workerID: workerID,
sequence: 0,
}
}
func (sf *Snowflake) NextID() int64 {
sf.mu.Lock()
defer sf.mu.Unlock()
currentTime := time.Now().UnixNano() / 1e6
if currentTime < sf.lastTime {
panic(fmt.Sprintf("clock moved backwards, refusing to generate ID for %d milliseconds", sf.lastTime-currentTime))
}
if currentTime == sf.lastTime {
sf.sequence = (sf.sequence + 1) & sequenceMask
if sf.sequence == 0 {
for currentTime <= sf.lastTime {
currentTime = time.Now().UnixNano() / 1e6
}
}
} else {
sf.sequence = 0
}
sf.lastTime = currentTime
id := (currentTime-epoch)<<timeShift | (sf.workerID << workerShift) | sf.sequence
return id
}
func main() {
sf := NewSnowflake(1) // 假设工作节点ID为1
for i := 0; i < 10; i++ {
id := sf.NextID()
fmt.Println(id)
time.Sleep(time.Millisecond)
}
}
高并发下的唯一性和递增性保障
在高并发场景下,保障雪花算法生成的ID唯一性和递增性的关键在于:
- 唯一性: 工作节点ID的设置保证了不同节点生成的ID不会冲突。序列号的自增和位运算保证了同一毫秒内生成的ID唯一。
- 递增性: 在同一毫秒内生成的多个ID按序列号的递增顺序排列。即使在极端情况下,同一毫秒内生成的ID数量超过了最大值,会等待下一毫秒重新开始,也保证了递增性。
总体来说,雪花算法在高并发下是一个可靠的ID生成方案。它的高性能和低碰撞概率使得它在分布式系统中被广泛应用。