在单机系统中我们会使用自增id作为数据的唯一id,自增id在数据库中有利于排序和索引,但是在分布式系统中如果还是利用数据库的自增id会引起冲突,自增id非常容易被爬虫爬取数据。在分布式系统中有使用uuid作为数据唯一id的,但是uuid是一串随机字符串,所以它无法被排序。
Twitter设计了Snowflake算法为分布式系统生成ID,Snowflake的id是int64类型,它通过datacenterId和workerId来标识分布式系统,下面看下它的组成:
在使用Snowflake生成id时,首先会计算时间戳timestamp(当前时间 - 纪元时间),如果timestamp数据超过41bit则异常。同样需要判断datacenterId和workerId不能超过5bit(0-31),在处理自增序列时,如果发现自增序列超过12bit时需要等待,因为当前毫秒下12bit的自增序列被用尽,需要进入下一毫秒后自增序列继续从0开始递增。
git clone https://github.com/GUAIK-ORG/go-snowflake.git
go run main.go
// NewSnowflake(datacenterid, workerid int64) (*Snowflake, error) // 参数1 (int64): 数据中心ID (可用范围:0-31) // 参数2 (int64): 机器ID (可用范围:0-31) // 返回1 (*Snowflake): Snowflake对象 | nil // 返回2 (error): 错误码 s, err := snowflake.NewSnowflake(int64(0), int64(0)) if err != nil { glog.Error(err) return }
s, err := snowflake.NewSnowflake(int64(0), int64(0)) // ...... // (s *Snowflake) NextVal() int64 // 返回1 (int64): 唯一ID id := s.NextVal() // ......
// ...... // GetDeviceID(sid int64) (datacenterid, workerid int64) // 参数1 (int64): 唯一ID // 返回1 (int64): 数据中心ID // 返回2 (int64): 机器ID datacenterid, workerid := snowflake.GetDeviceID(id))
// ...... // GetTimestamp(sid int64) (timestamp int64) // 参数1 (int64): 唯一ID // 返回1 (int64): 从epoch开始计算的时间戳 t := snowflake.GetTimestamp(id)
// ...... // GetGenTimestamp(sid int64) (timestamp int64) // 参数1 (int64): 唯一ID // 返回1 (int64): 唯一ID生成时的时间戳 t := snowflake.GetGenTimestamp(id)
// ...... // GetGenTime(sid int64) // 参数1 (int64): 唯一ID // 返回1 (string): 唯一ID生成时的时间 tStr := snowflake.GetGenTime(id)
// ...... // GetTimestampStatus() (state float64) // 返回1 (float64): 时间戳字段使用占比(范围 0.0 - 1.0) status := snowflake.GetTimestampStatus()