58沈剑：用uid分库，uname上的查询怎么办？-uid和uname

一、缘起

用户中心是几乎每一个公司必备的基础服务，用户注册、登录、信息查询与修改都离不开用户中心。

当数据量越来越大时，需要多用户中心进行水平切分。最常见的水平切分方式，按照uid取模分库：

通过uid取模，将数据分布到多个数据库实例上去，提高服务实例个数，降低单库数据量，以达到扩容的目的。

水平切分之后：

uid属性上的查询可以直接路由到库，如上图，假设访问uid=124的数据，取模后能够直接定位db-user1。

对于uname上的查询，就不能这么幸运了：

uname上的查询，如上图，假设访问uname=shenjian的数据，由于不知道数据落在哪个库上，往往需要遍历所有库【扫全库法】，当分库数量多起来，性能会显著降低。

用uid分库，如何高效实现上的查询，是本文将要讨论的问题。

索引表法

思路：uid能直接定位到库，uname不能直接定位到库，如果通过uname能查询到uid，问题解决

解决方案：

潜在不足：多一次数据库查询，性能下降一倍

缓存映射法

思路：访问索引表性能较低，把映射关系放在缓存里性能更佳

解决方案：

潜在不足：多一次cache查询

uname生成uid

思路：不进行远程查询，由uname直接得到uid

解决方案：

潜在不足：该函数设计需要非常讲究技巧，有uid生成冲突风险

uname基因融入uid

思路：不能用uname生成uid，可以从uname抽取“基因”，融入uid中

假设分8库，采用uid%8路由，潜台词是，uid的最后3个bit决定这条数据落在哪个库上，这3个bit就是所谓的“基因”。

解决方案：

总结

业务场景：用户中心，数据量大，通过uid分库后，通过uname路由不到库

解决方案：

【本文为51CTO专栏作者“58沈剑”原创稿件，转载请联系原作者】