需求:在钉钉群个人简介页面需要显示钉钉群名称和简介,每个群成员的别名,以及钉钉群主的个人签名信息。其中需求中所需信息存放在以下四个表中:user,user_profile,groups,user_group。
方案选择
方案1:
先看看最简单的实现方法,一条 SQL 语句搞定所有事情:
- SELECT name,description,user_type,nick_name,sign FROM groups,user_group,user ,user_profile WHERE groups.id =?
- AND groups.id=user_group.group_id AND useruser_group.user_id=user.id AND useruser_profile.user_id=user.id
方案2:
通过稍微复杂一点的方法分两步搞定:
首先取得所有需要展示的 钉钉group 的相关信息和所有钉钉群组员的别名信息和组员类别:
- SELECT name,description,user_type,nick_name FROM groups,user_group,user WHERE groups.id =? AND groups.id=user_group.group_id AND useruser_group.user_id=user.id
然后在程序中通过上面结果集中的 user_type 找到群主的 user_id 再到 user_profile 表中取得钉钉群主的个人签名信息:
- SELECT sign FROM user_profile WHERE user_id =?
方案比较:
以上两种解决方案最大的区别在于交互次数和 SQL 复杂度。而带来的实际影响是第一种解决方案对 user_profile表有不必要的访问(非群主的 profile 信息),造成 IO 访问的直接增加在 20%左右。而在实际应用中,IO 操作在数据库应用系统中是非常昂贵的资源。尤其是当这个功能的 PV 较大的时候,第一种方案造成的 IO 损失是相当大的。
总结
重复执行相同的 SQL 造成资源浪费这个问题其实很多人都知道,但是在应用系统开发过程中,仍然会常有这样的现象存在。究其原因,主要还是开发工程师思维中面向对象的概念太过深入,以及为了减少自己代码开发的逻辑和对程序接口过度依赖所造成的。