优化关联查询
这个话题基本上整本书都在讨论,这里需要特别提到的是:
- 确保ON或者USING子句中的列上有索引。在创建索引的时候就要考虑到关联的顺序。
- 当表A和表B用列c关联的时候,如果优化器的关联顺序是B、A,那么就不需要在B表的对应列上建上索引。没有用到的索引只会带来额外的负担。一般来说,除非有其他理由,否则只需要在关联顺序中的第二个表的相应列上创建索引。
- 确保任何的GROUP BY和ORDER BY中的表达式只涉及到一个表中的列,这样MySQL才有可能使用索引来优化这个过程。
当升级MySQL的时候需要注意:关联语法、运算符优先级等其他可能会发生变化的地方。因为以前是普通关联的地方可能会变成笛卡儿积,不同类型的关联可能会生成不同的结果
优化LIMIT分页
在系统中需要进行分页操作的时候,我们通常会使用LIMIT加上偏移量的办法实现,同时加上合适的ORDER BY子句。如果有对应的索引,通常效率会不错,否则,MySQL需要做大量的文件排序操作。
一个非常常见又令人头疼的问题就是,在偏移量非常大的时候注”,例如可能是LIMIT1000,20这样的查询,这时MySQL需要查询1 0 020条记录然后只返回***20条,前面10 000条记录都将被抛弃,这样的代价非常高。如果所有的页面被访问的频率都相同,那么这样的查询平均需要访问半个表的数据。要优化这种查询,要么是在页面中限制分
页的数量,要么是优化大偏移量的性能。
优化此类分页查询的一个最简单的办法就是尽可能地使用索引覆盖扫描,而不是查询所有的列。然后根据需要做一次关联操作再返回所需的列。对于偏移量很大的时候,这样做的效率会提升非常大。考虑下面的查询:
- mysql> SELECT film_id,description FROM sakila.film ORDER BY title LIHIT 50,5;
如果这个表非常大,那么这个查询***改写成下面的样子:
- mysql> SELECT film.film_id,Film.description
- -> FROM sakila.film
- ->INNER JOIN(
- -> SELECT film.film_id FROM sakila.film
- -> ORDER BY title LIMIT 50,5
- ->) AS lim USING(film_id);
这里的“延迟关联”将大大提升查询效率,它让MySQL扫描尽可能少的页面,获取需要访问的记录后再根据关联列回原表查询需要的所有列。这个技术也可以用于优化关联查询中的LIMIT子句。
有时候也可以将LIMIT查询转换为已知位置的查询,让MySQL通过范围扫描获得到对应的结果。例如,如果在一个位置列上有索引,并且预先计算出了边界值,上面的查询就可以改写为:
- mysql> SELECT film_id, description FROM sakila.Film
- -> WHERE position BETWEEN so AND 54 0RDER BY position;
对数据进行排名的问题也与此类似,但往往还会同时和GROUP BY混合使用。在这种情况下通常都需要预先计算并存储排名信息。
LIMIT和OFFST的问题,其实是OFFSET的问题.它会导致MySQL扫描大量不需要的行然后再抛弃掉。如果可以使用书签记录上次取数据的位置,那么下次就可以直接从该书签记录的位置开始扫描,这样就可以避免使用OFFSET。例如,若需要按照租借记录做翻页,那么可以根据***一条租借记录向后追溯,这种做法可行是因为租借记录的主键是单调增长的。首先使用下面的查询获得***组结果:
- mysql> SELECT * FROM sakila.rental
- -> ORDER BY rental id DESC LIMIT 20;
假设上面的查询返回的是主键为1 6 049到1 6 03 0的租借记录,那么下一页查询就可以从1 6 030这个点开始:
- mysql> SELECT * FROM sakila*rental
- -> WHERE rental id < 16030,
- -> ORDER BY rental id DESC LIMIT 20;
该技术的好处是无论翻页到多么后面,其性能都会很好。
其他优化办法还包括使用预先计算的汇总表,或者关联到一个冗余表,冗余表只包含主键列和需要做排序的数据列。还可以使用Sphinx优化一些搜索操作,参考附录F可以获得更多相关信息。