数据库 MySQL

MySQL 分组查询的优化方法

Posted in MySQL onMay 12, 2021

MySQL 在处理 GROUP BY 和 DISTINCT 查询的方式在大多数情况下类似，事实上，在优化过程中有时候会把在这两种方式中转换。两类查询都能够从索引中受益，通常，这也是优化这两种查询最为重要的方式。

在无法使用索引时，MySQL 对于 GROUP BY 查询有两种策略：使用临时表或者 filesort 执行分组。对于给定的查询，两种方式都没法更高效。我们可以通过配置 SQL_BIG_RESULT 和 SQL_SMALL_RESULT 来指定优化器选择其中一个方式。

通常，对查询表的id 进行分组比使用值进行分组效率更高，例如下面的查询效率就比较低：

SELECT actor.first_name, actor.last_name, COUNT(*)
FROM sakila.file_actor
INNER JOIN sakila.actor USING(actor_id)
GROUP BY actor.first_name, actor.last_name;

而下面的查询方式则更有效：

SELECT actor.first_name, actor.last_name, COUNT(*)
FROM sakila.file_actor
INNER JOIN sakila.actor USING(actor_id)
GROUP BY film_actor.actor_id;

而使用 actor.actor_id 进行分组会比 film_actor.actor_id更高效。

这个查询能够发挥其优势的依据是演员(actor)的姓名是依赖于 actor_id 的，因此会返回相同的结果，但是如果返回的结果不同的话就不能这么做了。甚至有些时候服务端通过 SQL_MODE 配置禁用了 GROUP BY。此时如果不关心获取的值，而且用于分组的列的值是唯一的，这可以使用 MIN和 MAX 来解决这个问题。

SELECT MIN(actor.first_name), MAX(actor.last_name), ...;

对于完美主义者，他们会认为你的分组是错误的，他们也是对的。一个虚拟的 MIN 或 MAX 的结果是查询并不会正确地组装。然而，有时候你只是为了让 MySQL 更快地执行查询。完美主义者对于下面的查询会满意：

SELECT actor.fisrt_name, actor.last_name, c.cnt
FROM sakila.actor
	INNER JOIN (
    SELECT actor_id, COUNT(*) AS cnt
    FROM sakila.film_actor
    GROUP BY actor_id
  ) AS c USING(actor_id);

然而，子查询中创建和填充临时表的代价可能比理论上看起来的死办法更高。需要记住的是，子查询构建的临时表是没有索引的，这会导致性能上的下降。

通常在分组查询中，选择没有分组的列是一个糟糕的主意。这是因为查询结果是不确定的，一旦改变了索引或优化器使用了不同的策略都会导致结果被改变。事实上，我们建议将服务端的 SQL_MODE 设置为 ONLY_FULL_GROUP_BY，这时写了一个糟糕的分组查询时，系统会产生一个错误而不是直接执行。开启 ONLY_FULL_GROUP_BY 后，SELECT 的字段只能是 GROUP BY 指定的字段，此时可以通过构建分步查询或子查询的方式，先分组查出分组的列，再做二次查询。

MySQL 会根据 GROUP BY 指定的列次序自动分组，除非是使用了 ORDER BY 指定排序规则。如果不在乎次序并且发现了这导致了一个 filesort，这时候可以使用 ORDER BY NULL 来跳过自动排序。也可以通过在 GROUP BY 后面增加 DESC 或 ASC 来指定结果按指定的方向排序。

有时候可以在分组查询时要求 MySQL 在结果中做一次超级聚合。这可以通过在 GROUP BY 后面增加WITH ROLLUP 子句完成，但是这不一定能够达到优化的预期。可以通过 EXPLAIN 检查执行的方法，注意分组有没有通过 filesort 或临时表完成。然后在对相同的查询移除 WITH ROLLUP 后进行对比。通过对比也许可以找到优化的办法。

有些时候通过增加聚合查询会使得效率更高，虽然这种方式会返回更多的行。也可以通过在 FROM 后面嵌套子查询来保持中间查询结果，然后再使用 UNION 获取最终结果。

但是注意的是，在应用程序中最好是移除 WITH ROLLUP，而通过优化来完成分组查询。

结语：使用 GROUP BY 进行分组查询时最好是使用索引列分组，若无需指定次序可以使用 ORDER BY NULL 进行优化。倘若不按索引列分组的时候，则需要考虑变通的办法，并且考虑是否要使用子查询或使用 WITH ROLLUP 检查性能后再做优化。同时，为了防止分组查询出现不可预料的错误，最好是开启 ONLY_FULL_GROUP_BY。

以上就是MySQL 分组查询的优化方法的详细内容，更多关于MySQL 分组查询的优化的资料请关注三水点靠木其它相关文章！

MySQL 分组查询的优化方法

- Author -

岛上码农

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

MySQL 相关文章推荐

MySQL infobright的安装步骤

Apr 07 MySQL

IDEA 链接Mysql数据库并执行查询操作的完整代码

May 20 MySQL

Mysql文件存储图文详解

Jun 01 MySQL

Centos7中MySQL数据库使用mysqldump进行每日自动备份的编写

Aug 02 MySQL

mysql中int(3)和int(10)的数值范围是否相同

Oct 16 MySQL

MYSQL 运算符总结

Nov 11 MySQL

Mysql Innodb存储引擎之索引与算法

Feb 15 MySQL

CentOS 7安装mysql5.7使用XtraBackUp备份工具命令详解

Apr 12 MySQL

在MySQL中你成功的避开了所有索引

Apr 20 MySQL

MySQL的存储过程和相关函数

Apr 26 MySQL

MySQL中order by的执行过程

Jun 05 MySQL

MySQL分布式恢复进阶

Jul 23 MySQL

JDBC连接的六步实例代码（与mysql连接）

May 12 #MySQL

MySQL索引知识的一些小妙招总结

MySQL COUNT函数的使用与优化

May 10 #MySQL

解读MySQL的客户端和服务端协议

MySQL 重写查询语句的三种策略

May 10 #MySQL

详解MySQL 联合查询优化机制

mysql对于模糊查询like的一些汇总

May 09 #MySQL

You might like

PHP 日常开发小技巧

2009/09/23 PHP

解析array splice的移除数组中指定键的值,返回一个新的数组

2013/07/02 PHP

php检测iis环境是否支持htaccess的方法

2014/02/18 PHP

PHP小教程之实现双向链表

2014/06/12 PHP

6个超实用的PHP代码片段

2015/08/10 PHP

WordPress中对访客评论功能的一些优化方法

2015/11/24 PHP

利用PHP命令行模式采集股票趋势信息

2016/08/09 PHP

php 自定义错误日志实例详解

2016/11/12 PHP

JS 遮照层实现代码

2010/03/31 Javascript

如何实现textarea里的不同文本显示不同颜色

2014/01/20 Javascript

用js提交表单解决一个页面有多个提交按钮的问题

2014/09/01 Javascript

jquery中append()与appendto()用法分析

2014/11/14 Javascript

原生js与jQuery实现简单的tab切换特效对比

2015/07/30 Javascript

JS模拟bootstrap下拉菜单效果实例

2016/06/17 Javascript

js将字符串中的每一个单词的首字母变为大写其余均为小写

2017/01/05 Javascript

javascript基本常用排序算法解析

2017/09/27 Javascript

AngularJS 中的数据源的循环输出

2017/10/12 Javascript

JS实现的RC4加密算法示例

2018/08/16 Javascript

JS使用栈判断给定字符串是否是回文算法示例

2019/03/04 Javascript

vue+elementUI实现图片上传功能

2019/08/20 Javascript

15 分钟掌握vue-next响应式原理

2019/10/13 Javascript

vue项目页面嵌入代码块vue-prism-editor的实现

2020/10/30 Javascript

Python中input与raw_input 之间的比较

2017/08/20 Python

转换科学计数法的数值字符串为decimal类型的方法

2018/07/16 Python

Django框架中序列化和反序列化的例子

2019/08/06 Python

python cv2在验证码识别中应用实例解析

2019/12/25 Python

python中取绝对值简单方法总结

2020/07/24 Python

给Django Admin添加验证码和多次登录尝试限制的实现

2020/07/26 Python

python 两种方法删除空文件夹

2020/09/29 Python

基于Html5实现的react拖拽排序组件示例

2018/08/13 HTML / CSS

html svg生成环形进度条的实现方法

2019/09/23 HTML / CSS

Hawes & Curtis澳大利亚官网：英国经典服饰品牌

2018/10/29 全球购物

size?荷兰官方网站：英国高级运动鞋精品店

2020/07/24 全球购物

htmlentities() 和 htmlspecialchars()有什么区别

2015/07/01 面试题

县委班子四风对照检查材料思想汇报

2014/09/29 职场文书

JS监听Esc 键触发事键

2021/04/14 Javascript