MySQL 覆盖索引的优点


Posted in MySQL onMay 19, 2021

一个通常的建议是为WHERE条件创建索引,但这其实是片面的。索引应当为全部查询设计,而不仅仅是WHERE条件。索引确实能有效地查找数据行,但MySQL也能够使用索引获取列数据,这样根本不需要去读取一行数据。毕竟,索引的叶子节点包含了索引对应的值。当年能够读取索引就能够拿到想要的数据时为什么还去读数据行呢?当索引包含了所有查询的数据时,这个索引就称之为覆盖索引。

覆盖索引能够成为一个非常有力的工具并且能够显著改善性能。考虑一下不读数据只需要读取索引的情况:

  • 索引值通常会比整个行存储空间小很多,因此MySQL只读取索引值时可以只读取很少的数据。这对于缓存负荷来说十分重要——响应时间大部分消耗在复制数据。对于磁盘I/O而言也是一样,因为索引数据相比行数据存储空间小很多,因此更节省I/O负载和内存占用(对于MyISAM引擎更显著,因为MyISAM可以将索引打包使得存储空间更小)。
  • 索引是按索引值的顺序存储的,因此I/O访问跨度相比随机磁盘位置获取行数据而言消耗的I/O频次更少。对于某些存储引擎,例如MyISAM和Percona XtraDB,你甚至能够使用OPTIMIZE优化表获得完全有序的索引,这会使得简单范围的查询完全使用顺序访问。
  • 有些存储引擎,例如MyISAM,MySQL内存中只缓存索引。由于操作系统为MyISAM缓存了数据,访问时通常需要一个系统调用。这可能导致巨大的性能影响,尤其是对于缓存负荷场景来说,系统调用对于数据访问来说是最昂贵的代价。
  • 由于InnoDB的聚集索引,覆盖索引对于InnoDB来说十分有帮助。InnoDB的辅助索引在其叶子节点中保存了行的主键值。因此,辅助索引覆盖查询后可以避免进行主键查询。

在所有的场景中,最典型的就是相比查找数据行,只包含索引列的查询的代价相当低。需要注意的是,聚集索引并不是任意类型的索引。聚集索引必须存储索引数据列对应的值。哈希,空间和全文索引并没有存储这些值,因此MySQL只能使用二叉树去覆盖查询。而且,不同的存储引擎实现覆盖索引的方式不同,并且并不是全部的存储引擎都支持覆盖索引(例如Memory存储引擎当前就不支持)。

当你验证查询中索引使用了覆盖索引时,使用Explain语句时,会在Extra列中看到“Using index”。例如,在store_goods表有一个(shop_id, goods_category_id1)的多列索引。MySQL可以在查询返回数据只有这两列时使用索引:

EXPLAIN SELECT `goods_category_id1`,`shop_id` FROM `store_goods` WHERE 1

MySQL 覆盖索引的优点

覆盖索引查询在某些情况会让这样的优化失效。MySQL查询优化器在执行查询时会判断索引是否覆盖到。假设索引覆盖了WHERE条件,但没有覆盖整个查询。如果评估结果决定不走覆盖索引,那么MySQL 5.5及以前的版本会直接获取数据行,即便是不需要这些数据,然后才会过滤掉。

让我们看一下为什么这种情况会发生,然后如何重写查询以便解决这个问题。首先查询是这样的:

EXPLAIN SELECT * FROM products WHERE actor='SEAN CARREY' AND title like '%APOLLO%'

这个时候的结果是不会走覆盖索引,而是普通的索引,这是因为:

  • 没有索引覆盖了查询数据列,因为我们从数据表读取了全部列并且没有索引列覆盖了全部列。理论上,MySQL还有一个快捷方式可以使用,那就是WHERE条件中使用了索引覆盖的列,因此MySQL可以先使用这个索引找到对应的actor,然后在检查他们的title是否匹配,然后在读取满足条件的全部的数据行。
  • 对于早期的低版本的存储引擎API(MySQL 5.5以前的版本)来说,MySQL无法在索引中使用LIKE操作,而只支持简单的比较操作(=,IN,>=)。MySQL可以在索引中使用前缀匹配的LIKE查询,这是因为它可以将它们转换为比较操作。但是前导通配符(也就是LIKE中前置的%)导致存储引擎无法评估匹配条件。因此,MySQL会获取行数据再比较,而不是索引的值。

有一种方式可以使用巧妙的组合索引和重写查询条件。我们可以将索引扩展到(artist, title, prod_id),然后像下面那样重写查询语句:

EXPLAIN SELECT * 
FROM products
	JOIN (
    SELECT prod_id
    FROM products
    WHERE actor='SEAN CARREY' AND TITLE LIKE '%APOLLO%'
 ) AS t1 ON (t1.prod_id=products.prod_id)

MySQL 覆盖索引的优点

我们称之为“递延JOIN(deferred join)”,因为它延迟了列的访问。在第一阶段的查询中,当它在子查询中找到了匹配的行的过程中,MySQL使用了覆盖索引。虽然在整个查询中没有覆盖到,但总比没有的好。

这种优化的效果好坏取决于WHERE条件查找到了多少行数据。假设products表包含了上百万行的数据。可以对比一下这两种查询的性能对比,总的数据为100万行。

  • 第一种情况:有30000个products的actor是“SEAN CARREY”,其中20000个的title包含“APOLLO”;
  • 第二种情况:有30000个products的actor是“SEAN CARREY”,其中40个的title包含“APOLLO”;
  • 第三种情况:有50个products的actor是“SEAN CARREY”,其中10个的title包含“APOLLO”。

对比结果如下表。

 

数据集 原始查询 优化后查询
第一种情况 5qps 5qps
第二种情况 7qps 35qps
第三种情况 2400qps 2000qps

结果的解释如下:

  • 在第一种情况中,查询返回了很大的结果集,因此看不到优化效果。大部分时间花在了读取和发送数据。
  • 在第二种情况中,使用覆盖索引后子查询过滤得到了一个小的结果集,这样优化的效果是性能提升了5倍。产生这种效果的原因是相比查出30000行的数据集,这里只需要读取40行。
  • 第三种情况显示了子查询失效了。覆盖索引过滤返回的结果集太少了,导致子查询的代价比直接从数据表读取数据还要高。

在大多数存储引擎中,一个索引只能够覆盖访问列是索引的一部分。然而,InnoDB实际上会做进一步的优化。想想InnoDB的的辅助索引在叶子节点中存储了主键的值。这意味着InnoDB的辅助索引实际上有了额外的列帮助InnoDB使用覆盖索引。 例如,sakila.actor表使用了InnoDB,然后在last_name有一个索引,因此这个索引能够覆盖或者主键actor_id的查询——即便这个列并不是索引的一部分。

EXPLAIN SELECT actor_id, last_name
FROM sakila.actor WHERE last_name = 'HOPPER'

MySQL 覆盖索引的优点

以上就是MySQL 覆盖索引的优点的详细内容,更多关于MySQL 覆盖索引的资料请关注三水点靠木其它相关文章!

MySQL 相关文章推荐
MySQL sql_mode修改不生效的原因及解决
May 07 MySQL
MySQL时间盲注的五种延时方法实现
May 18 MySQL
MYSQL 无法识别中文的永久解决方法
Jun 03 MySQL
浅谈mysql增加索引不生效的几种情况
Jun 23 MySQL
MySQL的InnoDB存储引擎的数据页结构详解
Mar 03 MySQL
MySQL的索引你了解吗
Mar 13 MySQL
MySQL Server 层四个日志
Mar 31 MySQL
一次Mysql update sql不当引起的生产故障记录
Apr 01 MySQL
MySQL索引 高效获取数据的数据结构
May 02 MySQL
MySQL批量更新不同表中的数据
May 11 MySQL
MySQL sql模式设置引起的问题
May 15 MySQL
Mysql的Table doesn't exist问题及解决
Dec 24 MySQL
MySQL 视图(View)原理解析
超详细教你怎么升级Mysql的版本
详解mysql三值逻辑与NULL
MySQL时间盲注的五种延时方法实现
分析MySQL抛出异常的几种常见解决方式
详解MySQL数据库千万级数据查询和存储
May 18 #MySQL
详解MySQL连接挂死的原因
You might like
人族 Terran 魔法与科技
2020/03/14 星际争霸
PHP的preg_match匹配字符串长度问题解决方法
2014/05/03 PHP
php递归json类实例
2014/12/02 PHP
PHP进阶学习之反射基本概念与用法分析
2019/06/18 PHP
JS显示日历和天气的方法
2016/03/01 Javascript
js实现前端分页页码管理
2017/01/06 Javascript
Canvas + JavaScript 制作图片粒子效果
2017/02/08 Javascript
js中小数向上取整数,向下取整数,四舍五入取整数的实现(必看篇)
2017/02/13 Javascript
基于jQuery的左滑出现删除按钮的示例
2017/08/29 jQuery
30分钟快速实现小程序语音识别功能
2018/11/27 Javascript
使用JavaScript解析URL的方法示例
2019/03/01 Javascript
ES7之Async/await的使用详解
2019/03/28 Javascript
关于JavaScript 数组你应该知道的事情(推荐)
2019/04/10 Javascript
详解vue 在移动端体验上的优化解决方案
2019/05/20 Javascript
[01:06]DOTA2小知识课堂 Ep.01 TP出门不要忘记帮队友灌瓶哦
2019/12/05 DOTA
Python使用urllib模块的urlopen超时问题解决方法
2014/11/08 Python
理解Python中的With语句
2015/02/02 Python
简单解决Python文件中文编码问题
2015/11/22 Python
Django学习笔记之Class-Based-View
2017/02/15 Python
Python常用时间操作总结【取得当前时间、时间函数、应用等】
2017/05/11 Python
浅谈python日志的配置文件路径问题
2018/04/28 Python
python 判断参数为Nonetype类型或空的实例
2018/10/30 Python
Python正则匹配判断手机号是否合法的方法
2020/12/09 Python
django云端留言板实例详解
2019/07/22 Python
Python3 合并二叉树的实现
2019/09/30 Python
Pytest单元测试框架如何实现参数化
2020/09/05 Python
HTML5 3D书本翻页动画的实现示例
2019/08/28 HTML / CSS
AVIS安飞士奥地利租车官网:提供奥地利、欧洲和全世界汽车租赁
2016/11/29 全球购物
全球独特生活方式产品和礼品购物网站:AHAlife
2018/09/18 全球购物
澳大利亚Mocha官方网站:包、钱包、珠宝和配饰
2019/07/18 全球购物
计算机网络及管理学专业求职信
2014/06/05 职场文书
保护环境的标语
2014/06/09 职场文书
社区四风存在问题及整改措施
2014/10/26 职场文书
暑期社会实践新闻稿
2015/07/17 职场文书
三好学生主要事迹怎么写
2015/11/03 职场文书
Mysql 设置boolean类型的操作
2021/06/04 MySQL