解析MySQL索引的作用


Posted in MySQL onMarch 03, 2022

面试题:索引的作用?

首先建立一张数据库表:

create table single_table(
	id int not auto_increment, 
	key1 varchar(100),         
	key2 int,
	key3 varchar(100),
	key_part1 varchar(100),
	key_part2 varchar(100),
	key_part3 varchar(100),
    common_field varchar(100),
	primary key(id),          # 聚簇索引
	key idx_key1(key1),       # 二级索引
	unique key uk_key2(key2), # 二级索引,而且该索引是唯一二级索引
	key idx_key3(key3),       # 二级索引
	key idx_key_part(key_part1,key_part2,key_part3) # 二级索引,也是联合索引
)Engine=InnoDB CHARSET=utf8;

1、索引用于减少需要扫描的记录数量

对于某个查询来说,最简单粗暴的执行方案就是扫描表中的所有记录,判断每一条搜索记录是否符合搜索条件。如果符合,就将其发送到客户端,否则就跳过该记录。这种执行方案被称为全表扫描。

对于InnoDB存储引擎来说,全表扫描意味着从聚簇索引第一个叶子节点的第一条记录开始,沿着记录所在的单向链表向后扫描,直到最后一个叶子节点的最后一条记录,如果可以利用B+树查找索引列值等于某个值的记录,这样就可以减少需要扫描的记录的数量。

由于B+树叶子节点中的记录是按照索引列值有小到大的顺序排序的,所以只需要扫描某个区间或者某些区间中的记录也可以明显减少需要扫描的记录的数量。

对于查询语句:

select * from single_table where id>=2 and id<=100;

这个语句其实就是想查找id值在[2,100]区间中的所有聚簇索引记录,我们可以通过聚簇索引对应的B+树快速的找到id=2的那条聚簇索引记录,然后沿着记录所在的单向链表向后扫描,直到某条聚簇索引记录的id值不在[2,100]区间中为止,与扫描全部的聚簇索引记录相比,这种方式大大减少了需要扫描的记录数量,所以提升了查询效率。

其实,对于B+树来说,只要索引列和常数使用=、<=>、in、not in、is null、is not null、>、<、>=、<=、between、!=、或者like操作符连接起来,就可以产生扫描区间,从而提高查询效率。

2、索引用于排序

我们在编写查询语句时,经常需要使用order by子句对查询出来的记录按照某种规则进行排序。在一般情况下,我们只能把记录加载到内存中,然后再用一些排序算法在内存中对这些记录进行排序。有时查询的结果集可能太大以至于在内存中无法进行排序,此时就需要暂时借助磁盘的空间来存放中间结果,在排序操作完成后再把排序的结果返回给客户端。

在MySQL中,这种在内存中或者磁盘中进行排序的方式称为文件排序,但是如果order by子句中使用了索引列,就有可能省去在内存或磁盘中排序的步骤。

1、分析下面的查询语句:

select * form single_table order by key_part1,key_part2,key_part3 limit 10;

这个查询语句的结果集需要先按照key_part1值排序,如果记录的key_part1值相同,再按照key_part2值排序,如果key_part1值和key_part2值都相同,再按照key_part3排序。而我们建立的联合索引idx_key_part就是按照上面的规则排序的,如下为idx_key_part索引的简化示意图:

解析MySQL索引的作用

所以我们可以从第一条idx_key_part二级索引记录开始,沿着记录所在的单向链表向后扫描,取10条二级索引记录即可。由于我们的查询列表是*,也就是需要读取完整的用户记录,所以针对获取到的每一条二级索引记录都执行一次回表操作,将完整的用户记录发送给客户端。这样就省去了给10000条记录排序的时间。

这里我们在执行查询语句时加了limit语句,如果不限制需要获取的记录数量,会导致为大量二级索引记录执行回表操作,这样会影响整体的性能。

2、使用联合索引进行排序时的注意事项

在使用联合索引时,需要注意:order by子句后面的列的顺序也必须按照索引列的顺序给出;如果给出order by key_part3,key_part2,key_part1的顺序,则无法使用B+树索引。

之所以颠倒排序列顺序就不能使用索引,原因还是联合索引中页面和记录的排序规则是规定的,即先按照key_part1值排序,如果记录的key_part1值相同,再按照key_part2值排序,如果记录的key_part1值和key_part2值都相同,再按照key_part3值排序。如果order by子句的内容是order by key_part3,key_part2,key_part1,那就要求先按照key_part3值排序,如果记录的key_part3值相同,再按照key_part2值排序,如果记录的key_part3值和key_part2值都相同,再按照key_part1值排序,这显然是冲突的。

3、不可以使用索引进行排序的情况:

(1) ASC、DESC混用;

对于使用联合索引进行排序的场景,我们要求各个排序列的排序规则是一致的,也就是要么各个列都是按照升序规则排序,要么都是按照降序规则排序。

(2) 排序列包含非一个索引的列;

有时用来排序的多个列不是同一个索引中的,这种情况也不能使用索引进行排序,比如下面的查询语句:

select * from single_table order by key1,,key2 limit 10;

对于idx_key1的二级索引记录来说,只按照key1列的值进行排序,而且在key1列相同的情况下是不按照

key2列的值进行排序的,所以不能使用idx_key1索引执行上述查询。

(3) 排序列是某个联合索引的索引列,但是这些排序列在联合索引中并不连续;

(4) 排序列不是以单独列名的形式出现在order by子句中;

3、索引用于分组

有时为了方便统计表中的一些信息,会把表中的记录按照某些列进行分组。比如下面的分组查询语句:

select key_part1,key_part2,key_part3,count(*) fron single_table group by key_part1,key_part2,key_part3;

这个查询语句相当于执行了3次分组操作:

  • 先按照key_part1值把记录进行分组,key_part1值相同的所有记录划分为一组;
  • key_part1值相同的每个分组中的记录再按照key_part2的值进行分组,将key_part2值相同的记录放到一个小分组中,看起来像是在一个大分组中又细分了好多小分组。
  • 再将上一步中产生的小分组按照key_part3的值分成更小的分组。所以整体上看起来就像是先把记录分成一个大分组,然后再把大分组分成若干个小分组,最后把若干个小分组再细分为更多的小分组。

上面这个查询语句就是统计每个小小分组包含的记录条数。

如果没有idx_key_part索引,就得建立一个用于统计的临时表,在扫描聚簇索引的记录时将统计的中间结果填入这个临时表。当扫描完记录后,再把临时表中的结果作为结果集发送给客户端。

如果有了idx_key_part索引,恰巧这个分组顺序又与idx_key_part的索引列的顺序一致,因此可以直接使用idx_key_part的二级索引进行分组,而不用建立临时表了。

与使用B+树索引进行排序差不多,分组列的顺序页需要与索引列的顺序一致,也可以值使用索引列中左边连续的列进行分组。

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!   

MySQL 相关文章推荐
MySQL复制问题的三个参数分析
Apr 07 MySQL
详解MySQL事务的隔离级别与MVCC
Apr 22 MySQL
MySQL5.7并行复制原理及实现
Jun 03 MySQL
低版本Druid连接池+MySQL驱动8.0导致线程阻塞、性能受限
Jul 01 MySQL
MySQL利用UNION连接2个查询排序失效详解
Nov 20 MySQL
MySQL多表查询机制
Mar 17 MySQL
MySQL学习之基础命令实操总结
Mar 19 MySQL
Nebula Graph解决风控业务实践
Mar 31 MySQL
MySQL范围查询优化的场景实例详解
Jun 10 MySQL
MySQL详解进行JDBC编程与增删改查方法
Jun 16 MySQL
MySQL中dd::columns表结构转table过程及应用详解
Sep 23 MySQL
MySQL实现用逗号进行拼接、以逗号进行分割
Dec 24 MySQL
Arthas排查Kubernetes中应用频繁挂掉重启异常
Feb 28 #MySQL
一文搞懂MySQL索引页结构
MySQL七大JOIN的具体使用
一文弄懂MySQL索引创建原则
一文了解MySQL二级索引的查询过程
Mysql数据库表中为什么有索引却没有提高查询速度
教你如何让spark sql写mysql的时候支持update操作
Feb 15 #MySQL
You might like
浅谈PHP语法(1)
2006/10/09 PHP
php中随机显示图片的函数代码
2011/06/23 PHP
PHP的mysqli_query参数MYSQLI_STORE_RESULT和MYSQLI_USE_RESULT的区别
2014/09/29 PHP
yii,CI,yaf框架+smarty模板使用方法
2015/12/29 PHP
利用jQuery接受和处理xml数据的代码(.net)
2011/03/28 Javascript
JavaScript学习笔记(二) js对象
2011/10/25 Javascript
javascript动态加载二
2012/08/22 Javascript
javaScript让文本框内的最后一个文字的后面获得焦点实现代码
2013/01/06 Javascript
JQuery仿小米手机抢购页面倒计时效果
2014/12/16 Javascript
thinkphp 表名 大小写 窍门
2015/02/01 Javascript
jQuery实现企业网站横幅焦点图切换功能实例
2015/04/30 Javascript
js实现登录框鼠标拖拽效果
2017/03/09 Javascript
详解Angular 4.x Injector
2017/05/04 Javascript
12个非常有用的JavaScript技巧
2017/05/17 Javascript
Angular 4依赖注入学习教程之简介(一)
2017/06/04 Javascript
js推箱子小游戏步骤代码解析
2018/01/10 Javascript
简单理解Vue中的nextTick方法
2018/01/30 Javascript
JS实现的将html转为pdf功能【基于浏览器端插件jsPDF】
2018/02/06 Javascript
使用D3.js+Vue实现一个简单的柱形图
2018/08/05 Javascript
vue鼠标移入添加class样式,鼠标移出去除样式(active)实现方法
2018/08/22 Javascript
WebGL three.js学习笔记之阴影与实现物体的动画效果
2019/04/25 Javascript
小程序富文本提取图片可放大缩小
2020/05/26 Javascript
python字符串连接方式汇总
2014/08/21 Python
python实现封装得到virustotal扫描结果
2014/10/05 Python
Python使用gensim计算文档相似性
2016/04/10 Python
Python文本统计功能之西游记用字统计操作示例
2018/05/07 Python
了解一下python内建模块collections
2020/09/07 Python
python分布式爬虫中消息队列知识点详解
2020/11/26 Python
Python将QQ聊天记录生成词云的示例代码
2021/02/10 Python
CSS3 优势以及网页设计师如何使用CSS3技术
2009/07/29 HTML / CSS
html5 canvas实现圆形时钟代码分享
2013/12/25 HTML / CSS
LN-CC中国:高端男装和女装的奢侈时尚目的地
2019/09/14 全球购物
幼儿园中班上学期评语
2014/04/18 职场文书
公务员党的群众路线教育实践活动学习心得体会
2014/10/30 职场文书
社区五一劳动节活动总结
2015/02/09 职场文书
十七岁的单车观后感
2015/06/12 职场文书