解析MySQL索引的作用


Posted in MySQL onMarch 03, 2022

面试题:索引的作用?

首先建立一张数据库表:

create table single_table(
	id int not auto_increment, 
	key1 varchar(100),         
	key2 int,
	key3 varchar(100),
	key_part1 varchar(100),
	key_part2 varchar(100),
	key_part3 varchar(100),
    common_field varchar(100),
	primary key(id),          # 聚簇索引
	key idx_key1(key1),       # 二级索引
	unique key uk_key2(key2), # 二级索引,而且该索引是唯一二级索引
	key idx_key3(key3),       # 二级索引
	key idx_key_part(key_part1,key_part2,key_part3) # 二级索引,也是联合索引
)Engine=InnoDB CHARSET=utf8;

1、索引用于减少需要扫描的记录数量

对于某个查询来说,最简单粗暴的执行方案就是扫描表中的所有记录,判断每一条搜索记录是否符合搜索条件。如果符合,就将其发送到客户端,否则就跳过该记录。这种执行方案被称为全表扫描。

对于InnoDB存储引擎来说,全表扫描意味着从聚簇索引第一个叶子节点的第一条记录开始,沿着记录所在的单向链表向后扫描,直到最后一个叶子节点的最后一条记录,如果可以利用B+树查找索引列值等于某个值的记录,这样就可以减少需要扫描的记录的数量。

由于B+树叶子节点中的记录是按照索引列值有小到大的顺序排序的,所以只需要扫描某个区间或者某些区间中的记录也可以明显减少需要扫描的记录的数量。

对于查询语句:

select * from single_table where id>=2 and id<=100;

这个语句其实就是想查找id值在[2,100]区间中的所有聚簇索引记录,我们可以通过聚簇索引对应的B+树快速的找到id=2的那条聚簇索引记录,然后沿着记录所在的单向链表向后扫描,直到某条聚簇索引记录的id值不在[2,100]区间中为止,与扫描全部的聚簇索引记录相比,这种方式大大减少了需要扫描的记录数量,所以提升了查询效率。

其实,对于B+树来说,只要索引列和常数使用=、<=>、in、not in、is null、is not null、>、<、>=、<=、between、!=、或者like操作符连接起来,就可以产生扫描区间,从而提高查询效率。

2、索引用于排序

我们在编写查询语句时,经常需要使用order by子句对查询出来的记录按照某种规则进行排序。在一般情况下,我们只能把记录加载到内存中,然后再用一些排序算法在内存中对这些记录进行排序。有时查询的结果集可能太大以至于在内存中无法进行排序,此时就需要暂时借助磁盘的空间来存放中间结果,在排序操作完成后再把排序的结果返回给客户端。

在MySQL中,这种在内存中或者磁盘中进行排序的方式称为文件排序,但是如果order by子句中使用了索引列,就有可能省去在内存或磁盘中排序的步骤。

1、分析下面的查询语句:

select * form single_table order by key_part1,key_part2,key_part3 limit 10;

这个查询语句的结果集需要先按照key_part1值排序,如果记录的key_part1值相同,再按照key_part2值排序,如果key_part1值和key_part2值都相同,再按照key_part3排序。而我们建立的联合索引idx_key_part就是按照上面的规则排序的,如下为idx_key_part索引的简化示意图:

解析MySQL索引的作用

所以我们可以从第一条idx_key_part二级索引记录开始,沿着记录所在的单向链表向后扫描,取10条二级索引记录即可。由于我们的查询列表是*,也就是需要读取完整的用户记录,所以针对获取到的每一条二级索引记录都执行一次回表操作,将完整的用户记录发送给客户端。这样就省去了给10000条记录排序的时间。

这里我们在执行查询语句时加了limit语句,如果不限制需要获取的记录数量,会导致为大量二级索引记录执行回表操作,这样会影响整体的性能。

2、使用联合索引进行排序时的注意事项

在使用联合索引时,需要注意:order by子句后面的列的顺序也必须按照索引列的顺序给出;如果给出order by key_part3,key_part2,key_part1的顺序,则无法使用B+树索引。

之所以颠倒排序列顺序就不能使用索引,原因还是联合索引中页面和记录的排序规则是规定的,即先按照key_part1值排序,如果记录的key_part1值相同,再按照key_part2值排序,如果记录的key_part1值和key_part2值都相同,再按照key_part3值排序。如果order by子句的内容是order by key_part3,key_part2,key_part1,那就要求先按照key_part3值排序,如果记录的key_part3值相同,再按照key_part2值排序,如果记录的key_part3值和key_part2值都相同,再按照key_part1值排序,这显然是冲突的。

3、不可以使用索引进行排序的情况:

(1) ASC、DESC混用;

对于使用联合索引进行排序的场景,我们要求各个排序列的排序规则是一致的,也就是要么各个列都是按照升序规则排序,要么都是按照降序规则排序。

(2) 排序列包含非一个索引的列;

有时用来排序的多个列不是同一个索引中的,这种情况也不能使用索引进行排序,比如下面的查询语句:

select * from single_table order by key1,,key2 limit 10;

对于idx_key1的二级索引记录来说,只按照key1列的值进行排序,而且在key1列相同的情况下是不按照

key2列的值进行排序的,所以不能使用idx_key1索引执行上述查询。

(3) 排序列是某个联合索引的索引列,但是这些排序列在联合索引中并不连续;

(4) 排序列不是以单独列名的形式出现在order by子句中;

3、索引用于分组

有时为了方便统计表中的一些信息,会把表中的记录按照某些列进行分组。比如下面的分组查询语句:

select key_part1,key_part2,key_part3,count(*) fron single_table group by key_part1,key_part2,key_part3;

这个查询语句相当于执行了3次分组操作:

  • 先按照key_part1值把记录进行分组,key_part1值相同的所有记录划分为一组;
  • key_part1值相同的每个分组中的记录再按照key_part2的值进行分组,将key_part2值相同的记录放到一个小分组中,看起来像是在一个大分组中又细分了好多小分组。
  • 再将上一步中产生的小分组按照key_part3的值分成更小的分组。所以整体上看起来就像是先把记录分成一个大分组,然后再把大分组分成若干个小分组,最后把若干个小分组再细分为更多的小分组。

上面这个查询语句就是统计每个小小分组包含的记录条数。

如果没有idx_key_part索引,就得建立一个用于统计的临时表,在扫描聚簇索引的记录时将统计的中间结果填入这个临时表。当扫描完记录后,再把临时表中的结果作为结果集发送给客户端。

如果有了idx_key_part索引,恰巧这个分组顺序又与idx_key_part的索引列的顺序一致,因此可以直接使用idx_key_part的二级索引进行分组,而不用建立临时表了。

与使用B+树索引进行排序差不多,分组列的顺序页需要与索引列的顺序一致,也可以值使用索引列中左边连续的列进行分组。

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!   

MySQL 相关文章推荐
MySQL慢查询的坑
Apr 28 MySQL
MySQL 使用自定义变量进行查询优化
May 14 MySQL
Mysql基础知识点汇总
May 26 MySQL
MySQL下使用Inplace和Online方式创建索引的教程
May 26 MySQL
安装配置mysql及Navicat prenium的详细流程
Jun 10 MySQL
mysql连接查询中and与where的区别浅析
Jul 01 MySQL
MySQL系列之三 基础篇
Jul 02 MySQL
MySQL系列之十 MySQL事务隔离实现并发控制
Jul 02 MySQL
SQL实现LeetCode(180.连续的数字)
Aug 04 MySQL
一文弄懂MySQL索引创建原则
Feb 28 MySQL
MySQL视图概念以及相关应用
Apr 19 MySQL
MySQL中JOIN连接的基本用法实例
Jun 05 MySQL
Arthas排查Kubernetes中应用频繁挂掉重启异常
Feb 28 #MySQL
一文搞懂MySQL索引页结构
MySQL七大JOIN的具体使用
一文弄懂MySQL索引创建原则
一文了解MySQL二级索引的查询过程
Mysql数据库表中为什么有索引却没有提高查询速度
教你如何让spark sql写mysql的时候支持update操作
Feb 15 #MySQL
You might like
php去掉文件前几行的方法
2015/07/29 PHP
PHP模板引擎Smarty自定义变量调解器用法
2016/04/11 PHP
PHP简单数据库操作类实例【支持增删改查及链式操作】
2016/10/10 PHP
IE bug table元素的innerHTML
2010/01/11 Javascript
跟着JQuery API学Jquery 之三 筛选
2010/04/09 Javascript
javascript dom 基本操作小结
2010/04/11 Javascript
Javascript的一种模块模式
2010/09/08 Javascript
VBS通过WMI监视注册表变动的代码
2011/10/27 Javascript
jquery中dom操作和事件的实例学习 下拉框应用
2011/12/01 Javascript
FusionCharts图表显示双Y轴双(多)曲线
2012/11/22 Javascript
js实现window.open不被拦截的解决方法汇总
2014/10/30 Javascript
jquery实现的动态回到顶部特效代码
2015/10/28 Javascript
JS在浏览器中解析Base64编码图像
2017/02/09 Javascript
ajax +NodeJS 实现图片上传实例
2017/06/06 NodeJs
详解Vue基于 Nuxt.js 实现服务端渲染(SSR)
2018/04/05 Javascript
jQuery阻止事件冒泡实例分析
2018/07/03 jQuery
vue-cli 3.x 配置Axios(proxyTable)跨域代理方法
2018/09/19 Javascript
Node.js fs模块(文件模块)创建、删除目录(文件)读取写入文件流的方法
2019/09/03 Javascript
javascript设计模式 ? 访问者模式原理与用法实例分析
2020/04/26 Javascript
vue-以文件流-blob-的形式-下载-导出文件操作
2020/08/07 Javascript
Vue——前端生成二维码的示例
2020/12/19 Vue.js
零基础写python爬虫之urllib2使用指南
2014/11/05 Python
Python 正则表达式入门(初级篇)
2016/12/07 Python
Python中使用logging和traceback模块记录日志和跟踪异常
2019/04/09 Python
python读取excel数据绘制简单曲线图的完整步骤记录
2020/10/30 Python
详解如何在css中引入自定义字体(font-face)
2018/05/17 HTML / CSS
Shopee印度尼西亚:东南亚与台湾市场最大电商平台
2018/06/17 全球购物
阿迪达斯新加坡官方网站:adidas新加坡
2019/12/06 全球购物
幼儿园教研活动总结
2014/04/30 职场文书
行政秘书工作自我鉴定
2014/09/15 职场文书
2014年十一国庆节爱国演讲稿
2014/09/23 职场文书
群众路线自我剖析材料
2014/10/08 职场文书
python 爬取豆瓣网页的示例
2021/04/13 Python
使用numpy nonzero 找出非0元素
2021/05/14 Python
MySQL中的全表扫描和索引树扫描
2022/05/15 MySQL
Python+pyaudio实现音频控制示例详解
2022/07/23 Python