一文弄懂MySQL索引创建原则


Posted in MySQL onFebruary 28, 2022
目录

一、适合创建索引

1、字段的数值有唯一性限制

根据Alibaba规范,指明在业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引。

一文弄懂MySQL索引创建原则

例如,学生表中的学号时具有唯一性的字段,为该字段建立唯一性索引可以快速查询出某个学生的信息,如果使用姓名的话,可能存在同名的情况,从而降低查询速度。

2、频繁作为Where查询条件的字段

某个字段在Select语句的Where条件中经常被使用到,那么就需要给这个字段创建索引,尤其实在数据量大的情况下,创建普通索引就可以大幅提升查询效率。

比如测试表student_info有100万数据,假设查询student_id=112322的用户信息,如果没有对student_id字段创建索引,查询结果如下:

select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花费211ms

一文弄懂MySQL索引创建原则

为student_id创建索引后,查询结果如下:

alter table student_info add index idx_sid(student_id);
select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花费3ms

一文弄懂MySQL索引创建原则

3、经常Group by和Order by的列

索引就是让数据按照某种顺序进行存储或检索,因此当使用Group by对数据进行分组查询或使用Order by对数据进行排序的时候 ,就需要对分组或排序的字段进行索引。如果待排序的列有多个,那可以在这些列上建立组合索引。

比如,按照student_id对学生选秀的课程进行分组,显示不同的student_id和课程的数量,显示100条。如果不对student_id创建索引,查询结果如下:

select student_id,count(*) as num from student_info group by student_id limit 100;#花费2.466s

一文弄懂MySQL索引创建原则

为student_id创建索引后,查询结果如下:

alter table student_info add index idx_sid(student_id);
select student_id,count(*) as num from student_info group by student_id limit 100;#花费6ms

一文弄懂MySQL索引创建原则

对于既有group by又有order by的查询语句,建议最好建立联合索引,并且将group by中的字段放到order by字段的前边,满足‘最左前缀匹配原则’,这样索引的利用率就会高,自然查询的效率也就会高;同时8.0之后的版本支持降序索引,如果order by之后的字段时降序的,可以考虑直接创建降序索引,也会提高查询效率。

4、Update、Delete的where条件列

对数据按照某个条件进行查询后再进行Update或Delete的操作,如果对Where字段创建了索引,就能答复提升效率。原因是因为需要先根据Where条件列检索出来这条记录,然后再对他进行更新或删除。如果进行更新的时候,更新的字段是非索引字段,提升效率会更明显,这是因为费索引字段更新不需要对所以进行维护。

比如对student_info表中的name字段为sdfasdfas123123的数据修改student_id为110119,在没有对name字段建立索引的情况下,执行情况如下:

update student_info set student_id = 110119 where name = 'sdfasdfas123123';#花费549ms

一文弄懂MySQL索引创建原则

添加索引后,执行情况如下:

alter table student_info add index idx_name(name);
update student_info set student_id = 110119 where name = 'sdfasdfas123123';#花费2ms

一文弄懂MySQL索引创建原则

5、Distinct字段需要创建索引

有时候需要对某个字段进行去重,使用Distinct,那么对这个创建索引也会提升查询效率。

比如查询课程表中不同student_id都有哪些,如果没有为student_id创建索引,执行情况如下:

select distinct(student_id) from student_id;#花费2ms

一文弄懂MySQL索引创建原则

创建索引后,执行情况如下:

alter table student_info add index idx_sid(student_id);
select distinct(student_id) from student_id;#花费0.1ms

6、多表Join连接操作时,创建索引注意事项

首先,连接表的数据量尽量不超过3张,因为每增加一张表就相当于增加了一次嵌套的循环,数量级增长非常快,严重影响查询效率。其次,对Where条件创建索引,因为Where才是对数据条件的过滤,如果再数据量非常大的情况下,没有Where条件过滤时非常可怕的,最后,对于连接的字段创建索引,并且改字段再多张表中类型必须一致。

一文弄懂MySQL索引创建原则

比如,只对student_id创建索引,查询结果如下:

select course_id, name, student_info.student_id,course_name
from student_info join course
on student_info.course_id = course.course_id
where name = 'aAAaAA'; #花费176ms

一文弄懂MySQL索引创建原则

给name字段创建索引后,查询结果如下:

alter table student_info add index idx_name(name);
select course_id, name, student_info.student_id,course_name
from student_info join course
on student_info.course_id = course.course_id
where name = 'aAAaAA'; #花费2ms

一文弄懂MySQL索引创建原则

7、使用列的类型小的创建索引

这里所说的类型小值意思是该类型表示的数据范围的大小。比如在定义表结构的时候要显示的指定列的类型,以整数类型为例,有TINYINT、MEDIUMINT、INT、BIGINT等,他们占用的存储空间依次递增,能表示的数据范围也是一次递增。如果相对某个整数列建立索引的话,在表示的整数范围允许的情况下,尽量让索引列使用较小的类型,例如能使用INT不要使用BIGINT,能使用MEDIUMINT不使用INT,原因如下:

  • 数据类型越小,在查询时进行的比较操作越快
  • 数据类型越小,索引占用的空间就越少,在一个数据页内就可以存下更多的记录,从而减少磁盘I/O带来的性能损耗,也就意味着可以存储更多的数据在数据页中,提高读写效率。

上述对于主键来说很合适,因为在聚簇索引中既存储了数据,也存储了索引,可以很好的减少磁盘I/O;而对于二级索引来说,还需要一次回表操作才能查到完整的数据,也就能加了一次磁盘I/O。

8、使用字符串前缀创建索引

根据Alibaba开发手册,在字符串上建立索引时,必须指定索引长度,没有必要对全字段建立索引。

一文弄懂MySQL索引创建原则

比如有一张商品表,表中的商品描述字段较长,在描述字段上建立前缀索引如下:

create table product(id int, desc varchar(120) not null);
alter table product add index(desc(12));

区分度的计算可以使用count(distinct left(列名, 索引长度))/count(*)来确定。

9、区分度高的列适合作为索引

列的基数值得时某一列中不重复数据的个数,比如说某个列包含值2,5,3,6,2,7,2,虽然有7条记录,但该列的基数却是5,也就是说,在记录行数一定的情况下,列的基数越大,该列中的值就越分散;列的基数越小,该列中的值就越集中。这里列的基数指标非常重要,直接影响是否能有效利用索引。最好为列的基数大的列建立索引,为基数太小的列建立索引效果反而不好。

可以使用公式select count(distinct col)/count(*) from table 来计算区分度,越接近1区分度越好。

10、使用最频繁的列放到联合索引的左侧

这条就是通常说的最左前缀匹配原则。 通俗来讲就是将Where条件后经常使用的条件字段放在索引的最左边,将使用频率相对低的放到右边。

11、在多个字段都要创建索引的情况下,联合索引由于单值索引

二、不适合创建索引

1、在where中使用不到的字段不要设置索引

通常索引的建立是有代价的,如果建立索引的字段没有出现在where条件(包括group by、order by)中,建议一开始就不要创建索引或将索引删除,因为索引的存在也会占用空间。

2、数据量小的表最好不要使用索引

3、有大量重复数据的列上不要建立索引

在条件表达式中经常用到的不同值较多的列上建立索引,但字段中如果有大量重复数据,也不用创建索引。比如学生表中的性别字段,只有男和女两种值,因此无需建立索引。如果建立索引,不但不会提高查询效率,反而会严重降低数据更新速度。

4、避免对经常更新的表创建过多的索引

  • 频繁更新的字段不一定要创建索引,因为更新数据的时候,索引也要跟着更新,如果索引太多,更新的时候会造成服务器压力,从而影响效率。
  • 避免对经常更新的表创建过多的索引,并且索引中的列尽可能少。此时虽然提高了查询速度,同时也会降低更新表的速度。

5、不建议用无序的值作为索引

例如身份证、UUID(在索引比较时需要转为ASCII,并且插入时可能造成页分裂)、MD5、HASH、无序长字符串等。

6、删除不在使用或很少使用的索引

表中的数据被大量更新或者数据的使用方式被改变后,原有的一些索引可能不会被使用到。DBA应定期找出这些索引并将之删除,从而较少无用索引对更新操作的影响。

7、不要定义冗余或重复的索引

例如身份证、UUID(在索引比较时需要转为ASCII,并且插入时可能造成页分裂)、MD5、HASH、无序长字符串等。

8、删除不在使用或很少使用的索引

表中的数据被大量更新或者数据的使用方式被改变后,原有的一些索引可能不会被使用到。DBA应定期找出这些索引并将之删除,从而较少无用索引对更新操作的影响。

9、不要定义冗余或重复的索引

总结

到此这篇关于MySQL索引创建原则的文章就介绍到这了,更多相关MySQL索引创建原则内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
多属性、多分类MySQL模式设计
Apr 05 MySQL
MySQL中使用or、in与union all在查询命令下的效率对比
May 26 MySQL
Mysql 设置boolean类型的操作
Jun 04 MySQL
探究Mysql模糊查询是否区分大小写
Jun 11 MySQL
解决mysql的int型主键自增问题
Jul 15 MySQL
MySQL面试题讲解之如何设置Hash索引
Nov 01 MySQL
MySQL 服务和数据库管理
Nov 11 MySQL
SQL语法CONSTRAINT约束操作详情
Jan 18 MySQL
SQL语句多表联合查询的方法示例
Apr 18 MySQL
MySQL数据库安装方法与图形化管理工具介绍
May 30 MySQL
MySQL的意向共享锁、意向排它锁和死锁
Jul 15 MySQL
前端传参数进行Mybatis调用mysql存储过程执行返回值详解
Aug 14 MySQL
一文了解MySQL二级索引的查询过程
Mysql数据库表中为什么有索引却没有提高查询速度
教你如何让spark sql写mysql的时候支持update操作
Feb 15 #MySQL
一文弄懂MySQL中redo log与binlog的区别
Feb 15 #MySQL
Mysql Innodb存储引擎之索引与算法
深入讲解数据库中Decimal类型的使用以及实现方法
Mysql分库分表之后主键处理的几种方法
You might like
利用文件属性结合Session实现在线人数统计
2006/10/09 PHP
如何批量清理系统临时文件(语言:C#、 C/C++、 php 、python 、java )
2016/02/01 PHP
PHP实现根据数组某个键值大小进行排序的方法
2018/03/13 PHP
浅谈Javascript鼠标和滚轮事件
2012/06/27 Javascript
一样的table?不一样的table(可编辑状态table)
2012/09/19 Javascript
JS实现图片翻书效果示例代码
2013/09/09 Javascript
javascript函数特点实例分析
2015/05/14 Javascript
浅谈toLowerCase和toLocaleLowerCase的区别
2016/08/15 Javascript
JavaScript组合模式学习要点
2016/08/26 Javascript
BootStrap实现邮件列表的分页和模态框添加邮件的功能
2016/10/13 Javascript
微信小程序 wxapp内容组件 icon详细介绍
2016/10/31 Javascript
Vue.js自定义指令的用法与实例解析
2017/01/18 Javascript
浅谈Vue的响应式原理
2019/05/30 Javascript
JS数组及对象遍历方法代码汇总
2020/06/16 Javascript
详解React的回调渲染模式
2020/09/10 Javascript
vue video和vue-video-player实现视频铺满教程
2020/10/30 Javascript
[02:36]DOTA2英雄基础教程 帕格纳
2014/01/20 DOTA
python调用百度REST API实现语音识别
2018/08/30 Python
Django 响应数据response的返回源码详解
2019/08/06 Python
Python二维数组实现求出3*3矩阵对角线元素的和示例
2019/11/29 Python
Python实现自动整理文件的脚本
2020/12/17 Python
分享PyCharm最新激活码(真永久激活方法)不用每月找安装参数或最新激活码了
2020/12/27 Python
欧洲著名的珠宝和手表网上商城:uhrcenter
2017/04/10 全球购物
波兰最大的宠物用品网上商店:FERA.PL
2019/08/11 全球购物
FC-Moto美国:欧洲最大的摩托车服装和头盔商店之一
2019/08/24 全球购物
世嘉游戏英国官方商店:SEGA Shop UK
2019/09/20 全球购物
戴尔荷兰官方网站:Dell荷兰
2020/10/04 全球购物
Python文件操作的面试题
2013/06/22 面试题
传播学毕业生求职信
2013/10/11 职场文书
应用数学专业求职信
2014/03/14 职场文书
小学生感恩演讲稿
2014/04/25 职场文书
2015年大学学生会工作总结
2015/05/13 职场文书
银行求职信怎么写
2019/06/20 职场文书
2019年亲子运动会口号
2019/10/11 职场文书
导游词之重庆渣滓洞
2020/01/08 职场文书
python迷宫问题深度优先遍历实例
2021/06/20 Python