mysql 索引的数据结构为什么要采用B+树


Posted in MySQL onApril 26, 2022

前提: 以下的一些数据结构大家需提前知道,否则看起来会比较有困难,大家也可以按照本文所提到的知识点去主动查阅学习。

1. Hash表?No

因考虑到在数据检索的过程中经常会有范围的查询(如下),而hash表不能提供这种功能。

SELECT * FROM hero WHERE age>5 AND age<20;

使用哈希算法实现的索引虽然可以做到快速检索数据,但是没办法做数据高效范围查找,因此哈希索引是不适合作为 Mysql 的底层索引的数据结构。

2. 二叉查找树(BST)?No

二叉查找树(Binary Search Tree)虽然可以达到范围搜索,但是在树的插入过程中,如果插入的数据本来就是有顺序的,那么就会形成一条链(如下),它的最坏情况是O(n)。 

mysql 索引的数据结构为什么要采用B+树

3. 红黑树?No

红黑树虽然看似达到了平衡状态,但是也会有极端情况存在,和上述BST树一样,虽然不会成为链状,但是红黑树会存在右倾的现象。 

mysql 索引的数据结构为什么要采用B+树

在数据库中的基本主键自增操作,主键一般都是数百万数千万的,如果红黑树存在这种问题,对于查找性能而言也是巨大的消耗,我们数据库不可能忍受这种无意义的等待的。

4. 平衡二叉树(AVL)?差那么二点意思

平衡二叉树,英文翻译为Balanced Binary Tree,为啥叫AVL呢? AVL 是大学教授G.M. Adelson-VelskyE.M. Landis 名称的缩写,他们提出的平衡二叉树的概念,为了纪念他们,将平衡二叉树称为 AVL树。

AVL树本质上是一颗二叉查找树,但是它又具有以下特点:

  • 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,
  • 左右两个子树也都是一棵平衡二叉树。

它不存在红黑树这种右倾的现象,也具备数据高效范围查找的能力,但是数据库查询数据的瓶颈在于磁盘的IO,树节点在磁盘空间中存储可能是不连续的,假设我们一次IO读取一个树的节点,此次读入内存的这页中没有其他树的节点,那么每读取一个树的节点,就要进行一次IO,这是多么消耗时间啊,所以我们设计数据库索引时需要首先考虑怎么尽可能减少磁盘 IO 的次数。 磁盘读取依靠的是机械运动,分为寻道时间、旋转延迟、传输时间三个部分,这三个部分耗时相加就是一次磁盘IO的时间;这个花费的时间成本是内存访问的十几万倍左右。 正是由于磁盘IO是非常昂贵的操作,所以计算机操作系统对此做了优化:预读;每一次IO时,不仅仅把当前磁盘地址的数据加载到内存,同时也把相邻数据也加载到内存缓冲区中。因为局部预读原理说明:当访问一个地址数据的时候,与其相邻的数据很快也会被访问到。每次磁盘IO读取的数据我们称之为一页(page)。一页的大小与操作系统有关,一般为4k或者8k。这也就意味着读取一页内数据的时候,实际上发生了一次磁盘IO。

相关术语解释:

扇区(sector):

  • 磁盘上的每个磁道被等分成多个弧段,这个弧段便称作扇区(sector)。
  • 扇区是磁盘物理层面的名称,它是实际发生读写的最底层。

磁盘块(IO Block):

  • 操作系统不与扇区直接进行交互,因为一般情况下一个扇区是512byte,如果1T去用512byte进行划分,那划分的地址空间太多了,为了让操作系统能够寻址到更大的地址空间,操作系统将相邻的扇区组合在一起,形成一个块,对块进行管理。每个磁盘块可以包括 2、4、8、16、32 或 64 个扇区,这便是磁盘块(IO Block)。
  • 磁盘块是操作系统中出现的名称,文件系统读写数据的最小单位,它同时也被叫做磁盘簇。

页(page):

  • 页是内存中出现的名称,它是内存的最小存储单位,页的大小通常为磁盘块大小的 2^n 倍。

5. B-tree(B-树也称B树)?差那么一点意思

B树是一种平衡的多叉树,B树相比于平衡二叉树(AVL),它能够在单个节点中存储大量键,也降低了树的高度,从而减少了IO的次数。 

mysql 索引的数据结构为什么要采用B+树

B树的节点中存储的是数据,单个节点存储的内容还是太少了,如何让一个节点存储的内容更多呢?B+树它来了。

6. B+树

在节点中存储某段数据的首地址,并且B+树的叶子节点用了一个链表串联起来,便于范围查找。 

mysql 索引的数据结构为什么要采用B+树

B+树高度降低,减少了磁盘 IO。其次,B+树的叶子节点是真正数据存储的地方,叶子节点用了链表连接起来,这个链表本身就是有序的,在数据范围查找时,更具备效率。因此 Mysql 的索引用的就是 B+树,B+树在查找效率、范围查找中都有着非常不错的性能。

到此这篇关于一文了解mysql索引的数据结构为什么用B+树的文章就介绍到这了!


Tags in this post...

MySQL 相关文章推荐
MySQL索引知识的一些小妙招总结
May 10 MySQL
浅谈mysql执行过程以及顺序
May 12 MySQL
解决Navicat for Mysql连接报错1251的问题(连接失败)
May 27 MySQL
python中的mysql数据库LIKE操作符详解
Jul 01 MySQL
MySQL系列之十二 备份与恢复
Jul 02 MySQL
MySQL约束超详解
Sep 04 MySQL
详解MySQL中timestamp和datetime时区问题导致做DTS遇到的坑
Dec 06 MySQL
mysql分组后合并显示一个字段的多条数据方式
Jan 22 MySQL
MySQL读取JSON转换的方式
Mar 18 MySQL
MySql分区类型及创建分区的方法
Apr 13 MySQL
mysql 乱码 字符集latin1转UTF8
Apr 19 MySQL
MySQL的意向共享锁、意向排它锁和死锁
Jul 15 MySQL
MySQ InnoDB和MyISAM存储引擎介绍
pt-archiver 主键自增
Apr 26 #MySQL
提高系统的吞吐量解决数据库重复写入问题
Apr 23 #MySQL
MySQL 数据库范式化设计理论
Apr 22 #MySQL
MySQL提取JSON字段数据实现查询
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 #MySQL
在MySQL中你成功的避开了所有索引
Apr 20 #MySQL
You might like
三个类概括PHP的五种设计模式
2012/09/05 PHP
php实现JWT验证的实例教程
2020/11/26 PHP
BOOM vs RR BO3 第二场2.13
2021/03/10 DOTA
Stop SQL Server
2007/06/21 Javascript
javascript 命名空间以提高代码重用性
2008/11/13 Javascript
JavaScript中的集合及效率
2010/01/08 Javascript
前淘宝前端开发工程师阿当的PPT中有JS技术理念问题
2010/01/15 Javascript
用jQuery模拟页面加载进度条的实现代码
2011/12/19 Javascript
js判断生效时间不得大于失效时间的思路及代码
2013/04/23 Javascript
javascript中不等于的代码是什么怎么写
2013/12/29 Javascript
JavaScript数组和循环详解
2015/04/27 Javascript
ajax读取数据后使用jqchart显示图表的方法
2015/06/10 Javascript
javascript去掉代码里面的注释
2015/07/24 Javascript
ArtEditor富文本编辑器增加表单提交功能
2016/04/18 Javascript
Jquery删除css属性的简单方法
2016/12/04 Javascript
bootstrap switch开关组件使用方法详解
2017/08/22 Javascript
vue实现消息的无缝滚动效果的示例代码
2017/12/05 Javascript
echarts鼠标覆盖高亮显示节点及关系名称详解
2018/03/17 Javascript
JavaScript如何实现防止重复的网络请求的示例
2021/01/28 Javascript
使用python 获取进程pid号的方法
2014/03/10 Python
Python设计模式之观察者模式实例
2014/04/26 Python
在Python 3中实现类型检查器的简单方法
2015/07/03 Python
KMP算法精解及其Python版的代码示例
2016/06/01 Python
pyqt5的QComboBox 使用模板的具体方法
2018/09/06 Python
Python爬虫爬取、解析数据操作示例
2020/03/27 Python
python实现自动打卡的示例代码
2020/10/10 Python
Python Django路径配置实现过程解析
2020/11/05 Python
Alpine安装Python3依赖出现的问题及解决方法
2020/12/25 Python
HTML5 标准将把互联网视频扔回到黑暗时代
2010/02/10 HTML / CSS
新加坡网上花店:FlowerAdvisor新加坡
2018/10/05 全球购物
大唐电信科技股份有限公司java工程师面试经历
2016/12/09 面试题
设计4个线程,其中两个线程每次对j增加1,另外两个线程对j每次减少1。写出程序。
2014/12/30 面试题
个人找工作自荐信格式
2013/09/21 职场文书
村委会主任先进事迹
2014/01/15 职场文书
三年级数学教学反思
2014/01/31 职场文书
乡镇党的群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书