mysql 索引的数据结构为什么要采用B+树


Posted in MySQL onApril 26, 2022

前提: 以下的一些数据结构大家需提前知道,否则看起来会比较有困难,大家也可以按照本文所提到的知识点去主动查阅学习。

1. Hash表?No

因考虑到在数据检索的过程中经常会有范围的查询(如下),而hash表不能提供这种功能。

SELECT * FROM hero WHERE age>5 AND age<20;

使用哈希算法实现的索引虽然可以做到快速检索数据,但是没办法做数据高效范围查找,因此哈希索引是不适合作为 Mysql 的底层索引的数据结构。

2. 二叉查找树(BST)?No

二叉查找树(Binary Search Tree)虽然可以达到范围搜索,但是在树的插入过程中,如果插入的数据本来就是有顺序的,那么就会形成一条链(如下),它的最坏情况是O(n)。 

mysql 索引的数据结构为什么要采用B+树

3. 红黑树?No

红黑树虽然看似达到了平衡状态,但是也会有极端情况存在,和上述BST树一样,虽然不会成为链状,但是红黑树会存在右倾的现象。 

mysql 索引的数据结构为什么要采用B+树

在数据库中的基本主键自增操作,主键一般都是数百万数千万的,如果红黑树存在这种问题,对于查找性能而言也是巨大的消耗,我们数据库不可能忍受这种无意义的等待的。

4. 平衡二叉树(AVL)?差那么二点意思

平衡二叉树,英文翻译为Balanced Binary Tree,为啥叫AVL呢? AVL 是大学教授G.M. Adelson-VelskyE.M. Landis 名称的缩写,他们提出的平衡二叉树的概念,为了纪念他们,将平衡二叉树称为 AVL树。

AVL树本质上是一颗二叉查找树,但是它又具有以下特点:

  • 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,
  • 左右两个子树也都是一棵平衡二叉树。

它不存在红黑树这种右倾的现象,也具备数据高效范围查找的能力,但是数据库查询数据的瓶颈在于磁盘的IO,树节点在磁盘空间中存储可能是不连续的,假设我们一次IO读取一个树的节点,此次读入内存的这页中没有其他树的节点,那么每读取一个树的节点,就要进行一次IO,这是多么消耗时间啊,所以我们设计数据库索引时需要首先考虑怎么尽可能减少磁盘 IO 的次数。 磁盘读取依靠的是机械运动,分为寻道时间、旋转延迟、传输时间三个部分,这三个部分耗时相加就是一次磁盘IO的时间;这个花费的时间成本是内存访问的十几万倍左右。 正是由于磁盘IO是非常昂贵的操作,所以计算机操作系统对此做了优化:预读;每一次IO时,不仅仅把当前磁盘地址的数据加载到内存,同时也把相邻数据也加载到内存缓冲区中。因为局部预读原理说明:当访问一个地址数据的时候,与其相邻的数据很快也会被访问到。每次磁盘IO读取的数据我们称之为一页(page)。一页的大小与操作系统有关,一般为4k或者8k。这也就意味着读取一页内数据的时候,实际上发生了一次磁盘IO。

相关术语解释:

扇区(sector):

  • 磁盘上的每个磁道被等分成多个弧段,这个弧段便称作扇区(sector)。
  • 扇区是磁盘物理层面的名称,它是实际发生读写的最底层。

磁盘块(IO Block):

  • 操作系统不与扇区直接进行交互,因为一般情况下一个扇区是512byte,如果1T去用512byte进行划分,那划分的地址空间太多了,为了让操作系统能够寻址到更大的地址空间,操作系统将相邻的扇区组合在一起,形成一个块,对块进行管理。每个磁盘块可以包括 2、4、8、16、32 或 64 个扇区,这便是磁盘块(IO Block)。
  • 磁盘块是操作系统中出现的名称,文件系统读写数据的最小单位,它同时也被叫做磁盘簇。

页(page):

  • 页是内存中出现的名称,它是内存的最小存储单位,页的大小通常为磁盘块大小的 2^n 倍。

5. B-tree(B-树也称B树)?差那么一点意思

B树是一种平衡的多叉树,B树相比于平衡二叉树(AVL),它能够在单个节点中存储大量键,也降低了树的高度,从而减少了IO的次数。 

mysql 索引的数据结构为什么要采用B+树

B树的节点中存储的是数据,单个节点存储的内容还是太少了,如何让一个节点存储的内容更多呢?B+树它来了。

6. B+树

在节点中存储某段数据的首地址,并且B+树的叶子节点用了一个链表串联起来,便于范围查找。 

mysql 索引的数据结构为什么要采用B+树

B+树高度降低,减少了磁盘 IO。其次,B+树的叶子节点是真正数据存储的地方,叶子节点用了链表连接起来,这个链表本身就是有序的,在数据范围查找时,更具备效率。因此 Mysql 的索引用的就是 B+树,B+树在查找效率、范围查找中都有着非常不错的性能。

到此这篇关于一文了解mysql索引的数据结构为什么用B+树的文章就介绍到这了!


Tags in this post...

MySQL 相关文章推荐
mysql批量新增和存储的方法实例
Apr 07 MySQL
MySQL 分页查询的优化技巧
May 12 MySQL
MySql存储过程之逻辑判断和条件控制
May 26 MySQL
详解MySQL中的主键与事务
May 27 MySQL
详解MySQL多版本并发控制机制(MVCC)源码
Jun 23 MySQL
为什么MySQL选择Repeatable Read作为默认隔离级别
Jul 26 MySQL
MySQL非空约束(not null)案例讲解
Aug 23 MySQL
MySQL实例精讲单行函数以及字符数学日期流程控制
Oct 15 MySQL
解决MySQL添加新用户-ERROR 1045 (28000)的问题
Mar 03 MySQL
排查MySQL生产环境索引没有效果
Apr 11 MySQL
mysql使用 not int 子查询隐含陷阱
Apr 12 MySQL
MySQL创建管理LIST分区
Apr 13 MySQL
MySQ InnoDB和MyISAM存储引擎介绍
pt-archiver 主键自增
Apr 26 #MySQL
提高系统的吞吐量解决数据库重复写入问题
Apr 23 #MySQL
MySQL 数据库范式化设计理论
Apr 22 #MySQL
MySQL提取JSON字段数据实现查询
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 #MySQL
在MySQL中你成功的避开了所有索引
Apr 20 #MySQL
You might like
星际玩家的三大定律
2020/03/04 星际争霸
PHP多线程类及用法实例
2014/12/03 PHP
php简单实现无限分类树形列表的方法
2015/03/27 PHP
既简单又安全的PHP验证码 附调用方法
2016/06/02 PHP
PHP XML和数组互相转换详解
2016/10/26 PHP
PHP实现对数组分页处理实例详解
2017/02/07 PHP
PHP里面把16进制的图片数据显示在html的img标签上(实现方法)
2017/05/02 PHP
一文掌握PHP Xdebug 本地与远程调试(小结)
2019/04/23 PHP
了解jQuery技巧来提高你的代码(个人觉得那个jquery的手册很不错)
2012/02/10 Javascript
JS 实现导航栏悬停效果(续2)
2013/09/24 Javascript
jQuery中wrapInner()方法用法实例
2015/01/16 Javascript
jQuery实现购物车表单自动结算效果实例
2015/08/10 Javascript
JavaScript实现倒计时代码段Item1(非常实用)
2015/11/03 Javascript
BootstrapTable与KnockoutJS相结合实现增删改查功能【二】
2016/05/10 Javascript
input file上传 图片预览功能实例代码
2016/10/25 Javascript
详细AngularJs4的图片剪裁组件的实例
2017/07/12 Javascript
一个有意思的鼠标点击文字特效jquery代码
2017/09/23 jQuery
Vue实现简单的拖拽效果
2020/08/25 Javascript
Python程序员开发中常犯的10个错误
2014/07/07 Python
在Python中使用matplotlib模块绘制数据图的示例
2015/05/04 Python
Python3.2模拟实现webqq登录
2016/02/15 Python
python基础教程项目二之画幅好画
2018/04/02 Python
使用Python监控文件内容变化代码实例
2018/06/04 Python
Python学习小技巧总结
2018/06/10 Python
Python面向对象基础入门之编码细节与注意事项
2018/12/11 Python
django-利用session机制实现唯一登录的例子
2020/03/16 Python
解决TensorFlow程序无限制占用GPU的方法
2020/06/30 Python
python 制作python包,封装成可用模块教程
2020/07/13 Python
请解释接口的显式实现有什么意义
2012/05/26 面试题
艺术专业大学生自我评价
2013/09/22 职场文书
运动会入场词50字
2014/02/20 职场文书
重阳节活动总结
2014/08/27 职场文书
交通运输局四风问题对照检查材料思想汇报
2014/10/09 职场文书
2014社区健康教育工作总结
2014/12/16 职场文书
使用Pytorch实现two-head(多输出)模型的操作
2021/05/28 Python
MySQL系列之十四 MySQL的高可用实现
2021/07/02 MySQL