mysql 索引的数据结构为什么要采用B+树


Posted in MySQL onApril 26, 2022

前提: 以下的一些数据结构大家需提前知道,否则看起来会比较有困难,大家也可以按照本文所提到的知识点去主动查阅学习。

1. Hash表?No

因考虑到在数据检索的过程中经常会有范围的查询(如下),而hash表不能提供这种功能。

SELECT * FROM hero WHERE age>5 AND age<20;

使用哈希算法实现的索引虽然可以做到快速检索数据,但是没办法做数据高效范围查找,因此哈希索引是不适合作为 Mysql 的底层索引的数据结构。

2. 二叉查找树(BST)?No

二叉查找树(Binary Search Tree)虽然可以达到范围搜索,但是在树的插入过程中,如果插入的数据本来就是有顺序的,那么就会形成一条链(如下),它的最坏情况是O(n)。 

mysql 索引的数据结构为什么要采用B+树

3. 红黑树?No

红黑树虽然看似达到了平衡状态,但是也会有极端情况存在,和上述BST树一样,虽然不会成为链状,但是红黑树会存在右倾的现象。 

mysql 索引的数据结构为什么要采用B+树

在数据库中的基本主键自增操作,主键一般都是数百万数千万的,如果红黑树存在这种问题,对于查找性能而言也是巨大的消耗,我们数据库不可能忍受这种无意义的等待的。

4. 平衡二叉树(AVL)?差那么二点意思

平衡二叉树,英文翻译为Balanced Binary Tree,为啥叫AVL呢? AVL 是大学教授G.M. Adelson-VelskyE.M. Landis 名称的缩写,他们提出的平衡二叉树的概念,为了纪念他们,将平衡二叉树称为 AVL树。

AVL树本质上是一颗二叉查找树,但是它又具有以下特点:

  • 它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,
  • 左右两个子树也都是一棵平衡二叉树。

它不存在红黑树这种右倾的现象,也具备数据高效范围查找的能力,但是数据库查询数据的瓶颈在于磁盘的IO,树节点在磁盘空间中存储可能是不连续的,假设我们一次IO读取一个树的节点,此次读入内存的这页中没有其他树的节点,那么每读取一个树的节点,就要进行一次IO,这是多么消耗时间啊,所以我们设计数据库索引时需要首先考虑怎么尽可能减少磁盘 IO 的次数。 磁盘读取依靠的是机械运动,分为寻道时间、旋转延迟、传输时间三个部分,这三个部分耗时相加就是一次磁盘IO的时间;这个花费的时间成本是内存访问的十几万倍左右。 正是由于磁盘IO是非常昂贵的操作,所以计算机操作系统对此做了优化:预读;每一次IO时,不仅仅把当前磁盘地址的数据加载到内存,同时也把相邻数据也加载到内存缓冲区中。因为局部预读原理说明:当访问一个地址数据的时候,与其相邻的数据很快也会被访问到。每次磁盘IO读取的数据我们称之为一页(page)。一页的大小与操作系统有关,一般为4k或者8k。这也就意味着读取一页内数据的时候,实际上发生了一次磁盘IO。

相关术语解释:

扇区(sector):

  • 磁盘上的每个磁道被等分成多个弧段,这个弧段便称作扇区(sector)。
  • 扇区是磁盘物理层面的名称,它是实际发生读写的最底层。

磁盘块(IO Block):

  • 操作系统不与扇区直接进行交互,因为一般情况下一个扇区是512byte,如果1T去用512byte进行划分,那划分的地址空间太多了,为了让操作系统能够寻址到更大的地址空间,操作系统将相邻的扇区组合在一起,形成一个块,对块进行管理。每个磁盘块可以包括 2、4、8、16、32 或 64 个扇区,这便是磁盘块(IO Block)。
  • 磁盘块是操作系统中出现的名称,文件系统读写数据的最小单位,它同时也被叫做磁盘簇。

页(page):

  • 页是内存中出现的名称,它是内存的最小存储单位,页的大小通常为磁盘块大小的 2^n 倍。

5. B-tree(B-树也称B树)?差那么一点意思

B树是一种平衡的多叉树,B树相比于平衡二叉树(AVL),它能够在单个节点中存储大量键,也降低了树的高度,从而减少了IO的次数。 

mysql 索引的数据结构为什么要采用B+树

B树的节点中存储的是数据,单个节点存储的内容还是太少了,如何让一个节点存储的内容更多呢?B+树它来了。

6. B+树

在节点中存储某段数据的首地址,并且B+树的叶子节点用了一个链表串联起来,便于范围查找。 

mysql 索引的数据结构为什么要采用B+树

B+树高度降低,减少了磁盘 IO。其次,B+树的叶子节点是真正数据存储的地方,叶子节点用了链表连接起来,这个链表本身就是有序的,在数据范围查找时,更具备效率。因此 Mysql 的索引用的就是 B+树,B+树在查找效率、范围查找中都有着非常不错的性能。

到此这篇关于一文了解mysql索引的数据结构为什么用B+树的文章就介绍到这了!


Tags in this post...

MySQL 相关文章推荐
MySQL中VARCHAR与CHAR格式数据的区别
May 26 MySQL
MySQL8.0无法启动3534的解决方法
Jun 03 MySQL
MySQL系列之三 基础篇
Jul 02 MySQL
MySQL系列之十一 日志记录
Jul 02 MySQL
weblogic服务建立数据源连接测试更新mysql驱动包的问题及解决方法
Jan 22 MySQL
详解MySql中InnoDB存储引擎中的各种锁
Feb 12 MySQL
面试中老生常谈的MySQL问答集锦夯实基础
Mar 13 MySQL
Linux系统下MySQL配置主从分离的步骤
Mar 21 MySQL
MySql分区类型及创建分区的方法
Apr 13 MySQL
mysql中如何用命令创建联合唯一索引
Apr 20 MySQL
解决Mysql中的innoDB幻读问题
Apr 29 MySQL
MySQL查询日期时间
May 15 MySQL
MySQ InnoDB和MyISAM存储引擎介绍
pt-archiver 主键自增
Apr 26 #MySQL
提高系统的吞吐量解决数据库重复写入问题
Apr 23 #MySQL
MySQL 数据库范式化设计理论
Apr 22 #MySQL
MySQL提取JSON字段数据实现查询
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 #MySQL
在MySQL中你成功的避开了所有索引
Apr 20 #MySQL
You might like
开发大型 PHP 项目的方法
2007/01/02 PHP
php多文件上传实现代码
2014/02/20 PHP
SESSION存放在数据库用法实例
2015/08/08 PHP
php高清晰度无损图片压缩功能的实现代码
2018/12/09 PHP
JavaScript 获取用户客户端操作系统版本
2009/08/25 Javascript
基于JavaScript实现 获取鼠标点击位置坐标的方法
2013/04/12 Javascript
解析js原生方法创建表格效率测试
2013/07/08 Javascript
jquery实现弹出层登录和全屏层注册特效
2015/08/28 Javascript
基于JavaScript FileReader上传图片显示本地链接
2016/05/27 Javascript
AngularJS 如何在控制台进行错误调试
2016/06/07 Javascript
AngularJs Understanding the Controller Component
2016/09/02 Javascript
angularJs中跳转到指定的锚点实例($anchorScroll)
2018/08/31 Javascript
vue通过cookie获取用户登录信息的思路详解
2018/10/30 Javascript
JavaScript偏函数与柯里化实例详解
2019/03/27 Javascript
IE浏览器下JS脚本提交表单后,不能自动提示问题解决方法
2019/06/04 Javascript
[01:46]TI4西雅图DOTA2前线报道 中国选手抱团调时差
2014/07/08 DOTA
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
2015/04/08 Python
Python中read()、readline()和readlines()三者间的区别和用法
2017/07/30 Python
pandas.DataFrame选取/排除特定行的方法
2018/07/03 Python
Python中的random.uniform()函数教程与实例解析
2019/03/02 Python
python3.6根据m3u8下载mp4视频
2019/06/17 Python
Django shell调试models输出的SQL语句方法
2019/08/29 Python
Python lxml模块的基本使用方法分析
2019/12/21 Python
解决Python安装cryptography报错问题
2020/09/03 Python
详解Pycharm安装及Django安装配置指南
2020/09/15 Python
澳大利亚网上买书:Angus & Robertson
2019/07/21 全球购物
竞聘上岗演讲稿范文
2014/01/10 职场文书
职工趣味运动会方案
2014/02/10 职场文书
《三顾茅庐》教学反思
2014/04/10 职场文书
国际语言毕业生求职信
2014/07/08 职场文书
2015届大学生就业推荐表自我评价
2014/09/27 职场文书
MySQL获取所有分类的前N条记录
2021/05/07 MySQL
MySQL中出现乱码问题的终极解决宝典
2021/05/26 MySQL
教你使用VS Code的MySQL扩展管理数据库的方法
2022/01/22 MySQL
《模拟人生4》推出新补丁 “婚礼奇缘”DLC终于得到修复
2022/04/03 其他游戏
《勇者辞职不干了》ED主题曲无字幕动画MV公开
2022/04/13 日漫