为什么MySQL 删除表数据 磁盘空间还一直被占用


Posted in MySQL onOctober 16, 2021

最近有个上位机获取下位机上报数据的项目,由于上报频率比较频繁且数据量大,导致数据增长过快,磁盘占用多。

为了节约成本,定期进行数据备份,并通过delete删除表记录。

明明已经执行了delete,可表文件的大小却没减小,令人费解

项目中使用Mysql作为数据库,对于表来说,一般为表结构和表数据。表结构占用空间都是比较小的,一般都是表数据占用的空间。

当我们使用 delete删除数据时,确实删除了表中的数据记录,但查看表文件大小却没什么变化。

1、Mysql数据结构

凡是使用过mysql,对B+树肯定是有所耳闻的,MySQL InnoDB 中采用了 B+ 树作为存储数据的结构,也就是常说的索引组织表,并且数据时按照页来存储的。因此在删除数据时,会有两种情况:

  • 删除数据页中的某些记录
  • 删除整个数据页的内容

2、表文件大小未更改和mysql设计有关

比如想要删除 R4 这条记录:

为什么MySQL 删除表数据 磁盘空间还一直被占用

InnoDB 直接将 R4 这条记录标记为删除,称为可复用的位置。如果之后要插入 ID 300 700 间的记录时,就会复用该位置。

由此可见,磁盘文件的大小并不会减少。

通用删除整页数据也将记录标记删除,数据就复用用该位置,与删除默写记录不同的是,删除整页记录,当后来插入的数据不在原来的范围时,都可以复用位置,而如果只是删除默写记录,是需要插入数据符合删除记录位置的时候才能复用。

因此,无论是数据行的删除还是数据页的删除,都是将其标记为删除的状态,用于复用,所以文件并不会减小。

3、那怎么才能让表大小变小

DELETE只是将数据标识位删除,并没有整理数据文件,当插入新数据后,会再次使用这些被置为删除标识的记录空间,可以使用OPTIMIZE TABLE来回收未使用的空间,并整理数据文件的碎片。

OPTIMIZE TABLE 表名;

注意:OPTIMIZE TABLE只对MyISAM, BDBInnoDB表起作用。

另外,也可以执行通过ALTER TABLE重建表

ALTER TABLE 表名 ENGINE=INNODB

有人会问OPTIMIZE TABLEALTER TABLE有什么区别?

alter table t engine = InnoDB(也就是recreate),而 optimize table t 等于 recreate+analyze

4、Online DDL

最后,再说一下Online DDLdba的日常工作肯定有一项是ddl变更,ddl变更会锁表,这个可以说是dba心中永远的痛,特别是执行ddl变更,导致库上大量线程处于“Waiting for meta data lock”状态的时候。因此在 5.6 版本后引入了 Online DDL

Online DDL推出以前,执行ddl主要有两种方式copy方式和inplace方式,inplace方式又称为(fast index creation)。相对于copy方式,inplace方式不拷贝数据,因此较快。但是这种方式仅支持添加、删除索引两种方式,而且与copy方式一样需要全程锁表,实用性不是很强。Online方式与前两种方式相比,不仅可以读,还可以支持写操作。

执行online DDL语句的时候,使用ALGORITHMLOCK关键字,这两个关键字在我们的DDL语句的最后面,用逗号隔开即可。示例如下:

ALTER TABLE tbl_name ADD COLUMN col_name col_type, ALGORITHM=INPLACE, LOCK=NONE;

ALGORITHM选项

  • INPLACE:替换:直接在原表上面执行DDL的操作。
  • COPY:复制:使用一种临时表的方式,克隆出一个临时表,在临时表上执行DDL,然后再把数据导入到临时表中,在重命名等。这期间需要多出一倍的磁盘空间来支撑这样的 操作。执行期间,表不允许DML的操作。
  • DEFAULT:默认方式,有MySQL自己选择,优先使用INPLACE的方式。
  • LOCK选项
  • SHARE:共享锁,执行DDL的表可以读,但是不可以写。
  • NONE:没有任何限制,执行DDL的表可读可写。
  • EXCLUSIVE:排它锁,执行DDL的表不可以读,也不可以写。
  • DEFAULT:默认值,也就是在DDL语句中不指定LOCK子句的时候使用的默认值。如果指定LOCK的值为

DEFAULT,那就是交给MySQL子句去觉得锁还是不锁表。不建议使用,如果你确定你的DDL语句不会锁表,你可以不指定lock或者指定它的值为default,否则建议指定它的锁类型。
执行DDL操作时,ALGORITHM选项可以不指定,这时候MySQL按照INSTANTINPLACECOPY的顺序自动选择合适的模式。也可以指定ALGORITHM=DEFAULT,也是同样的效果。如果指定了ALGORITHM选项,但不支持的话,会直接报错。

OPTIMIZE TABLE ALTER TABLE 表名 ENGINE=INNODB都支持Oline DDL,但依旧建议在业务访问量低的时候使用

5、总结

delete 删除数据时,其实对应的数据行并不是真正的删除,仅仅是将其标记成可复用的状态,所以表空间不会变小。

可以重建表的方式,快速将delete数据后的表变小(OPTIMIZE TABLE ALTER TABLE),在 5.6 版本后,创建表已经支持 Online 的操作,但最好是在业务低峰时使用

到此这篇关于为什么MySQL 删除表数据 磁盘空间还一直被占用的文章就介绍到这了,更多相关MySQL 删除表数据 内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
MySQL系列之十 MySQL事务隔离实现并发控制
Jul 02 MySQL
MySQL千万级数据表的优化实战记录
Aug 04 MySQL
MySQL数据库超时设置配置的方法实例
Oct 15 MySQL
Mysql关于数据库是否应该使用外键约束详解说明
Oct 24 MySQL
MYSQL 运算符总结
Nov 11 MySQL
mysql 联合索引生效的条件及索引失效的条件
Nov 20 MySQL
mysql使用FIND_IN_SET和group_concat两个方法查询上下级机构
Apr 20 MySQL
MySQ InnoDB和MyISAM存储引擎介绍
Apr 26 MySQL
MySQL中JOIN连接的基本用法实例
Jun 05 MySQL
MySQL提升大量数据查询效率的优化神器
Jul 07 MySQL
MySQL一劳永逸永久支持输入中文的方法实例
Aug 05 MySQL
分享很少见很有用的SQL功能CORRESPONDING
Aug 05 MySQL
mysql中int(3)和int(10)的数值范围是否相同
深入解析MySQL索引数据结构
MySQL数据库必备之条件查询语句
Oct 15 #MySQL
MySQL实例精讲单行函数以及字符数学日期流程控制
MySQL数据库超时设置配置的方法实例
MyBatis 动态SQL全面详解
MySQL中datetime时间字段的四舍五入操作
You might like
php中通过curl模拟登陆discuz论坛的实现代码
2012/02/16 PHP
PHP中数组合并的两种方法及区别介绍
2012/09/14 PHP
PHP5.5基于mysqli连接MySQL数据库和读取数据操作实例详解
2019/02/16 PHP
javaScript 利用闭包模拟对象的私有属性
2011/12/29 Javascript
Jquery实现视频播放页面的关灯开灯效果
2013/05/27 Javascript
js类式继承的具体实现方法
2013/12/31 Javascript
JavaScript bold方法入门实例(把指定文字显示为粗体)
2014/10/17 Javascript
JavaScript中的变量定义与储存介绍
2014/12/31 Javascript
ECMAScript6新增值比较函数Object.is
2015/06/12 Javascript
JS控制弹出悬浮窗口(一览画面)的实例代码
2016/05/30 Javascript
JavaScript基于Dom操作实现查找、修改HTML元素的内容及属性的方法
2017/01/20 Javascript
基于vue-ssr服务端渲染入门详解
2018/01/08 Javascript
jQuery中内容过滤器简单用法示例
2018/03/31 jQuery
基于jQuery实现的设置文本区域的光标位置
2018/06/15 jQuery
JS返回页面时自动回滚到历史浏览位置
2018/09/26 Javascript
js脚本中执行java后台代码方法解析
2019/10/11 Javascript
vue项目中使用rem,在入口文件添加内容操作
2020/11/11 Javascript
[05:53]完美世界携手游戏风云打造 卡尔工作室观战系统篇
2013/04/22 DOTA
跟老齐学Python之赋值,简单也不简单
2014/09/24 Python
python基础教程之五种数据类型详解
2017/01/12 Python
在Pycharm中使用GitHub的方法步骤
2019/06/13 Python
解决Pycharm 导入其他文件夹源码的2种方法
2020/02/12 Python
基于OpenCV的网络实时视频流传输的实现
2020/11/15 Python
html标签之Object和EMBED标签详解
2013/07/04 HTML / CSS
公务员职务工作的自我评价
2013/11/01 职场文书
食品安全检查制度
2014/02/03 职场文书
机械工程学院大学生求职信
2014/05/25 职场文书
中药学自荐信
2014/06/15 职场文书
机关党员进社区活动总结
2014/07/05 职场文书
违规违纪检讨书范文
2015/05/06 职场文书
拯救大兵瑞恩观后感
2015/06/09 职场文书
高一数学教学反思
2016/02/18 职场文书
golang 实现两个结构体复制字段
2021/04/28 Golang
Python虚拟环境virtualenv是如何使用的
2021/06/20 Python
Oracle安装TNS_ADMIN环境变量设置参考
2021/11/01 Oracle
python模块与C和C++动态库相互调用实现过程示例
2021/11/02 Python