MySQL千万级数据表的优化实战记录


Posted in MySQL onAugust 04, 2021

前言

这里先说明一下,网上很多人说阿里规定500w数据就要分库分表。实际上,这个500w并不是定义死的,而是与MySQL的配置以及机器的硬件有关。MySQL为了提升性能,会将表的索引装载到内存中。但是当表的数据到达一定的量的时候,会导致内存无法存储这些索引,无法存储索引,就只能进行磁盘IO,从而导致性能下降。

实战调优

我这里有张表,数据有1000w,目前只有一个主键索引

CREATE TABLE `user` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `uname` varchar(20) DEFAULT NULL COMMENT '账号',
  `pwd` varchar(20) DEFAULT NULL COMMENT '密码',
  `addr` varchar(80) DEFAULT NULL COMMENT '地址',
  `tel` varchar(20) DEFAULT NULL COMMENT '电话',
  `regtime` char(30) DEFAULT NULL COMMENT '注册时间',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10000003 DEFAULT CHARSET=utf8;

MySQL千万级数据表的优化实战记录

查询所有大概16s。可谓是相当慢了。通常我们一个后台系统,比如这个是一个电商平台,这个是用户表。后台管理系统,一般会查询这些用户信息,做一些操作,比如后台直接新增用户啊,或者删除用户啊这些操作。

所以这里就诞生了两个需求,一个是查询count,一个是分页查询

我们分别来测试一下count用的时间和分页查询所用的时间

select * from user limit 1, 10   //几乎不用时
select * from user limit 1000000, 10  //0.35s
select * from user limit 5000000, 10  //1.7s
select * from user limit 9000000, 10  //2.8s
select count(1) from user  //1.7s

从上面查询所用时间可以看出来,如果是分页查询的话,查询的数据越往后用时是越长的,查询count也需要1.7s。这显然是不符合我们的要求的。所以,这里我们就需要优化。首先我们这里进行索引优化试试
首先看一下这是只有主键索引的执行计划:

MySQL千万级数据表的优化实战记录

alter table `user` add INDEX `sindex` (`uname`,`pwd`,`addr`,`tel`,`regtime`,`age`)

MySQL千万级数据表的优化实战记录

看上面的执行计划,虽然type是从all->index,走了sindex索引,但是实际上查询速度并没有发生改变。

其实,创建联合索引,是为了有条件查询的时候速度更快,而不是全表查询

select * from user where uname='6.445329111484186' //3.5s(无联合索引)
select * from user where uname='6.445329111484186' //0.003s(有联合索引)

所以这就是有联合索引和无索引的差距

这里基本上可以证明,加了索引和不加索引,进行全表查询的时候,效率就是会很慢

既然索引这个结果已经不好使了,那就只能找其他方案了。根据我之前mysql面试里面讲的,count我们可以单独存储到一个表里面

CREATE TABLE `attribute` (
  `id` int(11) NOT NULL,
  `formname` varchar(50) COLLATE utf8_bin NOT NULL COMMENT '表名',
  `formcount` int(11) NOT NULL COMMENT '表总数据',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

MySQL千万级数据表的优化实战记录

这里说一下,这种表一般不会查所有,只会查询一条,所以建表的时候,可以建成hash

select formcount from attribute where formname='user' //几乎不用时

count就进行优化完了。如果上面有选择条件的话,就可以建立索引,通过走索引筛选的形式来查询,这样就可以不用读这个count了。

那么,count是没问题了,分页查询优化要如何优化呢?这里可以使用子查询来优化

select * from user where
id>=(select id from user limit 9000000,1) limit 10 //1.7s

其实子查询这种写法,判断id,其实就是通过覆盖索引来查询。效率会大大增加。不过我这里测试是1.7s,以前在公司优化这方面的时候,比这个查询时间要低,大家也可以自己生成数据自己测试

但是如果说数据量太大了,我还是建议走es或者进行一些默认选择,count可以单独列出来

至此,一个千万级的数据分页查询的优化就完成了。

总结

到此这篇关于MySQL千万级数据表优化的文章就介绍到这了,更多相关MySQL千万级数据表优化内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
Mysql Show Profile
Apr 05 MySQL
MySQL 使用SQL语句修改表名的实现
Apr 07 MySQL
mysql连接查询中and与where的区别浅析
Jul 01 MySQL
Prometheus 监控MySQL使用grafana展示
Aug 30 MySQL
mysql如何能有效防止删库跑路
Oct 05 MySQL
深入讲解数据库中Decimal类型的使用以及实现方法
Feb 15 MySQL
MySQL时区造成时差问题
Apr 13 MySQL
MySQL 自动填充 create_time 和 update_time
May 20 MySQL
mysql5.5中文乱码问题解决的有用方法
May 30 MySQL
MYSQL中文乱码问题的解决方案
Jun 14 MySQL
MySQL数据库配置信息查看与修改方法详解
Jun 25 MySQL
详解MySQL的内连接和外连接
May 08 MySQL
SQL实现LeetCode(176.第二高薪水)
Aug 04 #MySQL
Mysql8.0递归查询的简单用法示例
Aug 04 #MySQL
SQL之各种join小结详细讲解
SQL实现LeetCode(175.联合两表)
Aug 04 #MySQL
一篇文章带你深入了解Mysql触发器
Aug 02 #MySQL
sql注入教程之类型以及提交注入
MySQL子查询中order by不生效问题的解决方法
Aug 02 #MySQL
You might like
XAMPP安装与使用方法详细解析
2013/11/27 PHP
php无限遍历目录示例
2014/02/21 PHP
php从数组中随机选择若干不重复元素的方法
2015/03/14 PHP
js 省地市级联选择
2010/02/07 Javascript
javascript实现面向对象类的功能书写技巧
2010/03/07 Javascript
document.getElementById的简写方式(获取id对象的简略写法)
2010/09/10 Javascript
JavaScript内核之基本概念
2011/10/21 Javascript
Jquery 例外被抛出且未被接住原因介绍
2013/09/04 Javascript
使用js实现按钮控制文本框加1减1应用于小时+分钟
2013/12/09 Javascript
script标签属性用type还是language
2015/01/21 Javascript
jQuery+CSS实现简单切换菜单示例
2016/07/27 Javascript
Json对象和字符串互相转换json数据拼接和JSON使用方式详细介绍(小结)
2016/10/25 Javascript
AngularJS框架的ng-app指令与自动加载实现方法分析
2017/01/04 Javascript
浅谈在koa2中实现页面渲染的全局数据
2017/10/09 Javascript
关于vuejs中v-if和v-show的区别及v-show不起作用问题
2018/03/26 Javascript
layui前端框架之table表数据的刷新方法
2018/08/17 Javascript
vue.js单文件组件中非父子组件的传值实例
2018/09/13 Javascript
开发用到的js封装方法(20种)
2018/10/12 Javascript
jQuery.validate.js表单验证插件的使用代码详解
2018/10/22 jQuery
node express使用HTML模板的方法示例
2019/08/22 Javascript
Vuex实现简单购物车
2021/01/10 Vue.js
[06:53]DOTA2每周TOP10 精彩击杀集锦vol.3
2014/06/25 DOTA
Python调用C语言开发的共享库方法实例
2015/03/18 Python
Python脚本判断 Linux 是否运行在虚拟机上
2015/04/25 Python
Windows系统下多版本pip的共存问题详解
2017/10/10 Python
Python中base64与xml取值结合问题
2019/12/22 Python
解决Python3.8用pip安装turtle-0.0.2出现错误问题
2020/02/11 Python
什么是Python中的顺序表
2020/06/02 Python
查找廉价航班和发现新目的地:Kiwi.com
2019/02/25 全球购物
应届生煤化工求职信
2013/10/21 职场文书
应届大学生简历中的自我评价
2014/01/15 职场文书
高中生期末评语
2014/01/28 职场文书
4S店收银员岗位职责
2015/04/07 职场文书
字典算法实现及操作 --python(实用)
2021/03/31 Python
pytorch 如何使用batch训练lstm网络
2021/05/28 Python
深入解析Apache Hudi内核文件标记机制
2022/03/31 Servers