一次Mysql update sql不当引起的生产故障记录


Posted in MySQL onApril 01, 2022

故障表现

  • 一方面 :在阿里云控制台云数据库PolarDB对应的集群管理页面上,在诊断与优化模块里面的一键诊断会话管理中,发现某条update sql 执行时间非常久且非常频繁;

  • 另一方面:业务监控系统中开始不断有业务执行时间发出告警信息提示,且告警的业务数据不断上升,部分操作影响客户使用。

业务背景

由于业务操作涉及到的业务流比较复杂,对纯技术的分享来看,不是重点讨论的话,为了更有利于理解问题发生的原因,使用类比的方式,把复杂的业务类比成如下描述: 有数据库3张表,第一张表t_grandfather (爷表),第二张表为t_father(父表),第三张表t_grandson(子孙表),DDL如下:

CREATE TABLE `t_grandfather ` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `count` int(11) NOT NULL DEFAULT 0 COMMENT '子孙后代数量',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='老爷表';

CREATE TABLE `t_father ` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `grandfather_id` int(11) NOT NULL COMMENT '老爷表id',
  PRIMARY KEY (`id`),
  KEY `idx_grandfather_id` (`grandfather_id`),
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='老爸表';

CREATE TABLE `t_grandson` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `grandfather_id` int(11) NOT NULL COMMENT '老爷表id',
  PRIMARY KEY (`id`),
  KEY `idx_grandfather_id` (`grandfather_id`),
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='孙子表';

三张表之间的业务逻辑关系为,先生成老爷表,然后这个老爷取很多老婆(业务),会不断的生娃,生一个娃就会生成一张老爸表,同时会更新老爷表的count=count+1,表示新增一个后代了,老爷的老婆(业务)在不断的生娃的时候,之前的生的娃也会有老婆,他们的老婆也会生娃,对老爷来说,就是它有了孙子(产生新的业务数据),那有了孙子之后也需要更新老爷表的count=count+1,表示新增一个后代了,以此类推,子子孙孙无穷尽也(业务数据不断生成) 如下图所示:

一次Mysql update sql不当引起的生产故障记录

祖传代码的逻辑为,只要是t_father表和t_grandson有新增,就去更新t_grandfather。这个逻辑设计上问题不大,不过考虑到孙子表数据量很猛的时候,这里就会出现一个非常严重的性能问题。以下是业务摘取的一部分伪代码

/**
 * 处理 father 的业务
 */
 public void doFatherBusiness  (){
     //do fatherBusiness baba .... 此处省
     // 插入 t_father 表
    if (fatherMapper.inster(father)){
         //update t_grandfather set count=count+1 where id= #{grandfatherId}
         grandfatherMapper.updateCount(father.getGrandfatherId  ())  ;
     }
}


 /**
 * 处理 grandson 的业务
 */
 public void doGrandsonBusiness  (){
     //do grandson baba .... 此处省略
     // 插入 t_grandson 表
     if(grandsonMapper.inster(grandson)){
          //update t_grandfather set count=count+1 where id= #{grandfatherId}
          grandfatherMapper.updateCount(grandson.getGrandfatherId());
     }
}

当多个业务(线程)分别调用上面的方法时,都会对t_grandfather表的更新操作造成巨大的压力,特别是更新同一个id的情况下,mysql server内部对锁的竞争非常激烈。最后表现出来就如前文背景描述的一致。

解决方案

1. 临时处理方案:

一方面,在阿里云控制台,对sql进行限流,在正常阻塞的会话,强制kill掉,让数据的线程不阻塞着,释放资源,另外一方面,在把接收请求的服务减少节点数,目的是减少业务数据量进入;

2. 长久方案

一方面更改掉上面的业务逻辑,插入t_grandson表和t_father表时,不在去更新t_grandfather表的count字段;另一方面,需要用到count统计需求时,全部切换成别的方式;

总结

到此这篇关于一次Mysql update sql不当引起的生产故障的文章就介绍到这了,更多相关Mysql update sql生产故障内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
Mysql基础之常见函数
Apr 22 MySQL
虚拟机linux端mysql数据库无法远程访问的解决办法
May 26 MySQL
MySQL查看表和清空表的常用命令总结
May 26 MySQL
Mysql实现主从配置和多主多从配置
Jun 02 MySQL
MySQL系列之开篇 MySQL关系型数据库基础概念
Jul 02 MySQL
为什么MySQL 删除表数据 磁盘空间还一直被占用
Oct 16 MySQL
一条慢SQL语句引发的改造之路
Mar 16 MySQL
MySQL日期时间函数知识汇总
Mar 17 MySQL
MySQL分区路径子分区再分区
Apr 13 MySQL
pt-archiver 主键自增
Apr 26 MySQL
MySQL的存储过程和相关函数
Apr 26 MySQL
数据设计之权限的实现
Aug 05 MySQL
Mysql超详细讲解死锁问题的理解
Nebula Graph解决风控业务实践
MySQL实现配置主从复制项目实践
Mysql多层子查询示例代码(收藏夹案例)
Mar 31 #MySQL
MySQL Server层四个日志的实现
分享几个简单MySQL优化小妙招
MySQL Server 层四个日志
You might like
php批量删除数据库下指定前缀的表以prefix_为例
2014/08/24 PHP
laravel框架 laravel-admin上传图片到oss的方法
2019/10/13 PHP
Using the TextRange Object
2006/10/14 Javascript
js资料prototype 属性
2007/03/13 Javascript
利用js获取服务器时间的两个简单方法
2010/01/08 Javascript
DD_belatedPNG,IE6下PNG透明解决方案(国外)
2010/12/06 Javascript
jquery 使用简明教程
2014/03/05 Javascript
JavaScript中的this关键字使用详解
2015/08/14 Javascript
Bootstrap每天必学之响应式导航、轮播图
2016/04/25 Javascript
浅析在javascript中创建对象的各种模式
2016/05/06 Javascript
前端面试题及答案整理(二)
2016/08/26 Javascript
js获取元素的标签名实现方法
2016/10/08 Javascript
利用jQuery插件imgAreaSelect实现图片上传裁剪(放大缩小)
2016/12/02 Javascript
如何提高数据访问速度
2016/12/26 Javascript
微信小程序 基础知识css样式media标签
2017/02/15 Javascript
Angular 项目实现国际化的方法
2018/01/08 Javascript
浅谈node中的cluster集群
2018/06/02 Javascript
v-slot和slot、slot-scope之间相互替换实例
2020/09/04 Javascript
js 数据类型判断的方法
2020/12/03 Javascript
[01:25]2014DOTA2国际邀请赛 zhou分析LGD比赛情况
2014/07/14 DOTA
Python中优化NumPy包使用性能的教程
2015/04/23 Python
对python .txt文件读取及数据处理方法总结
2018/04/23 Python
Python内存读写操作示例
2018/07/18 Python
深入理解Python异常处理的哲学
2019/02/01 Python
Python中单线程、多线程和多进程的效率对比实验实例
2019/05/14 Python
Python Numpy 实现交换两行和两列的方法
2019/06/26 Python
pygame实现贪吃蛇游戏(下)
2019/10/29 Python
Python实现迪杰斯特拉算法过程解析
2020/09/18 Python
美国休闲服装品牌:Express
2016/09/24 全球购物
高中数学教学反思
2014/01/30 职场文书
商学院大学生求职的自我评价
2014/03/12 职场文书
工商企业管理专业自荐信范文
2014/04/12 职场文书
大学学生会竞选演讲稿
2014/04/25 职场文书
死者家属慰问信
2015/03/24 职场文书
Mysql超详细讲解死锁问题的理解
2022/04/01 MySQL
VMware虚拟机安装 Windows Server 2022的详细图文教程
2022/09/23 Servers