数据库 MySQL

一次SQL如何查重及去重的实战记录

Posted in MySQL onMarch 13, 2022

前言

在使用SQL提数的时候，常会遇到表内有重复值的时候，就需要做去重，本文归类了常用方法。

⛳️ 1.distinct

题目：现在运营需要查看用户来自于哪些学校，请从用户信息表中取出学校的去重数据

示例:user_profile

一次SQL如何查重及去重的实战记录

mysql>SELECT DISTINCT university FROM user_profile;
??根据示例，查询返回以下结果

一次SQL如何查重及去重的实战记录

??小贴士：

SQL中关键词distinct去重：
英语中distinct 代表独一无二的意思，
他在SQL表示去重的意思：比如本题中university这一列出现了两次北京大学，
使用distinct进行去重查询后，则北京大学只出现一次。
distinct 通常效率较低
distinct 使用中，放在 select 后边，对后面所有的字段的值统一进行去重

?? 拓展：

题目：现在运营需要查看用户的总数
select count(distinct university) from user_profile;

⛳️ 2.group by

?? 举个栗子，现有这样一张表 task

一次SQL如何查重及去重的实战记录

备注：
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意：一个任务对应多条订单

题目：列出任务总数

????根据示例，查询方法如下：

第1步：列出 task_id 的所有唯一值（去重后的记录,null也是值）

select task_id
from Task
group by task_id;

第二步：任务总数

select count(task_id) task_num
from (select task_id
from Task
group by task_id) tmp;

⛳️ 3.row_number 窗口函数

?? 举个栗子，现有这样一张表 task

一次SQL如何查重及去重的实战记录

备注：
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意：一个任务对应多条订单

题目：查询整个表重复的数据

??根据示例，查询方法如下：

– 在支持窗口函数的 sql 中使用

select count(case when rn=1 then task_id else null end) task_num
from (select task_id
, row_number() over (partition by task_id order by start_time) rn
from Task) tmp;

??小贴士：

MySQL8.0 中可以利用 ROW_NUMBER()，DENSE_RANK()，RANK() 三个窗口函数来实现排序

需要注意的一点是 as 后的别名，千万不要与前面的函数名重名，否则会报错

下面给出这三种函数实现排名的案例：

–三条语句对于上面三种排名

select xuehao,score, ROW_NUMBER() OVER(order by score desc) as row_r from scores_tb;
select xuehao,score, DENSE_RANK() OVER(order by score desc) as dense_r from scores_tb;
select xuehao,score, RANK() over(order by score desc) as r from scores_tb;

– 一条语句也可以查询出不同排名

SELECT xuehao,score,
ROW_NUMBER() OVER w AS ‘row_r',
DENSE_RANK() OVER w AS ‘dense_r',
RANK() OVER w AS ‘r'
FROM scores_tb
WINDOW w AS (ORDER BY score desc);

⛳️ 4.删除重复数据

创建测试数据

我们创建一个人员信息表并在里面插入一些重复的数据

CREATE TABLE Person(
id int auto_increment primary key comment ‘主键',
Name VARCHAR(20) NULL,
Age INT NULL,
Address VARCHAR(20) NULL,
Sex CHAR(2) NULL
);

INSERT INTO Person(ID,Name,Age,Address,Sex)
VALUES
( 1, ‘张三', 18, ‘北京路18号', ‘男' ),
( 2, ‘李四', 19, ‘北京路29号', ‘男' ),
( 3, ‘王五', 19, ‘南京路11号', ‘女' ),
( 4, ‘张三', 18, ‘北京路18号', ‘男' ),
( 5, ‘李四', 19, ‘北京路29号', ‘男' ),
( 6, ‘张三', 18, ‘北京路18号', ‘男' ),
( 7, ‘王五', 19, ‘南京路11号', ‘女' ),
( 8, ‘马六', 18, ‘南京路19号', ‘女' );

一次SQL如何查重及去重的实战记录

题目：数据库中存在重复记录，删除保留其中一条

我们发现除了自增长ID不同以为，有几条其他字段都重复的数据出现

? 第一步：找出重复的数据

mysql>SELECT MAX(ID) ID,
Name,Age,Address,Sex
FROM Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1

一次SQL如何查重及去重的实战记录

??小贴士：

HAVING将分组后统计出来的数量大于1的数据行，就是我们要找的重复数据

上面用Max函数或者Min函数均可，只是为了保证取出来的数据的唯一性。

? 第二步：删除重复的数据

其实我们数据库中最后要保留的结果就是第二步中查询出来的数据，

我们把其他的数据删除即可。

怎么删除呢？我们使用ID来排除。

DELETE FROM Person
WHERE EXISTS
(
SELECT * FROM (
SELECT
MAX(ID) ID,
Name,Age,Address,Sex
FROM Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1) T
WHERE Person.Name=T.Name
AND Person.Age=T.Age
AND Person.Address=T.Address
AND Person.Sex=T.Sex
AND Person.ID<T.ID
)

执行完后重新查询Person表结果如下

马六因为只有一条记录，所以没有参与去重，直接显示。

一次SQL如何查重及去重的实战记录

总结

到此这篇关于SQL如何查重及去重的文章就介绍到这了,更多相关SQL查重去重内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

一次SQL如何查重及去重的实战记录

- Author -

IT邦德

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

MySQL 相关文章推荐

Idea连接MySQL数据库出现中文乱码的问题

Apr 14 MySQL

解决MySQL存储时间出现不一致的问题

Apr 28 MySQL

MySQL数字类型自增的坑

May 07 MySQL

详细谈谈MYSQL中的COLLATE是什么

Jun 11 MySQL

Mysql数据库值的添加、修改、删除及清空操作实例

Jun 20 MySQL

MySQL 8.0 驱动与阿里druid版本兼容问题解决

Jul 01 MySQL

MySQL系列之四 SQL语法

Jul 02 MySQL

MySQL系列之十四 MySQL的高可用实现

Jul 02 MySQL

MySQL 开窗函数

Feb 15 MySQL

Mysql如何实现不存在则插入,存在则更新

Mar 25 MySQL

MySQL库表太大怎么办? 数据库分库分表项目实践

Apr 11 MySQL

MySQL如何修改字段类型和字段长度

Jun 10 MySQL

面试提问mysql一张表到底能存多少数据

MySQL的索引你了解吗

面试中老生常谈的MySQL问答集锦夯实基础

浅谈如何保证Mysql主从一致

MySQL数据库如何给表设置约束详解

Mar 13 #MySQL

Mysql外键约束的创建与删除的使用

Mar 03 #MySQL

解决MySQL添加新用户-ERROR 1045 (28000)的问题

Mar 03 #MySQL

You might like

redis 队列操作的例子(php)

2012/04/12 PHP

php实现将Session写入数据库

2015/07/26 PHP

PHP定义字符串的四种方式详解

2018/02/06 PHP

简单的无缝滚动程序-仅几行代码

2007/05/08 Javascript

读jQuery之四（优雅的迭代）

2011/06/20 Javascript

利用谷歌地图API获取点与点的距离的js代码

2012/10/11 Javascript

js禁止document element对象选中文本实现代码

2013/03/21 Javascript

把字符串按照特定的字母顺序进行排序的js代码

2014/01/28 Javascript

Jquery获得控件值的三种方法总结

2014/02/13 Javascript

jquery uploadify 在FF下无效的解决办法

2014/09/26 Javascript

js实现带圆角的多级下拉菜单效果

2015/08/28 Javascript

jQuery控制DIV层实现由大到小，由远及近动画变化效果

2015/10/09 Javascript

JavaScript中的this,call,apply使用及区别详解

2016/01/29 Javascript

浅谈JS继承_借用构造函数 & 组合式继承

2016/08/16 Javascript

JavaScript中动态向表格添加数据

2017/01/24 Javascript

JavaScript字符串_动力节点Java学院整理

2017/06/27 Javascript

Vue2.0 事件的广播与接收(观察者模式)

2018/03/14 Javascript

js+canvas实现验证码功能

2020/09/21 Javascript

angular2实现统一的http请求头方法

2018/08/13 Javascript

python中__call__方法示例分析

2014/10/11 Python

Python实现的矩阵转置与矩阵相乘运算示例

2019/03/26 Python

python中使用ctypes调用so传参设置遇到的问题及解决方法

2019/06/19 Python

Python属性和内建属性实例解析

2020/01/14 Python

解决python replace函数替换无效问题

2020/01/18 Python

基于HTML5的WebGL经典3D虚拟机房漫游动画

2017/11/15 HTML / CSS

html5利用canvas实现颜色容差抠图功能

2019/12/23 HTML / CSS

vivo智能手机官方商城：vivo

2016/09/22 全球购物

全球最大的瓷器、水晶和银器零售商：Replacements

2020/06/15 全球购物

公务员培训心得体会

2013/12/28 职场文书

房地产项目建议书

2014/03/12 职场文书

结婚喜宴主持词

2014/03/14 职场文书

安全宣传标语口号

2014/06/06 职场文书

工作证明范本（2篇）

2014/09/14 职场文书

中标通知书格式

2015/04/17 职场文书

原告离婚代理词

2015/05/23 职场文书

焦裕禄观后感

2015/06/03 职场文书

一次SQL如何查重及去重的实战记录

目录

前言

⛳️ 1.distinct

⛳️ 2.group by

⛳️ 3.row_number 窗口函数

⛳️ 4.删除重复数据

? 第一步：找出重复的数据

? 第二步：删除重复的数据

总结