一次SQL如何查重及去重的实战记录


Posted in MySQL onMarch 13, 2022

前言

在使用SQL提数的时候,常会遇到表内有重复值的时候,就需要做去重,本文归类了常用方法。

⛳️ 1.distinct

题目:现在运营需要查看用户来自于哪些学校,请从用户信息表中取出学校的去重数据

示例:user_profile

一次SQL如何查重及去重的实战记录

mysql>SELECT DISTINCT university FROM user_profile;
??根据示例,查询返回以下结果

一次SQL如何查重及去重的实战记录

??小贴士:

SQL中关键词distinct去重:
英语中distinct 代表独一无二的意思,
他在SQL表示去重的意思:比如本题中university这一列出现了两次北京大学,
使用distinct进行去重查询后,则北京大学只出现一次。
distinct 通常效率较低
distinct 使用中,放在 select 后边,对后面所有的字段的值统一进行去重

?? 拓展:

题目:现在运营需要查看用户的总数
select count(distinct university) from user_profile;

⛳️ 2.group by

?? 举个栗子,现有这样一张表 task

一次SQL如何查重及去重的实战记录

备注:
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意:一个任务对应多条订单

题目:列出任务总数

????根据示例,查询方法如下:

第1步:列出 task_id 的所有唯一值(去重后的记录,null也是值)

select task_id
from Task
group by task_id;

第二步: 任务总数

select count(task_id) task_num
from (select task_id
from Task
group by task_id) tmp;

⛳️ 3.row_number 窗口函数

?? 举个栗子,现有这样一张表 task

一次SQL如何查重及去重的实战记录

备注:
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意:一个任务对应多条订单

题目:查询整个表重复的数据

??根据示例,查询方法如下:

– 在支持窗口函数的 sql 中使用

select count(case when rn=1 then task_id else null end) task_num
from (select task_id
, row_number() over (partition by task_id order by start_time) rn
from Task) tmp;

??小贴士:

MySQL8.0 中可以利用 ROW_NUMBER(),DENSE_RANK(),RANK() 三个窗口函数来实现排序

需要注意的一点是 as 后的别名,千万不要与前面的函数名重名,否则会报错

下面给出这三种函数实现排名的案例:

–三条语句对于上面三种排名

select xuehao,score, ROW_NUMBER() OVER(order by score desc) as row_r from scores_tb;
select xuehao,score, DENSE_RANK() OVER(order by score desc) as dense_r from scores_tb;
select xuehao,score, RANK() over(order by score desc) as r from scores_tb;

– 一条语句也可以查询出不同排名

SELECT xuehao,score,
ROW_NUMBER() OVER w AS ‘row_r',
DENSE_RANK() OVER w AS ‘dense_r',
RANK() OVER w AS ‘r'
FROM scores_tb
WINDOW w AS (ORDER BY score desc);

⛳️ 4.删除重复数据

创建测试数据

我们创建一个人员信息表并在里面插入一些重复的数据

CREATE TABLE Person(
id int auto_increment primary key comment ‘主键',
Name VARCHAR(20) NULL,
Age INT NULL,
Address VARCHAR(20) NULL,
Sex CHAR(2) NULL
);
INSERT INTO Person(ID,Name,Age,Address,Sex)
VALUES
( 1, ‘张三', 18, ‘北京路18号', ‘男' ),
( 2, ‘李四', 19, ‘北京路29号', ‘男' ),
( 3, ‘王五', 19, ‘南京路11号', ‘女' ),
( 4, ‘张三', 18, ‘北京路18号', ‘男' ),
( 5, ‘李四', 19, ‘北京路29号', ‘男' ),
( 6, ‘张三', 18, ‘北京路18号', ‘男' ),
( 7, ‘王五', 19, ‘南京路11号', ‘女' ),
( 8, ‘马六', 18, ‘南京路19号', ‘女' );

一次SQL如何查重及去重的实战记录

题目:数据库中存在重复记录,删除保留其中一条

我们发现除了自增长ID不同以为,有几条其他字段都重复的数据出现

? 第一步:找出重复的数据

mysql>SELECT MAX(ID) ID,
Name,Age,Address,Sex
FROM Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1

一次SQL如何查重及去重的实战记录

??小贴士:

HAVING将分组后统计出来的数量大于1的数据行,就是我们要找的重复数据

上面用Max函数或者Min函数均可,只是为了保证取出来的数据的唯一性。

? 第二步:删除重复的数据

其实我们数据库中最后要保留的结果就是第二步中查询出来的数据,

我们把其他的数据删除即可。

怎么删除呢?我们使用ID来排除。

DELETE FROM Person
WHERE EXISTS
(
SELECT * FROM (
SELECT
MAX(ID) ID,
Name,Age,Address,Sex
FROM Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1) T
WHERE Person.Name=T.Name
AND Person.Age=T.Age
AND Person.Address=T.Address
AND Person.Sex=T.Sex
AND Person.ID<T.ID
)

执行完后重新查询Person表结果如下

马六因为只有一条记录,所以没有参与去重,直接显示。

一次SQL如何查重及去重的实战记录

总结

到此这篇关于SQL如何查重及去重的文章就介绍到这了,更多相关SQL查重去重内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

MySQL 相关文章推荐
mysql多表查询-笔记七
Apr 05 MySQL
数据库连接池
Apr 06 MySQL
MySQL 常见存储引擎的优劣
Jun 02 MySQL
MySQL不使用order by实现排名的三种思路总结
Jun 02 MySQL
浅析MySQL如何实现事务隔离
Jun 26 MySQL
MySQL Shell import_table数据导入的实现
Aug 07 MySQL
MySQL之select、distinct、limit的使用
Nov 11 MySQL
MySQL中一条SQL查询语句是如何执行的
Apr 08 MySQL
MySQL的prepare使用以及遇到的bug
May 11 MySQL
MySQL数据库之存储过程 procedure
Jun 16 MySQL
MySQL的表级锁,行级锁,排它锁和共享锁
Jul 15 MySQL
MySQL中dd::columns表结构转table过程及应用详解
Sep 23 MySQL
面试提问mysql一张表到底能存多少数据
MySQL的索引你了解吗
面试中老生常谈的MySQL问答集锦夯实基础
浅谈如何保证Mysql主从一致
MySQL数据库如何给表设置约束详解
Mar 13 #MySQL
Mysql外键约束的创建与删除的使用
Mar 03 #MySQL
解决MySQL添加新用户-ERROR 1045 (28000)的问题
Mar 03 #MySQL
You might like
在PHP中操作Excel实例代码
2010/04/29 PHP
php去掉URL网址中带有PHPSESSID的配置方法
2014/07/08 PHP
PHP Session机制简介及用法
2014/08/19 PHP
WIFI万能钥匙密码查询接口实例
2015/09/28 PHP
用javascript实现在小方框中浏览大图的代码
2007/08/14 Javascript
javascript支持firefox,ie7页面布局拖拽效果代码
2007/12/20 Javascript
使用JavaScript开发IE浏览器本地插件实例
2015/02/18 Javascript
jquery实现列表上下移动功能
2016/02/25 Javascript
jQuery EasyUI API 中文帮助文档和扩展实例
2016/08/01 Javascript
Vue.js 表单校验插件
2016/08/14 Javascript
javascript使用闭包模拟对象的私有属性和方法
2016/10/05 Javascript
详解Vue 开发模式下跨域问题
2017/06/06 Javascript
小程序自定义日历效果
2018/12/29 Javascript
详解wepy开发小程序踩过的坑(小结)
2019/05/22 Javascript
[02:44]DOTA2英雄基础教程 魅惑魔女
2014/01/07 DOTA
使用Python脚本将绝对url替换为相对url的教程
2015/04/24 Python
进一步探究Python中的正则表达式
2015/04/28 Python
使用python实现rsa算法代码
2016/02/17 Python
pycharm设置注释颜色的方法
2018/05/23 Python
pandas.dataframe中根据条件获取元素所在的位置方法(索引)
2018/06/07 Python
在python下读取并展示raw格式的图片实例
2019/01/24 Python
python七夕浪漫表白源码
2019/04/05 Python
Django中自定义admin Xadmin的实现代码
2019/08/09 Python
Python 实现 T00ls 自动签到脚本代码(邮件+钉钉通知)
2020/07/06 Python
用python读取xlsx文件
2020/12/17 Python
python利用xpath爬取网上数据并存储到django模型中
2021/02/26 Python
HTML5实现应用程序缓存(Application Cache)
2020/06/16 HTML / CSS
任课老师推荐信范文
2013/11/24 职场文书
加多宝凉茶广告词
2014/03/18 职场文书
公民授权委托书范本
2014/09/17 职场文书
2014入党积极分子批评与自我批评思想报告
2014/10/06 职场文书
乡镇防汛工作汇报
2014/10/28 职场文书
2014年销售助理工作总结
2014/12/01 职场文书
2014年食品安全工作总结
2014/12/04 职场文书
仓库保管员岗位职责
2015/02/09 职场文书
Ajax实现三级联动效果
2021/10/05 Javascript