pd.drop_duplicates删除重复行的方法实现


Posted in Python onJune 16, 2022

drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。

一、使用语法及参数

使用语法:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

参数:

  • subset – 指定特定的列 默认所有列
  • keep:{‘first’, ‘last’, False} – 删除重复项并保留第一次出现的项 默认第一个
  • keep=False – 表示删除所有重复项 不保留
  • inplace – 是否直接修改原对象
  • gnore_index=True – 重置索引 (version 1.0.0 才有这个参数)

二、实操

1.例子一

import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
                   'b':['a','b','a','b']})

# 单列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
   a  b
0  1  a
1  1  b
'''

# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)

# 删除所有重复项 不保留
df.drop_duplicates(subset=['a', 'b'], False)

2.例子二

# 构建测试数据框
import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})

# 默认按所有列去重
df.drop_duplicates()

# 指定列
df.drop_duplicates(subset=['brand'])

# 保留最后一个重复值
df.drop_duplicates(subset=['brand', 'style'], keep='last')

3.删除重复项后重置索引

# 方法一
df.drop_duplicates(ignore_index=True)

# 方法二
df.drop_duplicates().reset_index(drop=True)

# 方法三
df.index = range(df.shape[0])

到此这篇关于pd.drop_duplicates删除重复行的方法实现的文章就介绍到这了,更多相关pd.drop_duplicates删除重复行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中查找excel某一列的重复数据 剔除之后打印
Feb 10 Python
Python列表推导式的使用方法
Nov 21 Python
python和pyqt实现360的CLable控件
Feb 21 Python
python使用cookie库操保存cookie详解
Mar 03 Python
python3.4下django集成使用xadmin后台的方法
Aug 15 Python
python中实现指定时间调用函数示例代码
Sep 08 Python
详解 Python 与文件对象共事的实例
Sep 11 Python
Python如何发布程序的详细教程
Oct 09 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 Python
Python3 元组tuple入门基础
Feb 09 Python
Python 3.8 新功能来一波(大部分人都不知道)
Mar 11 Python
Python json解析库jsonpath原理及使用示例
Nov 25 Python
使用pd.merge表连接出现多余行的问题解决
Jun 16 #Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
You might like
PHP 自定义错误处理函数trigger_error()
2013/03/26 PHP
PHP中的插件机制原理和实例
2014/07/08 PHP
Symfony2安装第三方Bundles实例详解
2016/02/04 PHP
php开发最强大的IDE编辑的phpstorm 2020.2配置Xdebug调试的详细教程
2020/08/17 PHP
Google韩国首页图标动画效果
2007/08/26 Javascript
JavaScript中json使用自己总结
2013/08/13 Javascript
js实现遮罩层划出效果是生成div而不是显示
2014/07/29 Javascript
详谈JavaScript 匿名函数及闭包
2014/11/14 Javascript
jQuery插件简单实现方法
2015/07/18 Javascript
jquery+ajax实现直接提交表单实例分析
2016/06/17 Javascript
Bootstrap Table使用方法详解
2016/08/01 Javascript
javascript 操作cookies详解及实例
2017/02/22 Javascript
Vue学习之路之登录注册实例代码
2017/07/06 Javascript
基于Bootstrap表单验证功能
2017/11/17 Javascript
bootstrap自定义样式之bootstrap实现侧边导航栏功能
2018/09/10 Javascript
Python算法之求n个节点不同二叉树个数
2017/10/27 Python
Python实现的双色球生成功能示例
2017/12/18 Python
Python星号*与**用法分析
2018/02/02 Python
Python FTP两个文件夹间的同步实例代码
2018/05/25 Python
解决pycharm工程启动卡住没反应的问题
2019/01/19 Python
在Python中将函数作为另一个函数的参数传入并调用的方法
2019/01/22 Python
对Python中的条件判断、循环以及循环的终止方法详解
2019/02/08 Python
对PyQt5的输入对话框使用(QInputDialog)详解
2019/06/25 Python
Python实现字符串中某个字母的替代功能
2019/10/21 Python
Python异常模块traceback用法实例分析
2019/10/22 Python
Python数据分析pandas模块用法实例详解
2019/11/20 Python
Python lxml模块的基本使用方法分析
2019/12/21 Python
python 检测nginx服务邮件报警的脚本
2020/12/31 Python
django项目中使用云片网发送短信验证码的实现
2021/01/19 Python
某IT外企面试题-二分法求方程!看看大家的C++功底
2015/07/04 面试题
数据库专业英语
2012/11/30 面试题
综合实践教学反思
2014/01/31 职场文书
个人自我评价范文
2014/02/05 职场文书
个人贷款授权委托书样本
2014/10/07 职场文书
Python基础之Socket通信原理
2021/04/22 Python
HTML基础详解(下)
2021/10/16 HTML / CSS