pd.drop_duplicates删除重复行的方法实现


Posted in Python onJune 16, 2022

drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。

一、使用语法及参数

使用语法:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

参数:

  • subset – 指定特定的列 默认所有列
  • keep:{‘first’, ‘last’, False} – 删除重复项并保留第一次出现的项 默认第一个
  • keep=False – 表示删除所有重复项 不保留
  • inplace – 是否直接修改原对象
  • gnore_index=True – 重置索引 (version 1.0.0 才有这个参数)

二、实操

1.例子一

import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
                   'b':['a','b','a','b']})

# 单列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
   a  b
0  1  a
1  1  b
'''

# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)

# 删除所有重复项 不保留
df.drop_duplicates(subset=['a', 'b'], False)

2.例子二

# 构建测试数据框
import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})

# 默认按所有列去重
df.drop_duplicates()

# 指定列
df.drop_duplicates(subset=['brand'])

# 保留最后一个重复值
df.drop_duplicates(subset=['brand', 'style'], keep='last')

3.删除重复项后重置索引

# 方法一
df.drop_duplicates(ignore_index=True)

# 方法二
df.drop_duplicates().reset_index(drop=True)

# 方法三
df.index = range(df.shape[0])

到此这篇关于pd.drop_duplicates删除重复行的方法实现的文章就介绍到这了,更多相关pd.drop_duplicates删除重复行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python列表list解析操作示例【整数操作、字符操作、矩阵操作】
Jul 25 Python
matplotlib设置legend图例代码示例
Dec 19 Python
Python Flask基础教程示例代码
Feb 07 Python
Python实现的根据IP地址计算子网掩码位数功能示例
May 23 Python
浅谈python中np.array的shape( ,)与( ,1)的区别
Jun 04 Python
Python实现App自动签到领取积分功能
Sep 29 Python
python交互界面的退出方法
Feb 16 Python
在Python中COM口的调用方法
Jul 03 Python
python保留小数位的三种实现方法
Jan 07 Python
基于pygame实现童年掌机打砖块游戏
Feb 25 Python
Python 循环读取数据内存不足的解决方案
May 25 Python
python中%格式表达式实例用法
Jun 18 Python
使用pd.merge表连接出现多余行的问题解决
Jun 16 #Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
You might like
星际争霸 Starcraft 秘技补丁
2020/03/14 星际争霸
第十节 抽象方法和抽象类 [10]
2006/10/09 PHP
Search File Contents PHP 搜索目录文本内容的代码
2010/02/21 PHP
asp(javascript)全角半角转换代码 dbc2sbc
2009/08/06 Javascript
文本框的字数限制功能jquery插件
2009/11/24 Javascript
ExtJs3.0中Store添加 baseParams 的Bug
2010/03/10 Javascript
在每个匹配元素的外部插入新元素的方法
2013/12/20 Javascript
JQuery自适应窗口大小导航菜单附源码下载
2015/09/01 Javascript
javascript iframe跨域详解
2016/10/26 Javascript
jQuery插件WebUploader实现文件上传
2016/11/07 Javascript
jQuery实现删除li节点的方法
2016/12/06 Javascript
jQuery操作复选框(CheckBox)的取值赋值实现代码
2017/01/10 Javascript
javascript获取以及设置光标位置
2017/02/16 Javascript
jQuery 实时保存页面动态添加的数据的示例
2017/08/14 jQuery
官方推荐react-navigation的具体使用详解
2018/05/08 Javascript
Vue2.0点击切换类名改变样式的方法
2018/08/22 Javascript
bootstrapTable+ajax加载数据 refresh更新数据
2018/08/31 Javascript
vue实现一拉到底的滑动验证
2019/07/25 Javascript
深入浅析Vue中mixin和extend的区别和使用场景
2019/08/01 Javascript
微信小程序错误this.setData报错及解决过程
2019/09/18 Javascript
vue element 关闭当前tab 跳转到上一路由操作
2020/07/22 Javascript
JavaScript代码简化技巧实例解析
2020/09/09 Javascript
[04:52]DOTA2亚洲邀请赛附加赛 TOP10精彩集锦
2015/01/29 DOTA
在Django中创建动态视图的教程
2015/07/15 Python
Python实现多线程HTTP下载器示例
2017/02/11 Python
Python利用splinter实现浏览器自动化操作方法
2018/05/11 Python
Python实现栈和队列的简单操作方法示例
2019/11/29 Python
python 微信好友特征数据分析及可视化
2020/01/07 Python
如何利用Python 进行边缘检测
2020/10/14 Python
阿迪达斯意大利在线商店:adidas意大利
2016/09/19 全球购物
汇科协同Java笔试题
2012/03/31 面试题
三八妇女节活动总结
2014/05/04 职场文书
城管大队整治方案
2014/05/06 职场文书
学习教师敬业奉献模范事迹材料思想汇报
2014/09/19 职场文书
房屋租赁授权委托书范本
2014/09/20 职场文书
人力资源部岗位职责
2015/02/11 职场文书