pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中的闭包用法实例详解
May 05 Python
转换科学计数法的数值字符串为decimal类型的方法
Jul 16 Python
python中使用zip函数出现错误的原因
Sep 28 Python
python 并发编程 非阻塞IO模型原理解析
Aug 20 Python
python实现输入任意一个大写字母生成金字塔的示例
Oct 27 Python
python 实现保存最新的三份文件,其余的都删掉
Dec 22 Python
pytorch masked_fill报错的解决
Feb 18 Python
python对XML文件的操作实现代码
Mar 27 Python
利用Python制作动态排名图的实现代码
Apr 09 Python
pytorch 中autograd.grad()函数的用法说明
May 12 Python
粗暴解决CUDA out of memory的问题
May 22 Python
python缺失值填充方法示例代码
Dec 24 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
php 获取百度的热词数据的代码
2012/02/18 PHP
PHP防止跨域提交表单
2013/11/01 PHP
php实现上传图片生成缩略图示例
2014/04/13 PHP
ASP和PHP实现生成网站快捷方式并下载到桌面的方法
2014/05/08 PHP
PHP模拟http请求的方法详解
2016/11/09 PHP
PHP中file_put_contents追加和换行的实现方法
2017/04/01 PHP
visual studio code 调试php方法(图文详解)
2017/09/15 PHP
thinkphp 中的volist标签在ajax操作中的特殊性(推荐)
2018/01/15 PHP
基于PHP实现发微博动态代码实例
2020/12/11 PHP
Alliance vs AM BO3 第一场2.13
2021/03/10 DOTA
文字幻灯片
2006/06/26 Javascript
javascript中删除指定数组中指定的元素的代码
2011/02/12 Javascript
禁止页面刷新让F5快捷键及右键都无效
2014/01/22 Javascript
JavaScript中的变量定义与储存介绍
2014/12/31 Javascript
使用AngularJS编写较为优美的JavaScript代码指南
2015/06/19 Javascript
javascript控制台详解
2015/06/25 Javascript
javascript倒计时效果实现
2015/11/12 Javascript
jQuery实现下拉框功能实例代码
2016/05/06 Javascript
Angular工具方法学习
2016/12/26 Javascript
jQuery插件FusionCharts绘制的3D饼状图效果实例【附demo源码下载】
2017/03/03 Javascript
详解angularjs利用ui-route异步加载组件
2017/05/21 Javascript
深入浅析JSONAPI在PHP中的应用
2017/12/24 Javascript
[06:04]DOTA2英雄梦之声Vol19卓尔游侠
2014/06/20 DOTA
[02:51]DOTA2 Supermajor小组分组对阵抽签仪式
2018/06/01 DOTA
python获得两个数组交集、并集、差集的方法
2015/03/27 Python
python实现发送和获取手机短信验证码
2016/01/15 Python
CentOS 6.5中安装Python 3.6.2的方法步骤
2017/12/03 Python
python中几种自动微分库解析
2019/08/29 Python
Python GUI库PyQt5图形和特效样式QSS介绍
2020/02/25 Python
简单了解python列表和元组的区别
2020/05/14 Python
北京SQL新华信咨询
2016/09/30 面试题
介绍一下sql server的安全性
2014/08/10 面试题
班级出游活动计划书
2014/08/15 职场文书
2015大学自主招生自荐信范文
2015/03/04 职场文书
交通事故代理词范文
2015/05/23 职场文书
Python中requests库的用法详解
2022/06/05 Python