pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python计算最大优先级队列实例
Dec 18 Python
在Python中使用__slots__方法的详细教程
Apr 28 Python
python二分查找算法的递归实现方法
May 12 Python
Python之自动获取公网IP的实例讲解
Oct 01 Python
Python cookbook(数据结构与算法)字典相关计算问题示例
Feb 18 Python
Python+request+unittest实现接口测试框架集成实例
Mar 16 Python
Python 使用类写装饰器的小技巧
Sep 30 Python
对python借助百度云API对评论进行观点抽取的方法详解
Feb 21 Python
Python序列类型的打包和解包实例
Dec 21 Python
Python hmac模块使用实例解析
Dec 24 Python
Python Excel vlookup函数实现过程解析
Jun 22 Python
python前后端自定义分页器
Apr 13 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
phpMyAdmin通过密码漏洞留后门文件
2018/11/20 PHP
JavaScript 学习笔记(七)字符串的连接
2009/12/31 Javascript
jQuery Validation实例代码 让验证变得如此容易
2010/10/18 Javascript
javascript判断是手机还是电脑访问网页的简单实例分享
2014/06/03 Javascript
js实现点击图片改变页面背景图的方法
2015/02/28 Javascript
JavaScript将字符串转换为整数的方法
2015/04/14 Javascript
JavaScript多并发问题如何处理
2015/10/28 Javascript
JavaScript学习笔记之ES6数组方法
2016/03/25 Javascript
IONIC自定义subheader的最佳解决方案
2016/09/22 Javascript
Bootstrap table的使用方法
2016/11/02 Javascript
vuejs如何配置less
2017/04/25 Javascript
js学习总结_轮播图之渐隐渐现版(实例讲解)
2017/07/17 Javascript
js表单序列化判断空值的实例
2017/09/22 Javascript
Vue中使用webpack别名的方法实例详解
2018/06/19 Javascript
Vue 指令实现按钮级别权限管理功能
2019/04/23 Javascript
vue-resource:jsonp请求百度搜索的接口示例
2019/11/09 Javascript
nodeJs的安装与npm全局环境变量的配置详解
2020/01/06 NodeJs
Layer UI表格列日期格式化及取消自动填充日期的实现方法
2020/05/10 Javascript
vue 出现data-v-xxx的原因及解决
2020/08/04 Javascript
Python中正则表达式详解
2017/05/17 Python
Python中XlsxWriter模块简介与用法分析
2018/04/24 Python
520使用Python实现“我爱你”表白
2020/05/20 Python
vscode调试django项目的方法
2020/08/06 Python
如何使用PyCharm引入需要使用的包的方法
2020/09/22 Python
python爬虫多次请求超时的几种重试方法(6种)
2020/12/01 Python
详解Python调用系统命令的六种方法
2021/01/28 Python
用html5的canvas画布绘制贝塞尔曲线完整代码
2013/08/14 HTML / CSS
.NET初级开发工程师面试题
2014/04/18 面试题
门诊挂号室室长岗位职责
2013/11/27 职场文书
单位领导证婚词
2014/01/14 职场文书
婚礼主持结束词
2014/03/13 职场文书
教室标语大全
2014/06/21 职场文书
关于上班时间调整的通知
2015/04/23 职场文书
Python 中的 copy()和deepcopy()
2021/11/07 Python
Python实现制作销售数据可视化看板详解
2021/11/27 Python
Python中文分词库jieba(结巴分词)详细使用介绍
2022/04/07 Python