pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
基于ID3决策树算法的实现(Python版)
May 31 Python
对python使用http、https代理的实例讲解
May 07 Python
Python对ElasticSearch获取数据及操作
Apr 24 Python
python多线程共享变量的使用和效率方法
Jul 16 Python
python scrapy爬虫代码及填坑
Aug 12 Python
Python 模拟动态产生字母验证码图片功能
Dec 24 Python
Python基础之字典常见操作经典实例详解
Feb 26 Python
python3中的logging记录日志实现过程及封装成类的操作
May 12 Python
Python pandas 列转行操作详解(类似hive中explode方法)
May 18 Python
python如何实现word批量转HTML
Sep 30 Python
Pytorch 如何加速Dataloader提升数据读取速度
May 28 Python
Python自动化测试PO模型封装过程详解
Jun 22 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
浅析php适配器模式(Adapter)
2014/11/25 PHP
php mysql_real_escape_string addslashes及mysql绑定参数防SQL注入攻击
2016/12/23 PHP
PHP两个n位的二进制整数相加问题的解决
2018/08/26 PHP
Centos7安装swoole扩展操作示例
2020/03/26 PHP
索趣科技的答案
2007/02/07 Javascript
JavaScript 权威指南(第四版) 读书笔记
2009/08/11 Javascript
JavaScript中链式调用之研习
2011/04/07 Javascript
node.js中的buffer.fill方法使用说明
2014/12/14 Javascript
js实现进度条的方法
2015/02/13 Javascript
JavaScript返回网页中超链接数量的方法
2015/04/03 Javascript
JSON与XML的区别对比及案例应用
2016/11/11 Javascript
JavaScript使用localStorage存储数据
2019/09/25 Javascript
react 原生实现头像滚动播放的示例
2020/04/21 Javascript
在antd Form表单中select设置初始值操作
2020/11/02 Javascript
详解Python中的__new__()方法的使用
2015/04/09 Python
详解Django框架中的视图级缓存
2015/07/23 Python
Python中struct模块对字节流/二进制流的操作教程
2017/01/21 Python
python的exec、eval使用分析
2017/12/11 Python
Python中装饰器高级用法详解
2017/12/25 Python
python编程培训 python培训靠谱吗
2018/01/17 Python
python pandas dataframe 行列选择,切片操作方法
2018/04/10 Python
Django项目开发中cookies和session的常用操作分析
2018/07/03 Python
Python实现全排列的打印
2018/08/18 Python
python程序控制NAO机器人行走
2019/04/29 Python
python将字母转化为数字实例方法
2019/10/04 Python
Python WebSocket长连接心跳与短连接的示例
2020/11/24 Python
在HTML5 canvas里用卷积核进行图像处理的方法
2018/05/02 HTML / CSS
丝芙兰法国官网:SEPHORA法国
2016/09/01 全球购物
美国最大的高尔夫发球时间预订网站:TeeOff.com
2018/03/28 全球购物
Internet体系结构
2014/12/21 面试题
会计员岗位职责
2014/03/15 职场文书
个人总结与自我评价
2014/09/18 职场文书
赵乐秦在党的群众路线教育实践活动总结大会上的讲话稿
2014/10/25 职场文书
爱护公物主题班会
2015/08/17 职场文书
经典人生语录分享:不畏将来,不念过去,笑对当下
2019/12/12 职场文书
英国数字版游戏销量周榜公布 《小缇娜的奇幻之地》登顶
2022/04/03 其他游戏