pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用fileinput模块实现逐行读取文件的方法
Apr 29 Python
Python将阿拉伯数字转换为罗马数字的方法
Jul 10 Python
Python操作Access数据库基本步骤分析
Sep 19 Python
python 除法保留两位小数点的方法
Jul 16 Python
python3的url编码和解码,自定义gbk、utf-8的例子
Aug 22 Python
python对象转字典的两种实现方式示例
Nov 07 Python
大家都说好用的Python命令行库click的使用
Nov 07 Python
TensorFLow 不同大小图片的TFrecords存取实例
Jan 20 Python
Python改变对象的字符串显示的方法
Aug 01 Python
python一些性能分析的技巧
Aug 30 Python
解决python 执行shell命令无法获取返回值的问题
Dec 05 Python
Python爬取奶茶店数据分析哪家最好喝以及性价比
Sep 23 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
discuz 首页四格:最新话题+最新回复+热门话题+精华文章插件
2007/08/19 PHP
php模拟asp中的XmlHttpRequest实现http请求的代码
2011/03/24 PHP
需要注意的几个PHP漏洞小结
2012/02/05 PHP
php中设置index.php文件为只读的方法
2013/02/06 PHP
SESSION存放在数据库用法实例
2015/08/08 PHP
详解在PHP的Yii框架中使用行为Behaviors的方法
2016/03/18 PHP
thinkphp5 migrate数据库迁移工具
2018/02/20 PHP
PHPExcel 修改已存在Excel的方法
2018/05/03 PHP
JQuery里面的几种选择器 查找满足条件的元素$("#控件ID")
2011/08/23 Javascript
Node.js实战 建立简单的Web服务器
2012/03/08 Javascript
jQuery中setTimeout的几种使用方法小结
2013/04/07 Javascript
javascript利用apply和arguments复用方法
2013/11/25 Javascript
结合JQ1.9通过js正则判断各种浏览器版本的方法
2013/12/30 Javascript
jQuery之DOM对象和jQuery对象的转换与区别分析
2015/01/08 Javascript
JS实现网页每隔3秒弹出一次对话框的方法
2015/11/09 Javascript
基于Bootstrap使用jQuery实现输入框组input-group的添加与删除
2016/05/03 Javascript
详解JavaScript中基于原型prototype的继承特性
2016/05/05 Javascript
JavaScript和jquery获取父级元素、子级元素、兄弟元素的方法
2016/06/05 Javascript
Angularjs结合Bootstrap制作的一个TODO List
2016/08/18 Javascript
把json格式的字符串转换成javascript对象或数组的方法总结
2016/11/03 Javascript
微信小程序修改数组长度的问题的解决
2019/12/17 Javascript
解决vue项目axios每次请求session不一致的问题
2020/10/24 Javascript
python基于mysql实现的简单队列以及跨进程锁实例详解
2014/07/07 Python
Python使用matplotlib填充图形指定区域代码示例
2018/01/16 Python
用python处理图片实现图像中的像素访问
2018/05/04 Python
Python 批量合并多个txt文件的实例讲解
2018/05/08 Python
python实现屏保计时器的示例代码
2018/08/08 Python
Tensorflow实现酸奶销量预测分析
2019/07/19 Python
Python matplotlib生成图片背景透明的示例代码
2019/08/30 Python
Python基于pandas爬取网页表格数据
2020/05/11 Python
python简单实现9宫格图片实例
2020/09/03 Python
新西兰廉价汽车租赁:Snap Rentals
2018/09/14 全球购物
nohup的用法
2012/11/26 面试题
机械设计及其自动化专业推荐信
2013/10/31 职场文书
安全生产工作汇报材料
2014/10/28 职场文书
2016领导干部廉洁从政心得体会
2016/01/19 职场文书