pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python进行数据提取的方法总结
Aug 22 Python
Python语言描述随机梯度下降法
Jan 04 Python
python3 破解 geetest(极验)的滑块验证码功能
Feb 24 Python
python opencv 读取本地视频文件 修改ffmpeg的方法
Jan 26 Python
python PyQt5/Pyside2 按钮右击菜单实例代码
Aug 17 Python
python二分法查找算法实现方法【递归与非递归】
Dec 06 Python
Pytorch .pth权重文件的使用解析
Feb 14 Python
Python+redis通过限流保护高并发系统
Apr 15 Python
python os模块在系统管理中的应用
Jun 22 Python
Python基于template实现字符串替换
Nov 27 Python
详解Python中的Lock和Rlock
Jan 26 Python
Python使用tkinter制作在线翻译软件
Feb 22 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
destoon实现公司新闻详细页添加评论功能的方法
2014/07/15 PHP
利用PHP获取汉字首字母并且分组排序详解
2017/10/22 PHP
javascript 读取XML数据,在页面中展现、编辑、保存的实现
2009/10/27 Javascript
jquery获取ASP.NET服务器端控件dropdownlist和radiobuttonlist生成客户端HTML标签后的value和text值
2010/06/28 Javascript
基于jquery实现的图片在各种分辨率下未知的容器内上下左右居中
2014/05/11 Javascript
Node.js中使用计时器定时执行函数详解
2014/08/15 Javascript
IE下通过a实现location.href 获取referer的值
2014/09/04 Javascript
纯javascript模仿微信打飞机小游戏
2015/08/20 Javascript
javascript中Number的方法小结
2016/11/21 Javascript
IE8兼容Jquery.validate.js的问题
2016/12/01 Javascript
vue2使用keep-alive缓存多层列表页的方法
2018/09/21 Javascript
基于vue实现移动端圆形旋钮插件效果
2018/11/28 Javascript
js实现全选反选不选功能代码详解
2019/04/24 Javascript
微信小程序 flexbox layout快速实现基本布局的解决方案
2020/03/24 Javascript
[00:36]DOTA2风云人物相约完美“圣”典 12月17日不见不散
2016/11/30 DOTA
让 python 命令行也可以自动补全
2014/11/30 Python
python中反射用法实例
2015/03/27 Python
Python列表删除的三种方法代码分享
2017/10/31 Python
python爬取各类文档方法归类汇总
2018/03/22 Python
Python实现删除时保留特定文件夹和文件的示例
2018/04/27 Python
django使用admin站点上传图片的实例
2019/07/28 Python
在 Jupyter 中重新导入特定的 Python 文件(场景分析)
2019/10/27 Python
python列表推导和生成器表达式知识点总结
2020/01/10 Python
Python字符串中删除特定字符的方法
2020/01/15 Python
Python通过Schema实现数据验证方式
2020/11/12 Python
详解python 条件语句和while循环的实例代码
2020/12/28 Python
苹果台湾官网:Apple台湾
2019/01/05 全球购物
XMLHttpRequest对象在IE和Firefox中创建方式有没有不同
2016/03/23 面试题
中专生职业生涯规划书范文
2014/01/10 职场文书
部门年终奖分配方案
2014/05/07 职场文书
应届生求职信
2014/05/31 职场文书
中学学校门卫岗位职责
2014/08/15 职场文书
会议通知范文
2015/04/15 职场文书
2019自荐信范文集锦!
2019/07/03 职场文书
导游词之无锡梅园
2019/11/28 职场文书
Python基础学习之奇异的GUI对话框
2021/05/27 Python