pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的闭包总结
Sep 18 Python
Python计算三维矢量幅度的方法
Jun 15 Python
详解Python中的日志模块logging
Jun 19 Python
Python selenium 三种等待方式详解(必会)
Sep 15 Python
Python实现简单的多任务mysql转xml的方法
Feb 08 Python
python技能之数据导出excel的实例代码
Aug 11 Python
对python中Matplotlib的坐标轴的坐标区间的设定实例讲解
May 25 Python
Python matplotlib通过plt.scatter画空心圆标记出特定的点方法
Dec 13 Python
Jacobi迭代算法的Python实现详解
Jun 29 Python
pandas取出重复数据的方法
Jul 04 Python
解决Jupyter Notebook使用parser.parse_args出现错误问题
Apr 20 Python
python实现猜数游戏(保存游戏记录)
Jun 22 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
细谈php中SQL注入攻击与XSS攻击
2012/06/10 PHP
PHP文件锁定写入实例解析
2014/07/14 PHP
PHP检测用户语言的方法
2015/06/15 PHP
CentOS下与Apache连接的PHP多版本共存方案实现详解
2015/12/19 PHP
关于PHP 如何用 curl 读取 HTTP chunked 数据
2016/02/26 PHP
jQuery live
2009/05/15 Javascript
jQuery旋转插件—rotate支持(ie/Firefox/SafariOpera/Chrome)
2013/01/16 Javascript
JavaScript在XHTML中的用法详解
2013/04/11 Javascript
Jquery通过Ajax方式来提交Form表单的具体实现
2013/11/07 Javascript
javascript中的循环语句for语句深入理解
2014/04/04 Javascript
原生Ajax 和jQuery Ajax的区别示例分析
2014/12/17 Javascript
javascript实现网页子页面遍历回调的方法(涉及 window.frames、递归函数、函数上下文)
2015/07/27 Javascript
更高效的使用JQuery 这里总结了8个小技巧
2016/04/13 Javascript
Js类的静态方法与实例方法区分及jQuery拓展的两种方法
2016/06/03 Javascript
js文件中直接alert()中文出来的是乱码的解决方法
2016/11/01 Javascript
JS 循环li添加点击事件 (闭包的应用)
2016/12/10 Javascript
NodeJS链接MySql数据库的操作方法
2017/06/27 NodeJs
详解Vue SPA项目优化小记
2018/07/03 Javascript
如何安装控制器JavaScript生成插件详解
2018/10/21 Javascript
微信小程序使用swiper组件实现层叠轮播图
2018/11/04 Javascript
JavaScript函数式编程(Functional Programming)声明式与命令式实例分析
2019/05/21 Javascript
Vue使用Proxy代理后仍无法生效的解决
2020/11/13 Javascript
[01:02:02]DOTA2上海特级锦标赛A组败者赛 EHOME VS CDEC第二局
2016/02/25 DOTA
python抓取网页内容示例分享
2014/02/24 Python
用Python进行行为驱动开发的入门教程
2015/04/23 Python
在Python的Django框架中获取单个对象数据的简单方法
2015/07/17 Python
在Python的Django框架中包装视图函数
2015/07/20 Python
深入解答关于Python的11道基本面试题
2017/04/01 Python
如何利用Python 进行边缘检测
2020/10/14 Python
eDreams澳大利亚:预订机票、酒店和度假产品
2017/04/19 全球购物
Vilebrequin欧洲官网:法国豪华泳装品牌(男士沙滩裤)
2018/04/14 全球购物
估算杭州有多少软件工程师
2015/08/11 面试题
财务管理专业毕业生求职信范文
2013/09/21 职场文书
2014年人事专员工作总结
2014/11/19 职场文书
如何用python清洗文件中的数据
2021/06/18 Python
关于Python使用turtle库画任意图的问题
2022/04/01 Python