编程 Python

pandas DataFrame 删除重复的行的实现方法

Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

2. 判断是否有重复项

用duplicated（）函数判断

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3. 有重复项，则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated（）和drop_duplicates（）方法是以默认的方式判断全部的列（上面的例子中是看两个变量a和b是否都是重复出现）。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5. norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行，并保留重复出现的行中第一次出现的行

补充：

当keep=False时，就是去掉所有的重复行
当keep=‘first'时，就是保留第一次出现的重复行
当keep='last'时就是保留最后一次出现的重复行。

（注意，这里的参数是字符串，要加引号！！！）

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

pandas DataFrame 删除重复的行的实现方法

- Author -

qq_40981268

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中的闭包总结

Sep 18 Python

Python计算三维矢量幅度的方法

Jun 15 Python

详解Python中的日志模块logging

Jun 19 Python

Python selenium 三种等待方式详解(必会)

Sep 15 Python

Python实现简单的多任务mysql转xml的方法

Feb 08 Python

python技能之数据导出excel的实例代码

Aug 11 Python

对python中Matplotlib的坐标轴的坐标区间的设定实例讲解

May 25 Python

Python matplotlib通过plt.scatter画空心圆标记出特定的点方法

Dec 13 Python

Jacobi迭代算法的Python实现详解

Jun 29 Python

pandas取出重复数据的方法

Jul 04 Python

解决Jupyter Notebook使用parser.parse_args出现错误问题

Apr 20 Python

python实现猜数游戏(保存游戏记录）

Jun 22 Python

使用Python向DataFrame中指定位置添加一列或多列的方法

Jan 29 #Python

Python Pexpect库的简单使用方法

Jan 29 #Python

在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例

Jan 29 #Python

对python numpy.array插入一行或一列的方法详解

Jan 29 #Python

对python中list的拷贝与numpy的array的拷贝详解

Jan 29 #Python

10 分钟快速入门 Python3的教程

Jan 29 #Python

解决python2 绘图title,xlabel,ylabel出现中文乱码的问题

Jan 29 #Python

You might like

细谈php中SQL注入攻击与XSS攻击

2012/06/10 PHP

PHP文件锁定写入实例解析

2014/07/14 PHP

PHP检测用户语言的方法

2015/06/15 PHP

CentOS下与Apache连接的PHP多版本共存方案实现详解

2015/12/19 PHP

关于PHP 如何用 curl 读取 HTTP chunked 数据

2016/02/26 PHP

jQuery live

2009/05/15 Javascript

jQuery旋转插件—rotate支持(ie/Firefox/SafariOpera/Chrome)

2013/01/16 Javascript

JavaScript在XHTML中的用法详解

2013/04/11 Javascript

Jquery通过Ajax方式来提交Form表单的具体实现

2013/11/07 Javascript

javascript中的循环语句for语句深入理解

2014/04/04 Javascript

原生Ajax 和jQuery Ajax的区别示例分析

2014/12/17 Javascript

javascript实现网页子页面遍历回调的方法（涉及 window.frames、递归函数、函数上下文）

2015/07/27 Javascript

更高效的使用JQuery 这里总结了8个小技巧

2016/04/13 Javascript

Js类的静态方法与实例方法区分及jQuery拓展的两种方法

2016/06/03 Javascript

js文件中直接alert()中文出来的是乱码的解决方法

2016/11/01 Javascript

JS 循环li添加点击事件（闭包的应用）

2016/12/10 Javascript

NodeJS链接MySql数据库的操作方法

2017/06/27 NodeJs

详解Vue SPA项目优化小记

2018/07/03 Javascript

如何安装控制器JavaScript生成插件详解

2018/10/21 Javascript

微信小程序使用swiper组件实现层叠轮播图

2018/11/04 Javascript

JavaScript函数式编程(Functional Programming)声明式与命令式实例分析

2019/05/21 Javascript

Vue使用Proxy代理后仍无法生效的解决

2020/11/13 Javascript

[01:02:02]DOTA2上海特级锦标赛A组败者赛 EHOME VS CDEC第二局

2016/02/25 DOTA

python抓取网页内容示例分享

2014/02/24 Python

用Python进行行为驱动开发的入门教程

2015/04/23 Python

在Python的Django框架中获取单个对象数据的简单方法

2015/07/17 Python

在Python的Django框架中包装视图函数

2015/07/20 Python

深入解答关于Python的11道基本面试题

2017/04/01 Python

如何利用Python 进行边缘检测

2020/10/14 Python

eDreams澳大利亚：预订机票、酒店和度假产品

2017/04/19 全球购物

Vilebrequin欧洲官网：法国豪华泳装品牌（男士沙滩裤）

2018/04/14 全球购物

估算杭州有多少软件工程师

2015/08/11 面试题

财务管理专业毕业生求职信范文

2013/09/21 职场文书

2014年人事专员工作总结

2014/11/19 职场文书

如何用python清洗文件中的数据

2021/06/18 Python

关于Python使用turtle库画任意图的问题

2022/04/01 Python