python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用metaclass实现Singleton模式的方法
May 05 Python
使用python 3实现发送邮件功能
Jun 15 Python
Python实现的简单读写csv文件操作示例
Jul 12 Python
对Python 3.2 迭代器的next函数实例讲解
Oct 18 Python
浅谈Python的条件判断语句if/else语句
Mar 21 Python
pytorch 加载(.pth)格式的模型实例
Aug 20 Python
TensorFlow命名空间和TensorBoard图节点实例
Jan 23 Python
pycharm部署、配置anaconda环境的教程
Mar 24 Python
解决Python数据可视化中文部分显示方块问题
May 16 Python
keras CNN卷积核可视化,热度图教程
Jun 22 Python
django模型类中,null=True,blank=True用法说明
Jul 09 Python
Python常用扩展插件使用教程解析
Nov 02 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
PHP中10个不常见却非常有用的函数
2010/03/21 PHP
浅析PHP程序防止ddos,dns,集群服务器攻击的解决办法
2013/06/18 PHP
PHP加密解密类实例分析
2015/04/20 PHP
php实现阳历阴历互转的方法
2015/10/28 PHP
Yii2中如何使用modal弹窗(基本使用)
2016/05/30 PHP
PHP进制转换实例分析(2,8,16,36,64进制至10进制相互转换)
2017/02/04 PHP
PDO::prepare讲解
2019/01/29 PHP
js实现的网站首页随机公告随机公告
2007/03/14 Javascript
javascript prototype 原型链
2009/03/12 Javascript
浅析JavaScript中的typeof运算符
2013/11/30 Javascript
一款基jquery超炫的动画导航菜单可响应单击事件
2014/11/02 Javascript
JQuery实现左右滚动菜单特效
2015/09/28 Javascript
nodejs初步体验篇
2015/11/23 NodeJs
AngularJS表单提交实例详解
2017/02/18 Javascript
原生js实现放大镜
2017/02/20 Javascript
微信小程序 共用变量值的实现
2017/07/12 Javascript
使用OPENLAYERS3实现点选的方法
2020/09/24 Javascript
JavaScript设计模式之调停者模式实例详解
2018/02/03 Javascript
[01:21]DOTA2新纪元-7.0新版本即将开启!
2016/12/11 DOTA
[56:46]Liquid vs IG 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
利用Python绘制数据的瀑布图的教程
2015/04/07 Python
Python实现ssh批量登录并执行命令
2016/10/25 Python
Python SQLite3数据库日期与时间常见函数用法分析
2017/08/14 Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
2020/04/10 Python
波兰珠宝品牌:YES
2019/08/09 全球购物
在Java开发中如何选择使用哪种集合类
2016/08/09 面试题
SQL数据库笔试题
2016/03/08 面试题
正隆泰信息技术有限公司上机题
2012/06/14 面试题
三好学生评语大全
2014/12/29 职场文书
城管年度个人总结
2015/02/28 职场文书
工作自我评价范文
2015/03/05 职场文书
2016年“七一建党节”广播稿
2015/12/18 职场文书
django上传文件的三种方式
2021/04/29 Python
在 SQL 语句中处理 NULL 值的方法
2021/06/07 SQL Server
vite+vue3.0+ts+element-plus快速搭建项目的实现
2021/06/24 Vue.js
MySQL数据库Innodb 引擎实现mvcc锁
2022/05/06 MySQL