python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python json模块使用实例
Apr 11 Python
python中sleep函数用法实例分析
Apr 29 Python
python文件操作之目录遍历实例分析
May 20 Python
利用Python实现图书超期提醒
Aug 02 Python
详解Python如何生成词云的方法
Jun 01 Python
python虚拟环境完美部署教程
Aug 06 Python
python协程gevent案例 爬取斗鱼图片过程解析
Aug 27 Python
python3文件复制、延迟文件复制任务的实现方法
Sep 02 Python
如何定义TensorFlow输入节点
Jan 23 Python
Python退出时强制运行一段代码的实现方法
Apr 29 Python
Python venv虚拟环境配置过程解析
Jul 08 Python
python数字图像处理数据类型及颜色空间转换
Jun 28 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
追求程序速度,而不是编程的速度
2008/04/23 PHP
ThinkPHP实现二级循环读取的方法
2014/11/03 PHP
SESSION存放在数据库用法实例
2015/08/08 PHP
window.js 主要包含了页面的一些操作
2009/12/23 Javascript
Javascript实现仿WebQQ界面的“浮云”兼容 IE7以上版本及FF
2011/04/27 Javascript
javascript实现百度地图鼠标滑动事件显示、隐藏
2015/04/02 Javascript
JavaScript中用于四舍五入的Math.round()方法讲解
2015/06/15 Javascript
angularjs在ng-repeat中使用ng-model遇到的问题
2016/01/21 Javascript
JS控制层作圆周运动的方法
2016/06/20 Javascript
javascript如何创建对象
2016/08/29 Javascript
JS添加或修改控件的样式(Class)实现方法
2016/10/15 Javascript
JavaScript模拟文件拖选框样式v1.0的实例
2017/08/04 Javascript
Javascript 严格模式use strict详解
2017/09/16 Javascript
Vue-Router实现组件间跳转的三种方法
2017/11/07 Javascript
JavaScript中的高级函数
2018/01/04 Javascript
JS基于for语句编写的九九乘法表示例
2018/01/04 Javascript
Es6 Generator函数详细解析
2018/02/24 Javascript
vue项目中实现的微信分享功能示例
2019/01/21 Javascript
「中高级前端面试」JavaScript手写代码无敌秘籍(推荐)
2019/04/08 Javascript
Vue项目实现换肤功能的一种方案分析
2019/08/28 Javascript
基于vue-cli3创建libs库的实现方法
2019/12/04 Javascript
JavaScript实现HSL拾色器
2020/05/21 Javascript
Python使用分布式锁的代码演示示例
2018/07/30 Python
python基于socket实现的UDP及TCP通讯功能示例
2019/11/01 Python
基于Python爬取搜狐证券股票过程解析
2020/11/18 Python
CSS3自定义滚动条样式的示例代码
2017/08/21 HTML / CSS
html5之Canvas路径绘图、坐标变换应用实例
2012/12/26 HTML / CSS
html5贪吃蛇游戏使用63行代码完美实现
2013/06/25 HTML / CSS
ALDO英国官网:加拿大女鞋品牌
2018/02/19 全球购物
25道Java面试题集合
2013/05/21 面试题
党风廉政建设责任书
2014/04/14 职场文书
党员十八大心得体会
2014/09/12 职场文书
学生无故旷课检讨书
2014/09/20 职场文书
思想作风整顿个人剖析材料
2014/10/06 职场文书
行政主管岗位职责
2015/02/03 职场文书
《巫师》是美食游戏?CDPR10月将推出《巫师》官方食谱
2022/04/03 其他游戏