python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python定时器使用示例分享
Feb 16 Python
python调用java模块SmartXLS和jpype修改excel文件的方法
Apr 28 Python
Python语法快速入门指南
Oct 12 Python
Python中列表、字典、元组数据结构的简单学习笔记
Mar 20 Python
Django forms组件的使用教程
Oct 08 Python
对pandas中两种数据类型Series和DataFrame的区别详解
Nov 12 Python
python ChainMap 合并字典的实现步骤
Jun 11 Python
Python计算两个矩形重合面积代码实例
Sep 16 Python
解决python Jupyter不能导入外部包问题
Apr 15 Python
构建高效的python requests长连接池详解
May 02 Python
在Ubuntu中安装并配置Pycharm教程的实现方法
Jan 06 Python
使用Python下载抖音各大V视频的思路详解
Feb 06 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
php实现httpclient类示例
2014/04/08 PHP
thinkphp3.2.2实现生成多张缩略图的方法
2014/12/19 PHP
PHP实现的迷你漂流瓶
2015/07/29 PHP
Yii2简单实现给表单添加验证码的方法
2016/07/18 PHP
PHP实现本地图片转base64格式并上传
2020/05/29 PHP
jquery中的$(document).ready()与window.onload的区别
2009/11/18 Javascript
Jquery实现无刷新DropDownList联动实现代码
2010/03/08 Javascript
JavaScript setTimeout和setInterval的使用方法 说明
2010/03/25 Javascript
JQuery获取浏览器窗口内容部分高度的代码
2012/02/24 Javascript
js解析json读取List中的实体对象示例
2014/03/11 Javascript
JavaScrip调试技巧之断点调试
2015/10/22 Javascript
JavaScript中setTimeout和setInterval函数的传参及调用
2016/03/11 Javascript
Bootstrap 附加导航(Affix)插件实例详解
2016/06/01 Javascript
用jquery获取自定义的标签属性的值简单实例
2016/09/17 Javascript
Angular4 组件通讯方法大全(推荐)
2018/07/12 Javascript
微信小程序实现topBar底部选择栏效果
2018/07/20 Javascript
Vue利用History记录上一页面的数据方法实例
2018/11/02 Javascript
微信小程序实现的动态设置导航栏标题功能示例
2019/01/31 Javascript
在 Vue.js中优雅地使用全局事件的方法
2019/02/01 Javascript
vue2.x 通过后端接口代理,获取qq音乐api的数据示例
2019/10/30 Javascript
使用原生JS实现火锅点餐小程序(面向对象思想)
2019/12/10 Javascript
node.js中fs文件系统模块的使用方法实例详解
2020/02/13 Javascript
浅谈Vue3.0新版API之composition-api入坑指南
2020/04/30 Javascript
Python的pycurl包用法简介
2015/11/13 Python
python中kmeans聚类实现代码
2018/02/23 Python
对Python subprocess.Popen子进程管道阻塞详解
2018/10/29 Python
python树的同构学习笔记
2019/09/14 Python
给你一面国旗 教你用python画中国国旗
2019/09/24 Python
python 利用turtle库绘制笑脸和哭脸的例子
2019/11/23 Python
美国打印机墨水和碳粉购物网站:QuikShip Toner
2018/08/29 全球购物
小学毕业感言150字
2014/02/05 职场文书
美术毕业生求职信
2014/02/25 职场文书
低碳生活倡议书
2014/04/14 职场文书
股东出资协议书
2016/03/21 职场文书
解决python3安装pandas出错的问题
2021/05/20 Python
什么是clearfix (一文搞清楚css清除浮动clearfix)
2023/05/21 HTML / CSS