python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
更改Python命令行交互提示符的方法
Jan 14 Python
Python表示矩阵的方法分析
May 26 Python
python删除过期log文件操作实例解析
Jan 31 Python
python语言中with as的用法使用详解
Feb 23 Python
Python3 利用requests 库进行post携带账号密码请求数据的方法
Oct 26 Python
Python 硬币兑换问题
Jul 29 Python
python爬取百度贴吧前1000页内容(requests库面向对象思想实现)
Aug 10 Python
pip install python 快速安装模块的教程图解
Oct 08 Python
Python高阶函数、常用内置函数用法实例分析
Dec 26 Python
Pytorch实现神经网络的分类方式
Jan 08 Python
python中68个内置函数的总结与介绍
Feb 24 Python
python DataFrame中stack()方法、unstack()方法和pivot()方法浅析
Apr 06 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
使用PHP生成二维码的两种方法(带logo图像)
2014/03/14 PHP
yii2中的rules 自定义验证规则详解
2016/04/19 PHP
MAC下通过改apache配置文件切换php多版本的方法
2017/04/26 PHP
微信第三方登录(原生)demo【必看篇】
2017/05/26 PHP
PHP使用数组实现矩阵数学运算的方法示例
2017/05/29 PHP
thinkphp3.2实现在线留言提交验证码功能
2017/07/19 PHP
Laravel框架搜索分页功能示例
2019/02/01 PHP
Thinkphp5.0框架的Db操作实例分析【连接、增删改查、链式操作等】
2019/10/11 PHP
js版本A*寻路算法
2006/12/22 Javascript
JavaScript:new 一个函数和直接调用函数的区别分析
2013/07/10 Javascript
JQuery页面的表格数据的增加与分页的实现
2013/12/10 Javascript
调用HttpHanlder的几种返回方式小结
2013/12/20 Javascript
jquery让指定的元素闪烁显示的方法
2015/03/17 Javascript
包含中国城市的javascript对象实例
2015/08/03 Javascript
jQuery随手笔记之常用的jQuery操作DOM事件
2015/11/29 Javascript
js+div+css下拉导航菜单完整代码分享
2016/12/28 Javascript
基于JavaScript实现抽奖系统
2018/01/16 Javascript
React+Antd+Redux实现待办事件的方法
2019/03/14 Javascript
详解vue使用插槽分发内容slot的用法
2019/03/28 Javascript
layui表单验证select下拉框实现验证的方法
2019/09/05 Javascript
基于vue.js实现购物车
2020/01/15 Javascript
vue 计算属性和侦听器的使用小结
2021/01/25 Vue.js
[02:55]DOTA2英雄基础教程 发条技师
2013/12/04 DOTA
python Django模板的使用方法(图文)
2013/11/04 Python
在Docker上开始部署Python应用的教程
2015/04/17 Python
详解常用查找数据结构及算法(Python实现)
2016/12/09 Python
解决python os.mkdir创建目录失败的问题
2018/10/16 Python
Django1.11自带分页器paginator的使用方法
2019/10/31 Python
Python 用__new__方法实现单例的操作
2020/12/11 Python
日本面向世界,国际级的免税在线购物商城:DOKODEMO
2017/02/01 全球购物
TheFork葡萄牙:欧洲领先的在线餐厅预订平台
2019/05/27 全球购物
无故旷工检讨书
2014/01/26 职场文书
大学生村官座谈会发言材料
2014/05/25 职场文书
工商管理本科生求职信
2014/07/13 职场文书
2015年终个人政治思想工作总结
2015/11/24 职场文书
《学会看病》教学反思
2016/02/17 职场文书