python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
pycharm 使用心得(七)一些实用功能介绍
Jun 06 Python
Python中字典(dict)合并的四种方法总结
Aug 10 Python
Python读取word文本操作详解
Jan 22 Python
Python中flatten( )函数及函数用法详解
Nov 02 Python
pyqt5 lineEdit设置密码隐藏,删除lineEdit已输入的内容等属性方法
Jun 24 Python
对python中的float除法和整除法的实例详解
Jul 20 Python
Python爬虫学习之获取指定网页源码
Jul 30 Python
python自动化工具之pywinauto实例详解
Aug 26 Python
Python数学形态学实例分析
Sep 06 Python
Python TCPServer 多线程多客户端通信的实现
Dec 31 Python
pytorch 预训练模型读取修改相关参数的填坑问题
Jun 05 Python
python和anaconda的区别
May 06 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
php+redis在实际项目中HTTP 500: Internal Server Error故障排除
2017/02/05 PHP
PHP调用接口用post方法传送json数据的实例
2018/05/31 PHP
PHP实现的AES 128位加密算法示例
2019/09/16 PHP
laravel框架中控制器的创建和使用方法分析
2019/11/23 PHP
PHP+Redis链表解决高并发下商品超卖问题(实现原理及步骤)
2020/08/03 PHP
JavaScript Event事件学习第一章 Event介绍
2010/02/07 Javascript
js 实现打印网页中定义的部分内容的代码
2010/04/01 Javascript
一个js的tab切换效果代码[代码分离]
2010/04/11 Javascript
JS预览图像将本地图片显示到浏览器上
2013/08/25 Javascript
javascript去除字符串中所有标点符号和提取纯文本的正则
2014/06/07 Javascript
node.js中的console用法总结
2014/12/15 Javascript
谈谈Jquery ajax中success和complete有哪些不同点
2015/11/20 Javascript
针对BootStrap中tabs控件的美化和完善(推荐)
2016/07/06 Javascript
详解AngularJS用Interceptors来统一处理HTTP请求和响应
2017/06/08 Javascript
你可能不知道的前端算法之文字避让(inMap)
2018/01/12 Javascript
node 版本切换的实现
2020/02/02 Javascript
[03:52]DOTA2英雄基础教程 酒仙
2013/12/23 DOTA
Python简单删除目录下文件以及文件夹的方法
2015/05/27 Python
pytorch 自定义数据集加载方法
2019/08/18 Python
Python数据相关系数矩阵和热力图轻松实现教程
2020/06/16 Python
使用PyCharm安装pytest及requests的问题
2020/07/31 Python
利用Python中的Xpath实现一个在线汇率转换器
2020/09/09 Python
jupyter notebook 写代码自动补全的实现
2020/11/02 Python
Django集成MongoDB实现过程解析
2020/12/01 Python
html5小技巧之通过document.head获取head元素
2014/06/04 HTML / CSS
计算机网络专业个人的自我评价
2013/10/17 职场文书
博士研究生自我鉴定范文
2013/12/04 职场文书
医学生职业规划范文
2014/01/05 职场文书
机关道德讲堂实施方案
2014/03/15 职场文书
小学生通知书评语
2014/12/31 职场文书
借条如何写
2015/05/26 职场文书
2015年入党积极分子培养考察意见
2015/08/12 职场文书
《金钱的魔力》教学反思
2016/02/20 职场文书
人事行政部各岗位职责说明书!
2019/07/15 职场文书
制作能在nginx和IIS中使用的ssl证书
2021/06/21 Servers
SQL Server使用导出向导功能
2022/04/08 SQL Server