pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python正则表达式判断字符串是否是全部小写示例
Dec 25 Python
Python2.x与Python3.x的区别
Jan 14 Python
Windows中安装使用Virtualenv来创建独立Python环境
May 31 Python
python爬虫爬取淘宝商品信息
Feb 23 Python
一份python入门应该看的学习资料
Apr 11 Python
python数字图像处理之骨架提取与分水岭算法
Apr 27 Python
对numpy中的transpose和swapaxes函数详解
Aug 02 Python
python求平均数、方差、中位数的例子
Aug 22 Python
python获取Linux发行版名称
Aug 30 Python
浅析Python+OpenCV使用摄像头追踪人脸面部血液变化实现脉搏评估
Oct 17 Python
keras做CNN的训练误差loss的下降操作
Jun 22 Python
Python实现一个简单的递归下降分析器
Aug 01 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
在PHP中使用XML
2006/10/09 PHP
php 数组排序 array_multisort与uasort的区别
2011/03/24 PHP
有关phpmailer的详细介绍及使用方法
2013/01/28 PHP
基于PHP读取TXT文件向数据库导入海量数据的方法
2013/04/23 PHP
基于php socket(fsockopen)的应用实例分析
2013/06/02 PHP
php查找指定目录下指定大小文件的方法
2014/11/28 PHP
Symfony2实现从数据库获取数据的方法小结
2016/03/18 PHP
PHP实现求解最长公共子串问题的方法
2017/11/17 PHP
php实现的rc4加密解密类定义与用法示例
2018/08/16 PHP
获取任意Html元素与body之间的偏移距离 offsetTop、offsetLeft (For:IE5+ FF1 )[
2006/12/22 Javascript
Javascript 调试利器 Firebug使用详解六
2009/07/05 Javascript
jQuery lazyload 的重复加载错误以及修复方法
2010/11/19 Javascript
jquery中通过父级查找进行定位示例
2013/06/28 Javascript
jQuery实现鼠标划过修改样式的方法
2015/04/14 Javascript
JavaScript中的函数嵌套使用
2015/06/04 Javascript
JS实现3D图片旋转展示效果代码
2015/09/22 Javascript
jQuery实现的纵向下拉菜单实例详解【附demo源码下载】
2016/07/09 Javascript
js实现文字截断功能
2016/09/14 Javascript
JavaScript实现HTML5游戏断线自动重连的方法
2017/09/18 Javascript
Vue 自定义动态组件实例详解
2018/03/28 Javascript
vue 实现axios拦截、页面跳转和token 验证
2018/07/17 Javascript
JavaScript中常用的简洁高级技巧总结
2019/03/10 Javascript
Python的动态重新封装的教程
2015/04/11 Python
在Heroku云平台上部署Python的Django框架的教程
2015/04/20 Python
Python基于OpenCV实现人脸检测并保存
2019/07/23 Python
Python Subprocess模块原理及实例
2019/08/26 Python
Python FTP文件定时自动下载实现过程解析
2019/11/12 Python
Docker部署Python爬虫项目的方法步骤
2020/01/19 Python
Python类的动态绑定实现原理
2020/03/21 Python
自荐信格式的六要素
2013/09/21 职场文书
毕业生动漫设计求职信
2013/10/11 职场文书
基层干部群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
公民代理授权委托书
2014/09/24 职场文书
夫妻婚内购房协议书
2014/10/05 职场文书
党员批评与自我批评总结
2014/10/15 职场文书
简单了解 MySQL 中相关的锁
2021/05/25 MySQL