pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之关于类的初步认识
Oct 11 Python
在Django框架中伪造捕捉到的URLconf值的方法
Jul 18 Python
Python实现二叉树结构与进行二叉树遍历的方法详解
May 24 Python
Python构建XML树结构的方法示例
Jun 30 Python
Python通过matplotlib画双层饼图及环形图简单示例
Dec 15 Python
教你用Python创建微信聊天机器人
Mar 31 Python
Python关于反射的实例代码分享
Feb 20 Python
opencv-python的RGB与BGR互转方式
Jun 02 Python
虚拟机下载python是否需要联网
Jul 27 Python
使用AJAX和Django获取数据的方法实例
Oct 25 Python
matplotlib实现数据实时刷新的示例代码
Jan 05 Python
python中的random模块和相关函数详解
Apr 22 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
基于mysql的论坛(5)
2006/10/09 PHP
php pack与unpack 摸板字符字符含义
2009/10/29 PHP
PHP htmlspecialchars() 函数实例代码及用法大全
2018/09/18 PHP
Jquery读取URL参数小例子
2013/08/30 Javascript
Javascript实现简单的富文本编辑器附演示
2014/06/16 Javascript
Node.js中使用mongoskin操作mongoDB实例
2014/09/28 Javascript
深入理解JavaScript系列(49):Function模式(上篇)
2015/03/04 Javascript
JavaScript 不支持 indexof 该如何解决
2016/03/30 Javascript
js利用appendChild对标签进行排序的实现方法
2016/10/16 Javascript
Angular 2应用的8个主要构造块有哪些
2016/10/17 Javascript
js微信扫描二维码登录网站技术原理
2016/12/01 Javascript
BootStrap Table实现server分页序号连续显示功能(当前页从上一页的结束序号开始)
2017/09/12 Javascript
AngularJS实现的2048小游戏功能【附源码下载】
2018/01/03 Javascript
js将键值对字符串转为json字符串的方法
2018/03/30 Javascript
JS原型与继承操作示例
2019/05/09 Javascript
vue.js实现回到顶部动画效果
2019/07/31 Javascript
js prototype和__proto__的关系是什么
2019/08/23 Javascript
JS实现拖动模糊框特效
2020/08/25 Javascript
解决removeEventListener 无法清除监听的问题
2020/10/30 Javascript
在Python下进行UDP网络编程的教程
2015/04/29 Python
Python模拟脉冲星伪信号频率实例代码
2018/01/03 Python
解决Python3 被PHP程序调用执行返回乱码的问题
2019/02/16 Python
django执行原始查询sql,并返回Dict字典例子
2020/04/01 Python
如何安装并在pycharm使用selenium的方法
2020/04/30 Python
使用Keras实现简单线性回归模型操作
2020/06/12 Python
Python中openpyxl实现vlookup函数的实例
2020/10/28 Python
pycharm配置QtDesigner的超详细方法
2021/01/25 Python
美国领先的低折扣旅行网站:Hotwire
2019/01/19 全球购物
PHP面试题集
2016/12/18 面试题
数据库专业英语
2012/11/30 面试题
一些Solaris面试题
2015/12/22 面试题
社团2014年植树节活动总结
2014/03/11 职场文书
婚礼主持结束词
2014/03/13 职场文书
校庆筹备方案
2014/03/30 职场文书
一年级学生评语
2014/04/23 职场文书
2015年七夕情人节感言
2015/08/03 职场文书