pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python字符串对象的实现
Dec 24 Python
Django实现分页功能
Jul 02 Python
详解Python字典小结
Oct 20 Python
在PYQT5中QscrollArea(滚动条)的使用方法
Jun 14 Python
Python with关键字,上下文管理器,@contextmanager文件操作示例
Oct 17 Python
Python终端输出彩色字符方法详解
Feb 11 Python
python 函数嵌套及多函数共同运行知识点讲解
Mar 03 Python
pyspark 随机森林的实现
Apr 24 Python
python属于跨平台语言码
Jun 09 Python
Python Socket TCP双端聊天功能实现过程详解
Jun 15 Python
Python三维绘图之Matplotlib库的使用方法
Sep 20 Python
python中scrapy处理项目数据的实例分析
Nov 22 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
windows环境下php配置memcache的具体操作步骤
2013/06/09 PHP
学习php中的正则表达式
2014/08/17 PHP
Laravel手动返回错误码示例
2019/10/22 PHP
关于Laravel参数验证的一些疑与惑
2019/11/19 PHP
jquery $(document).ready() 与window.onload的区别
2009/12/28 Javascript
读JavaScript DOM编程艺术笔记
2011/11/15 Javascript
jQuery Tools Dateinput使用介绍
2012/07/14 Javascript
JavaScript通过join函数连接数组里所有元素的方法
2015/03/20 Javascript
JavaScript返回当前会话cookie全部键值对照的方法
2015/04/03 Javascript
javascript父子页面通讯实例详解
2015/07/17 Javascript
基于jQuery实现点击最后一行实现行自增效果的表格
2016/01/12 Javascript
javascript css红色经典选项卡效果实现代码
2016/05/17 Javascript
jQuery+Ajax实现限制查询间隔的方法
2016/06/07 Javascript
js改变style样式和css样式的简单实例
2016/06/28 Javascript
jQuery下拉菜单的实现代码
2016/11/03 Javascript
Bootstrap实现的经典栅格布局效果实例【附demo源码】
2017/03/30 Javascript
vue 如何添加全局函数或全局变量以及单页面的title设置总结
2017/06/01 Javascript
Vue中保存用户登录状态实例代码
2017/06/07 Javascript
Angular 4中如何显示内容的CSS样式示例代码
2017/11/06 Javascript
Vue 换肤的示例实践
2018/01/23 Javascript
基于Vue实现图片在指定区域内移动的思路详解
2018/11/11 Javascript
详解vue 自定义marquee无缝滚动组件
2019/04/09 Javascript
Javascript实现鼠标点击冒泡特效
2019/12/24 Javascript
vue 使用微信jssdk,调用微信相册上传图片功能
2020/11/13 Javascript
用Python的pandas框架操作Excel文件中的数据教程
2015/03/31 Python
Python工程师面试题 与Python基础语法相关
2016/01/14 Python
pandas的唯一值、值计数以及成员资格的示例
2018/07/25 Python
wxpython+pymysql实现用户登陆功能
2019/11/19 Python
Python 解决OPEN读文件报错 ,路径以及r的问题
2019/12/19 Python
pyecharts绘制中国2020肺炎疫情地图的实例代码
2020/02/12 Python
python 线性回归分析模型检验标准--拟合优度详解
2020/02/24 Python
Python pysnmp使用方法及代码实例
2020/08/24 Python
斯凯奇新西兰官网:SKECHERS新西兰
2018/02/22 全球购物
DJI美国:消费类无人机领域的领导者
2018/04/27 全球购物
2014年安全保卫工作总结
2014/11/13 职场文书
OpenCV 图像梯度的实现方法
2021/07/25 Python