pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python学习笔记(一)(基础入门之环境搭建)
Jun 05 Python
使用python在本地电脑上快速处理数据
Jun 22 Python
Python中的并发处理之asyncio包使用的详解
Apr 03 Python
PyQt实现界面翻转切换效果
Apr 20 Python
浅谈Python traceback的优雅处理
Aug 31 Python
python集合比较(交集,并集,差集)方法详解
Sep 13 Python
python3安装crypto出错及解决方法
Jul 30 Python
在notepad++中实现直接运行python代码
Dec 18 Python
python输出pdf文档的实例
Feb 13 Python
Python高阶函数与装饰器函数的深入讲解
Nov 10 Python
基于python的opencv图像处理实现对斑马线的检测示例
Nov 29 Python
Python结合百度语音识别实现实时翻译软件的实现
Jan 18 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
PHP获取栏目的所有子级和孙级栏目的ID号示例
2014/04/01 PHP
php上传文件问题汇总
2015/01/30 PHP
JavaScript方法和技巧大全
2006/12/27 Javascript
JavaScript 无符号右移赋值操作
2009/04/17 Javascript
Prototype Date对象 学习
2009/07/12 Javascript
jquery ready函数源代码研究
2009/12/06 Javascript
非阻塞动态加载javascript广告实现代码
2010/11/17 Javascript
jquery focus(fn),blur(fn)方法实例代码
2011/12/16 Javascript
javascript初学者常用技巧
2014/09/02 Javascript
深入理解JavaScript系列(42):设计模式之原型模式详解
2015/03/04 Javascript
JavaScript模拟深蓝vs卡斯帕罗夫的国际象棋对局示例
2015/04/22 Javascript
jQuery预加载图片常用方法
2015/06/15 Javascript
js简单设置与使用cookie的方法
2016/01/22 Javascript
Vuejs第八篇之Vuejs组件的定义实例解析
2016/09/05 Javascript
jQuery Dialog 取消右上角删除按钮事件
2016/09/07 Javascript
解决Vue页面固定滚动位置的处理办法
2017/07/13 Javascript
node.js 用socket实现聊天的示例代码
2017/10/17 Javascript
JavaScript设计模式之代理模式简单实例教程
2018/07/03 Javascript
微信小程序开发背景图显示功能
2018/08/08 Javascript
浅谈JavaScript窗体Window.ShowModalDialog使用
2020/07/22 Javascript
如何用JS模拟实现数组的map方法
2020/07/30 Javascript
Javascript中window.name属性详解
2020/11/19 Javascript
Python查看多台服务器进程的脚本分享
2014/06/11 Python
Python决策树之基于信息增益的特征选择示例
2018/06/25 Python
python write无法写入文件的解决方法
2019/01/23 Python
Python 虚拟空间的使用代码详解
2019/06/10 Python
Python基于WordCloud制作词云图
2019/11/29 Python
opencv中图像叠加/图像融合/按位操作的实现
2020/04/01 Python
python 爬虫之selenium可视化爬虫的实现
2020/12/04 Python
Python抖音快手代码舞(字符舞)的实现方法
2021/02/07 Python
竞选部长演讲稿
2014/04/26 职场文书
工商局局长个人对照检查材料思想汇报
2014/09/23 职场文书
2014年保育员个人工作总结
2014/12/02 职场文书
2015年度酒店客房部工作总结
2015/05/25 职场文书
劳动保障事务所个人工作总结
2015/08/12 职场文书
浅谈@Value和@Bean的执行顺序问题
2021/06/16 Java/Android