pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3.3实现乘法表示例
Feb 07 Python
Python httplib模块使用实例
Apr 11 Python
Python基于回溯法子集树模板解决找零问题示例
Sep 11 Python
python web基础之加载静态文件实例
Mar 20 Python
对Python中数组的几种使用方法总结
Jun 28 Python
pymysql 开启调试模式的实现
Sep 24 Python
Python queue队列原理与应用案例分析
Sep 27 Python
python 密码学示例——凯撒密码的实现
Sep 21 Python
Python中常用的os操作汇总
Nov 05 Python
Pytorch 中net.train 和 net.eval的使用说明
May 22 Python
Python利用Turtle绘制哆啦A梦和小猪佩奇
Apr 04 Python
Python之matplotlib绘制饼图
Apr 13 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
php面向对象全攻略 (八)重载新的方法
2009/09/30 PHP
php读取文件内容的三种可行方法示例介绍
2014/02/08 PHP
Zend Framework路由器用法实例详解
2016/12/11 PHP
PHP抽象类和接口用法实例详解
2019/07/20 PHP
关于PHP求解三数之和问题详析
2020/11/09 PHP
JavaScript 参数中的数组展开 [译]
2012/09/21 Javascript
js与jquery回车提交的方法
2015/02/03 Javascript
jquery结婚电子请柬特效源码分享
2015/08/21 Javascript
javaScript实现可缩放的显示区效果代码
2015/10/26 Javascript
jQuery实现图片文字淡入淡出效果
2015/12/21 Javascript
Javascript 两种刷新方法以及区别和适用范围
2017/01/17 Javascript
JS实现的简单下拉框联动功能示例
2018/05/11 Javascript
详解Node.js中path模块的resolve()和join()方法的区别
2018/10/29 Javascript
详解promise.then,process.nextTick, setTimeout 以及 setImmediate的执行顺序
2018/11/21 Javascript
浅谈layui使用模板引擎动态渲染元素要注意的问题
2019/09/14 Javascript
layui时间控件选择时间范围的实现方法
2019/09/28 Javascript
js仿淘宝放大镜效果
2020/12/28 Javascript
python基础教程之面向对象的一些概念
2014/08/29 Python
Cpy和Python的效率对比
2015/03/20 Python
修改Python的pyxmpp2中的主循环使其提高性能
2015/04/24 Python
举例讲解Python的Tornado框架实现数据可视化的教程
2015/05/02 Python
python shell根据ip获取主机名代码示例
2017/11/25 Python
Windows下anaconda安装第三方包的方法小结(tensorflow、gensim为例)
2018/04/05 Python
pandas带有重复索引操作方法
2018/06/08 Python
python 读取文件并把矩阵转成numpy的两种方法
2019/02/12 Python
jupyter notebook运行命令显示[*](解决办法)
2020/05/18 Python
HTML5实现可缩放时钟代码
2017/08/28 HTML / CSS
使用html5新特性轻松监听任何App自带返回键的示例
2018/03/13 HTML / CSS
优秀经理获奖感言
2014/03/04 职场文书
求职信模板
2014/05/23 职场文书
电气工程及其自动化专业毕业生自荐信
2014/06/21 职场文书
2014年物流工作总结
2014/11/25 职场文书
写给老师的感谢信
2015/01/20 职场文书
消防安全月活动总结
2015/05/08 职场文书
2016年党员创先争优承诺书
2016/03/25 职场文书
总结python多进程multiprocessing的相关知识
2021/06/29 Python