pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基于mysql实现的简单队列以及跨进程锁实例详解
Jul 07 Python
python人人网登录应用实例
Sep 26 Python
Mac下Supervisor进程监控管理工具的安装与配置
Dec 16 Python
解析Python中的变量、引用、拷贝和作用域的问题
Apr 07 Python
Python判断Abundant Number的方法
Jun 15 Python
python如何爬取个性签名
Jun 19 Python
python获取当前文件路径以及父文件路径的方法
Jul 10 Python
Python算法的时间复杂度和空间复杂度(实例解析)
Nov 19 Python
python调用函数、类和文件操作简单实例总结
Nov 29 Python
Python调用scp向服务器上传文件示例
Dec 22 Python
PyQt5中向单元格添加控件的方法示例
Mar 24 Python
解决virtualenv -p python3 venv报错的问题
Feb 05 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
《逃离塔科夫》——“萌新劝退,老手自嗨”的硬核FPS游戏
2020/04/03 其他游戏
php session处理的定制
2009/03/16 PHP
PHP跳转页面的几种实现方法详解
2013/06/08 PHP
js限制checkbox勾选的个数以及php获取多个checkbbox的方法深入解析
2013/07/18 PHP
PHP magento后台无法登录问题解决方法
2016/11/24 PHP
Ajax+PHP实现的模拟进度条功能示例
2019/02/11 PHP
laravel5.0在linux下解决.htaccess无效和去除index.php的问题
2019/10/16 PHP
表单内同名元素的控制
2006/11/22 Javascript
jQuery Tools tooltip使用说明
2012/07/14 Javascript
jquerymobile局部渲染的各种刷新方法小结
2014/03/05 Javascript
Bootstrap模态框(modal)垂直居中的实例代码
2016/08/18 Javascript
angular.js指令中transclude选项及ng-transclude指令详解
2017/05/24 Javascript
在vue组件中使用axios的方法
2018/03/16 Javascript
基于Vue 2.0 监听文本框内容变化及ref的使用说明介绍
2018/08/24 Javascript
vue项目打包后怎样优雅的解决跨域
2019/05/26 Javascript
js设计模式之单例模式原理与用法详解
2019/08/15 Javascript
详解JavaScript中的链式调用
2020/11/27 Javascript
token 机制和实现方式
2020/12/15 Javascript
[02:46]解说DC:感谢430陪伴我们的DOTA2国际邀请赛岁月
2016/06/29 DOTA
[01:05:41]EG vs Optic Supermajor 败者组 BO3 第二场 6.6
2018/06/07 DOTA
python连接MySQL数据库实例分析
2015/05/12 Python
django 常用orm操作详解
2017/09/13 Python
Python自定义简单图轴简单实例
2018/01/08 Python
python 文件转成16进制数组的实例
2018/07/09 Python
python远程邮件控制电脑升级版
2019/05/23 Python
Python的bit_length函数来二进制的位数方法
2019/08/27 Python
python使用beautifulsoup4爬取酷狗音乐代码实例
2019/12/04 Python
Python如何读写字节数据
2020/08/05 Python
Python类型转换的魔术方法详解
2020/12/23 Python
python 日志模块logging的使用场景及示例
2021/01/04 Python
使用CSS3编写灰阶滤镜来制作黑白照片效果的方法
2016/05/09 HTML / CSS
亚瑟士美国官网:ASICS美国
2017/02/01 全球购物
linux面试题参考答案(11)
2016/11/26 面试题
采购主管的岗位职责
2013/12/17 职场文书
初一学生期末评语
2014/04/24 职场文书
竞聘演讲报告:基本写作有哪些?附开头范文
2019/10/16 职场文书