pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
零基础写python爬虫之urllib2中的两个重要概念:Openers和Handlers
Nov 05 Python
简单讲解Python中的闭包
Aug 11 Python
通过源码分析Python中的切片赋值
May 08 Python
使用python和Django完成博客数据库的迁移方法
Jan 05 Python
python批量设置多个Excel文件页眉页脚的脚本
Mar 14 Python
python scrapy爬虫代码及填坑
Aug 12 Python
python操作docx写入内容,并控制文本的字体颜色
Feb 13 Python
python中adb有什么功能
Jun 07 Python
matplotlib图例legend语法及设置的方法
Jul 28 Python
Python sqlalchemy时间戳及密码管理实现代码详解
Aug 01 Python
基于Python的接口自动化unittest测试框架和ddt数据驱动详解
Jan 27 Python
一些让Python代码简洁的实用技巧总结
Aug 23 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
用PHP写的MySQL数据库用户认证系统代码
2007/03/22 PHP
组合算法的PHP解答方法
2012/02/04 PHP
php daddslashes()和 saddslashes()有哪些区别分析
2012/10/26 PHP
javascript vvorld 在线加密破解方法
2008/11/13 Javascript
javascript实现存储hmtl字符串示例
2014/04/25 Javascript
JavaScript中的公有、私有、特权和静态成员用法分析
2014/11/20 Javascript
详谈nodejs异步编程
2014/12/04 NodeJs
JavaScript获取文本框内选中文本的方法
2015/02/20 Javascript
JavaScript中使用Math.floor()方法对数字取整
2015/06/15 Javascript
Jquery 全选反选实例代码
2015/11/19 Javascript
jQuery 1.9.1源码分析系列(十五)动画处理之缓动动画核心Tween
2015/12/03 Javascript
jQuery实现简单滚动动画效果
2016/04/07 Javascript
js+html5实现canvas绘制网页时钟的方法
2016/05/21 Javascript
Bootstrap 最常用的JS插件系列总结(图片轮播、标签切换等)
2016/07/14 Javascript
ES6中参数的默认值语法介绍
2017/05/03 Javascript
ztree实现左边动态生成树右边为内容详情功能
2017/11/03 Javascript
JavaScript实现元素滚动条到达一定位置循环追加内容
2017/12/28 Javascript
js中url对象化管理分析
2017/12/29 Javascript
浅谈ajax在jquery中的请求和servlet中的响应
2018/01/22 jQuery
微信小程序实现日历效果
2018/12/28 Javascript
vue 列表页跳转详情页获取id以及详情页通过id获取数据
2019/03/27 Javascript
详解jquery和vue对比
2019/04/16 jQuery
js核心基础之构造函数constructor用法实例分析
2019/05/11 Javascript
python多线程操作实例
2014/11/21 Python
python模块之time模块(实例讲解)
2017/09/13 Python
Python操作MySQL模拟银行转账
2018/03/12 Python
python+selenium打印当前页面的titl和url方法
2018/06/22 Python
python Timer 类使用介绍
2020/12/28 Python
HTML5未来发展趋势
2016/02/01 HTML / CSS
AmazeUI 面板的实现示例
2020/08/17 HTML / CSS
比利时家具购买网站:Home24
2019/01/03 全球购物
学生励志演讲稿
2014/01/06 职场文书
汽车广告策划方案
2014/05/31 职场文书
中考标语大全
2014/06/05 职场文书
员工工作表现自我评价
2015/03/06 职场文书
导游词之峨眉山
2019/12/16 职场文书