pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python程序设计入门(2)变量类型简介
Jun 16 Python
python使用calendar输出指定年份全年日历的方法
Apr 04 Python
Python上传package到Pypi(代码简单)
Feb 06 Python
Python Web框架Tornado运行和部署
Oct 19 Python
Django rest framework基本介绍与代码示例
Jan 26 Python
Python使用pyh生成HTML文档的方法示例
Mar 10 Python
flask应用部署到服务器的方法
Jul 12 Python
Python对接六大主流数据库(只需三步)
Jul 31 Python
使用Tensorboard工具查看Loss损失率
Feb 15 Python
python实现根据给定坐标点生成多边形mask的例子
Feb 18 Python
Python实现获取当前目录下文件名代码详解
Mar 10 Python
pyinstaller将含有多个py文件的python程序做成exe
Apr 29 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
mysql时区问题
2008/03/26 PHP
php object转数组示例
2014/01/15 PHP
php无限级分类实现评论及回复功能
2019/02/18 PHP
一个js写的日历(代码部分网摘)
2009/09/20 Javascript
js遍历、动态的添加数据的小例子
2013/06/22 Javascript
浏览器兼容console对象的简要解决方案分享
2013/10/24 Javascript
jQuery 中DOM 操作详解
2015/01/13 Javascript
Js控制滑轮左右滑动实例
2015/02/13 Javascript
smartcrop.js智能图片裁剪库
2015/10/14 Javascript
AngularJS指令与控制器之间的交互功能示例
2016/12/14 Javascript
JSON 数据详解及实例代码分析
2017/01/20 Javascript
微信小程序获取手机系统信息的方法【附源码下载】
2017/12/07 Javascript
浅谈Vue SPA 首屏加载优化实践
2017/12/15 Javascript
vue项目webpack中Npm传递参数配置不同域名接口
2018/06/15 Javascript
layui 动态设置checbox 选中状态的例子
2019/09/02 Javascript
JS实现骰子3D旋转效果
2019/10/24 Javascript
[47:04]LGD vs infamous Supermajor小组赛D组 BO3 第二场 6.3
2018/06/04 DOTA
Python的Asyncore异步Socket模块及实现端口转发的例子
2016/06/14 Python
python 实现求解字符串集的最长公共前缀方法
2018/07/20 Python
Python 中 function(#) (X)格式 和 (#)在Python3.*中的注意事项
2018/11/30 Python
PyQt5中多线程模块QThread使用方法的实现
2020/01/31 Python
Python基于xlutils修改表格内容过程解析
2020/07/28 Python
用Python制作mini翻译器的实现示例
2020/08/17 Python
HTML5新表单元素_动力节点Java学院整理
2017/07/12 HTML / CSS
Yankee Candle官网:美国最畅销蜡烛品牌之一
2020/01/05 全球购物
英国拖鞋购买网站:Bedroom Athletics
2020/02/28 全球购物
俄罗斯童装网上商店:BebaKids
2020/06/06 全球购物
元宵节晚会主持人串词
2014/03/25 职场文书
小学校长竞聘演讲稿
2014/05/16 职场文书
银行柜员求职自荐书
2014/06/18 职场文书
学党史心得体会
2014/09/05 职场文书
国际政治学专业推荐信
2014/09/26 职场文书
清洁员岗位职责
2015/02/15 职场文书
大学班长竞选稿
2015/11/20 职场文书
什么是创业计划书?什么是商业计划书?这里一一解答
2019/07/12 职场文书
创业计划书之烤红薯
2019/09/26 职场文书