pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python各种语言间时间的转化实现代码
Mar 23 Python
Python多进程分块读取超大文件的方法
Apr 13 Python
简单谈谈python中的语句和语法
Aug 10 Python
Anaconda下配置python+opencv+contribx的实例讲解
Aug 06 Python
Python面向对象基础入门之编码细节与注意事项
Dec 11 Python
Python使用folium excel绘制point
Jan 03 Python
django将网络中的图片,保存成model中的ImageField的实例
Aug 07 Python
Python爬取腾讯视频评论的思路详解
Dec 19 Python
爬虫代理的cookie如何生成运行
Sep 22 Python
PyQt 如何创建自定义QWidget
Mar 24 Python
python基于tkinter制作m3u8视频下载工具
Apr 24 Python
python机器学习实现oneR算法(以鸢尾data为例)
Mar 03 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
一个简单实现多条件查询的例子
2006/10/09 PHP
php inc文件使用的风险和注意事项
2013/11/12 PHP
[原创]php简单隔行变色功能实现代码
2016/07/09 PHP
PHP使用星号替代用户名手机和邮箱的实现代码
2018/02/07 PHP
Laravel学习笔记之Artisan命令生成自定义模板的方法
2018/11/22 PHP
php设计模式之迭代器模式实例分析【星际争霸游戏案例】
2020/04/07 PHP
JavaScript高级程序设计 阅读笔记(十八) js跨平台的事件
2012/08/14 Javascript
jQuery Form 页面表单提交的小例子
2013/11/15 Javascript
alert和confirm功能介绍
2014/05/21 Javascript
jQuery实现时尚漂亮的弹出式对话框实例
2015/08/07 Javascript
jQuery事件绑定方法学习总结(推荐)
2016/11/21 Javascript
Bootstrap里的文件分别代表什么意思及其引用方法
2017/05/01 Javascript
angularJs中datatable实现代码
2017/06/03 Javascript
微信小程序swiper实现滑动放大缩小效果
2018/11/15 Javascript
微信小程序实现日历功能
2018/11/27 Javascript
react组件从搭建脚手架到在npm发布的步骤实现
2019/01/09 Javascript
泛谈JS逻辑判断选择器 || &&
2019/05/24 Javascript
AngularJs中$cookies简单用法分析
2019/05/30 Javascript
vue cli4.0项目引入typescript的方法
2020/07/17 Javascript
python中文乱码的解决方法
2013/11/04 Python
探索Python3.4中新引入的asyncio模块
2015/04/08 Python
使用Python的Treq on Twisted来进行HTTP压力测试
2015/04/16 Python
pandas数据预处理之dataframe的groupby操作方法
2018/04/13 Python
Python 3.6 读取并操作文件内容的实例
2018/04/23 Python
在python2.7中用numpy.reshape 对图像进行切割的方法
2018/12/05 Python
python实现三次样条插值
2018/12/17 Python
Python3 mmap内存映射文件示例解析
2020/03/23 Python
使用matlab 判断两个矩阵是否相等的实例
2020/05/11 Python
Python通过len函数返回对象长度
2020/10/22 Python
欧姆龙医疗保健与医疗产品:Omron Healthcare
2020/02/10 全球购物
澳大利亚电商Catch新西兰站:Catch.co.nz
2020/05/30 全球购物
毕业自我评价范文
2013/11/17 职场文书
员工年终演讲稿
2014/01/03 职场文书
个人批评与自我批评
2014/10/15 职场文书
冰峪沟导游词
2015/02/09 职场文书
导游词之云南-元阳梯田
2019/10/08 职场文书