编程 Python

pandas.DataFrame.drop_duplicates 用法介绍

Posted in Python onJuly 06, 2020

如下所示：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列，默认考虑所有列，就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False，first是指，保留搜索到的第一个重复数据，之后的都删除；last是指，保留搜索到的最后一个重复数据，之前的搜索到的重复数据都删除，False是指，把所有搜索到的重复数据都删除，一个都不保留，即如果有两行数据重复，把两行数据都删除，而不是保留其中一行。默认参数是first。

补充知识：python3删除数据重复值，只保留第一项。drop_duplicates（）函数使用介绍

原始数据如下：

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项，现在要将重复值删去，只保留第一项或最后一项。

使用drop_duplicates（）

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值，参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据，并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果：

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

pandas.DataFrame.drop_duplicates 用法介绍

- Author -

elraymond

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python各种语言间时间的转化实现代码

Mar 23 Python

Python多进程分块读取超大文件的方法

Apr 13 Python

简单谈谈python中的语句和语法

Aug 10 Python

Anaconda下配置python+opencv+contribx的实例讲解

Aug 06 Python

Python面向对象基础入门之编码细节与注意事项

Dec 11 Python

Python使用folium excel绘制point

Jan 03 Python

django将网络中的图片,保存成model中的ImageField的实例

Aug 07 Python

Python爬取腾讯视频评论的思路详解

Dec 19 Python

爬虫代理的cookie如何生成运行

Sep 22 Python

PyQt 如何创建自定义QWidget

Mar 24 Python

python基于tkinter制作m3u8视频下载工具

Apr 24 Python

python机器学习实现oneR算法(以鸢尾data为例)

Mar 03 Python

TensorFlow Autodiff自动微分详解

Jul 06 #Python

Keras loss函数剖析

Jul 06 #Python

keras 模型参数,模型保存,中间结果输出操作

Jul 06 #Python

Python自省及反射原理实例详解

Jul 06 #Python

如何通过命令行进入python

Jul 06 #Python

解决TensorFlow调用Keras库函数存在的问题

Jul 06 #Python

python else语句在循环中的运用详解

Jul 06 #Python

You might like

一个简单实现多条件查询的例子

2006/10/09 PHP

php inc文件使用的风险和注意事项

2013/11/12 PHP

[原创]php简单隔行变色功能实现代码

2016/07/09 PHP

PHP使用星号替代用户名手机和邮箱的实现代码

2018/02/07 PHP

Laravel学习笔记之Artisan命令生成自定义模板的方法

2018/11/22 PHP

php设计模式之迭代器模式实例分析【星际争霸游戏案例】

2020/04/07 PHP

JavaScript高级程序设计阅读笔记（十八） js跨平台的事件

2012/08/14 Javascript

jQuery Form 页面表单提交的小例子

2013/11/15 Javascript

alert和confirm功能介绍

2014/05/21 Javascript

jQuery实现时尚漂亮的弹出式对话框实例

2015/08/07 Javascript

jQuery事件绑定方法学习总结(推荐)

2016/11/21 Javascript

Bootstrap里的文件分别代表什么意思及其引用方法

2017/05/01 Javascript

angularJs中datatable实现代码

2017/06/03 Javascript

微信小程序swiper实现滑动放大缩小效果

2018/11/15 Javascript

微信小程序实现日历功能

2018/11/27 Javascript

react组件从搭建脚手架到在npm发布的步骤实现

2019/01/09 Javascript

泛谈JS逻辑判断选择器 || &&

2019/05/24 Javascript

AngularJs中$cookies简单用法分析

2019/05/30 Javascript

vue cli4.0项目引入typescript的方法

2020/07/17 Javascript

python中文乱码的解决方法

2013/11/04 Python

探索Python3.4中新引入的asyncio模块

2015/04/08 Python

使用Python的Treq on Twisted来进行HTTP压力测试

2015/04/16 Python

pandas数据预处理之dataframe的groupby操作方法

2018/04/13 Python

Python 3.6 读取并操作文件内容的实例

2018/04/23 Python

在python2.7中用numpy.reshape 对图像进行切割的方法

2018/12/05 Python

python实现三次样条插值

2018/12/17 Python

Python3 mmap内存映射文件示例解析

2020/03/23 Python

使用matlab 判断两个矩阵是否相等的实例

2020/05/11 Python

Python通过len函数返回对象长度

2020/10/22 Python

欧姆龙医疗保健与医疗产品：Omron Healthcare

2020/02/10 全球购物

澳大利亚电商Catch新西兰站：Catch.co.nz

2020/05/30 全球购物

毕业自我评价范文

2013/11/17 职场文书

员工年终演讲稿

2014/01/03 职场文书

个人批评与自我批评

2014/10/15 职场文书

冰峪沟导游词

2015/02/09 职场文书

导游词之云南-元阳梯田

2019/10/08 职场文书