编程 Python

pd.drop_duplicates删除重复行的方法实现

Posted in Python onJune 16, 2022

一、使用语法及参数

使用语法：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

参数：

subset – 指定特定的列默认所有列
keep:{‘first’, ‘last’, False} – 删除重复项并保留第一次出现的项默认第一个
keep=False – 表示删除所有重复项不保留
inplace – 是否直接修改原对象
gnore_index=True – 重置索引（version 1.0.0 才有这个参数）

二、实操

1.例子一

import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
                   'b':['a','b','a','b']})

# 单列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
   a  b
0  1  a
1  1  b
'''

# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)

# 删除所有重复项 不保留
df.drop_duplicates(subset=['a', 'b'], False)

2.例子二

# 构建测试数据框
import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})

# 默认按所有列去重
df.drop_duplicates()

# 指定列
df.drop_duplicates(subset=['brand'])

# 保留最后一个重复值
df.drop_duplicates(subset=['brand', 'style'], keep='last')

3.删除重复项后重置索引

# 方法一
df.drop_duplicates(ignore_index=True)

# 方法二
df.drop_duplicates().reset_index(drop=True)

# 方法三
df.index = range(df.shape[0])

到此这篇关于pd.drop_duplicates删除重复行的方法实现的文章就介绍到这了,更多相关pd.drop_duplicates删除重复行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

pd.drop_duplicates删除重复行的方法实现

- Author -

Python热爱者

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用 Python 获取 Linux 系统信息的代码

Jul 13 Python

Python实现微信公众平台自定义菜单实例

Mar 20 Python

C#返回当前系统所有可用驱动器符号的方法

Apr 18 Python

用Python编写脚本使IE实现代理上网的教程

Apr 23 Python

Python中用于检查英文字母大写的isupper()方法

May 19 Python

Python实现的递归神经网络简单示例

Aug 11 Python

Django 路由控制的实现代码

Nov 08 Python

Python中常用的8种字符串操作方法

May 06 Python

python实现DEM数据的阴影生成的方法

Jul 23 Python

python相对企业语言优势在哪

Jun 12 Python

如何通过python检查文件是否被占用

Dec 18 Python

matplotlib之pyplot模块坐标轴标签设置使用(xlabel()、ylabel())

Feb 22 Python

使用pd.merge表连接出现多余行的问题解决

Jun 16 #Python

pd.DataFrame中的几种索引变换的实现

Python实战实现爬取天气数据并完成可视化分析详解

pandas时间序列之pd.to_datetime()的实现

Jun 16 #Python

pandas中pd.groupby()的用法详解

Jun 16 #Python

python中pd.cut()与pd.qcut()的对比及示例

Jun 16 #Python

Python自动操作神器PyAutoGUI的使用教程

Jun 16 #Python

You might like

CodeIgniter针对lighttpd服务器URL重写的方法

2015/06/10 PHP

cakephp常见知识点汇总

2017/02/24 PHP

Yii框架参数化查询中IN查询只能查询一个的解决方法

2017/05/20 PHP

Yii框架引入coreseek分页功能示例

2019/02/08 PHP

JavaScript 继承的实现

2009/07/09 Javascript

JavaScript 动态生成方法的例子

2009/07/22 Javascript

js几个验证函数代码

2010/03/25 Javascript

JS简单实现文件上传实例代码（无需插件）

2013/11/15 Javascript

jquery实现手风琴效果实例代码

2013/11/15 Javascript

在JS数组特定索引处指定位置插入元素的技巧

2014/08/24 Javascript

JS实现跟随鼠标立体翻转图片的方法

2015/05/04 Javascript

js实现人民币大写金额形式转换

2016/04/27 Javascript

详解javascript获取url信息的常见方法

2016/12/19 Javascript

在Js页面通过POST传递参数跳转到新页面详解

2017/08/25 Javascript

vue+vue-validator 表单验证功能的实现代码

2017/11/13 Javascript

基于js 各种排序方法和sort方法的区别(详解)

2018/01/03 Javascript

手挽手带你学React之React-router4.x的使用

2019/02/14 Javascript

基于JS实现数字动态变化显示效果附源码

2019/07/18 Javascript

layui复选框的全选与取消实现方法

2019/09/02 Javascript

python翻译软件实现代码(使用google api完成)

2013/11/26 Python

python求解数组中两个字符串的最小距离

2018/09/27 Python

python看某个模块的版本方法

2018/10/16 Python

分析经典Python开发工程师面试题

2019/04/08 Python

python中二分查找法的实现方法

2020/12/06 Python

苏宁红孩子母婴商城：redbaby

2017/02/12 全球购物

艺术家策划的室内设计：Curious Egg

2019/03/06 全球购物

法国二手MacBook销售网站：Okamac

2019/03/18 全球购物

Levi’s西班牙官方网站：李维斯，著名的牛仔裤品牌

2020/08/20 全球购物

教师研修随笔感言

2014/01/23 职场文书

幼儿园教师自我鉴定

2014/03/20 职场文书

不忘国耻振兴中华演讲稿

2014/05/14 职场文书

优秀教师推荐材料

2014/12/16 职场文书

新员工考核评语

2014/12/31 职场文书

2015年度团总支工作总结

2015/04/23 职场文书

导游词之河北邯郸

2019/09/12 职场文书

浅谈Golang 切片（slice）扩容机制的原理

2021/06/09 Golang

pd.drop_duplicates删除重复行的方法实现

目录

一、使用语法及参数

二、实操

1.例子一

2.例子二

3.删除重复项后重置索引