pd.drop_duplicates删除重复行的方法实现


Posted in Python onJune 16, 2022

drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。

一、使用语法及参数

使用语法:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

参数:

  • subset – 指定特定的列 默认所有列
  • keep:{‘first’, ‘last’, False} – 删除重复项并保留第一次出现的项 默认第一个
  • keep=False – 表示删除所有重复项 不保留
  • inplace – 是否直接修改原对象
  • gnore_index=True – 重置索引 (version 1.0.0 才有这个参数)

二、实操

1.例子一

import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
                   'b':['a','b','a','b']})

# 单列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
   a  b
0  1  a
1  1  b
'''

# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)

# 删除所有重复项 不保留
df.drop_duplicates(subset=['a', 'b'], False)

2.例子二

# 构建测试数据框
import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})

# 默认按所有列去重
df.drop_duplicates()

# 指定列
df.drop_duplicates(subset=['brand'])

# 保留最后一个重复值
df.drop_duplicates(subset=['brand', 'style'], keep='last')

3.删除重复项后重置索引

# 方法一
df.drop_duplicates(ignore_index=True)

# 方法二
df.drop_duplicates().reset_index(drop=True)

# 方法三
df.index = range(df.shape[0])

到此这篇关于pd.drop_duplicates删除重复行的方法实现的文章就介绍到这了,更多相关pd.drop_duplicates删除重复行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用 Python 获取 Linux 系统信息的代码
Jul 13 Python
Python实现微信公众平台自定义菜单实例
Mar 20 Python
C#返回当前系统所有可用驱动器符号的方法
Apr 18 Python
用Python编写脚本使IE实现代理上网的教程
Apr 23 Python
Python中用于检查英文字母大写的isupper()方法
May 19 Python
Python实现的递归神经网络简单示例
Aug 11 Python
Django 路由控制的实现代码
Nov 08 Python
Python中常用的8种字符串操作方法
May 06 Python
python实现DEM数据的阴影生成的方法
Jul 23 Python
python相对企业语言优势在哪
Jun 12 Python
如何通过python检查文件是否被占用
Dec 18 Python
matplotlib之pyplot模块坐标轴标签设置使用(xlabel()、ylabel())
Feb 22 Python
使用pd.merge表连接出现多余行的问题解决
Jun 16 #Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
You might like
CodeIgniter针对lighttpd服务器URL重写的方法
2015/06/10 PHP
cakephp常见知识点汇总
2017/02/24 PHP
Yii框架参数化查询中IN查询只能查询一个的解决方法
2017/05/20 PHP
Yii框架引入coreseek分页功能示例
2019/02/08 PHP
JavaScript 继承的实现
2009/07/09 Javascript
JavaScript 动态生成方法的例子
2009/07/22 Javascript
js几个验证函数代码
2010/03/25 Javascript
JS简单实现文件上传实例代码(无需插件)
2013/11/15 Javascript
jquery实现手风琴效果实例代码
2013/11/15 Javascript
在JS数组特定索引处指定位置插入元素的技巧
2014/08/24 Javascript
JS实现跟随鼠标立体翻转图片的方法
2015/05/04 Javascript
js实现人民币大写金额形式转换
2016/04/27 Javascript
详解javascript获取url信息的常见方法
2016/12/19 Javascript
在Js页面通过POST传递参数跳转到新页面详解
2017/08/25 Javascript
vue+vue-validator 表单验证功能的实现代码
2017/11/13 Javascript
基于js 各种排序方法和sort方法的区别(详解)
2018/01/03 Javascript
手挽手带你学React之React-router4.x的使用
2019/02/14 Javascript
基于JS实现数字动态变化显示效果附源码
2019/07/18 Javascript
layui复选框的全选与取消实现方法
2019/09/02 Javascript
python翻译软件实现代码(使用google api完成)
2013/11/26 Python
python求解数组中两个字符串的最小距离
2018/09/27 Python
python看某个模块的版本方法
2018/10/16 Python
分析经典Python开发工程师面试题
2019/04/08 Python
python中二分查找法的实现方法
2020/12/06 Python
苏宁红孩子母婴商城:redbaby
2017/02/12 全球购物
艺术家策划的室内设计:Curious Egg
2019/03/06 全球购物
法国二手MacBook销售网站:Okamac
2019/03/18 全球购物
Levi’s西班牙官方网站:李维斯,著名的牛仔裤品牌
2020/08/20 全球购物
教师研修随笔感言
2014/01/23 职场文书
幼儿园教师自我鉴定
2014/03/20 职场文书
不忘国耻振兴中华演讲稿
2014/05/14 职场文书
优秀教师推荐材料
2014/12/16 职场文书
新员工考核评语
2014/12/31 职场文书
2015年度团总支工作总结
2015/04/23 职场文书
导游词之河北邯郸
2019/09/12 职场文书
浅谈Golang 切片(slice)扩容机制的原理
2021/06/09 Golang