pd.drop_duplicates删除重复行的方法实现


Posted in Python onJune 16, 2022

drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。

一、使用语法及参数

使用语法:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

参数:

  • subset – 指定特定的列 默认所有列
  • keep:{‘first’, ‘last’, False} – 删除重复项并保留第一次出现的项 默认第一个
  • keep=False – 表示删除所有重复项 不保留
  • inplace – 是否直接修改原对象
  • gnore_index=True – 重置索引 (version 1.0.0 才有这个参数)

二、实操

1.例子一

import pandas as pd
df = pd.DataFrame({'a':[1,1,2,2],
                   'b':['a','b','a','b']})

# 单列
df.drop_duplicates('b', 'first', inplace=True)
print(df)
'''
   a  b
0  1  a
1  1  b
'''

# 多列
df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False)

# 删除所有重复项 不保留
df.drop_duplicates(subset=['a', 'b'], False)

2.例子二

# 构建测试数据框
import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})

# 默认按所有列去重
df.drop_duplicates()

# 指定列
df.drop_duplicates(subset=['brand'])

# 保留最后一个重复值
df.drop_duplicates(subset=['brand', 'style'], keep='last')

3.删除重复项后重置索引

# 方法一
df.drop_duplicates(ignore_index=True)

# 方法二
df.drop_duplicates().reset_index(drop=True)

# 方法三
df.index = range(df.shape[0])

到此这篇关于pd.drop_duplicates删除重复行的方法实现的文章就介绍到这了,更多相关pd.drop_duplicates删除重复行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用python实现baidu hi自动登录的代码
Feb 10 Python
Python ORM框架SQLAlchemy学习笔记之安装和简单查询实例
Jun 10 Python
利用python实现命令行有道词典的方法示例
Jan 31 Python
Python 装饰器使用详解
Jul 29 Python
python 使用socket传输图片视频等文件的实现方式
Aug 07 Python
Django url,从一个页面调到另个页面的方法
Aug 21 Python
对Python中一维向量和一维向量转置相乘的方法详解
Aug 26 Python
python3读取csv文件任意行列代码实例
Jan 13 Python
Python切割图片成九宫格的示例代码
Mar 10 Python
python使用pyecharts库画地图数据可视化的实现
Mar 25 Python
parser.add_argument中的action使用
Apr 20 Python
基于Python实现天天酷跑功能
Jan 06 Python
使用pd.merge表连接出现多余行的问题解决
Jun 16 #Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
You might like
五个PHP程序员工具
2008/05/26 PHP
PHP中的string类型使用说明
2010/07/27 PHP
PHP数组内存利用率低和弱类型详细解读
2017/08/10 PHP
PHP实现图的邻接矩阵表示及几种简单遍历算法分析
2017/11/24 PHP
php 使用 __call实现重载功能示例
2019/11/18 PHP
Thinkphp框架+Layui实现图片/文件上传功能分析
2020/02/07 PHP
用js重建星际争霸
2006/12/22 Javascript
javascript Keycode对照表
2009/10/24 Javascript
json 入门基础教程 推荐
2009/10/31 Javascript
javascript开发随笔一 preventDefault的必要
2011/11/25 Javascript
JavaScript 用Node.js写Shell脚本[译]
2012/09/20 Javascript
如何改进javascript代码的性能
2015/04/02 Javascript
教你用javascript实现随机标签云效果_附代码
2016/03/16 Javascript
gulp教程_从入门到项目中快速上手使用方法
2017/09/14 Javascript
uni-app 支持多端第三方地图定位的方法
2020/01/03 Javascript
小程序实现简单语音聊天的示例代码
2020/07/24 Javascript
浅谈vue-props的default写不写有什么区别
2020/08/09 Javascript
python使用正则表达式提取网页URL的方法
2015/05/26 Python
python enumerate函数的使用方法总结
2017/11/15 Python
Python采集代理ip并判断是否可用和定时更新的方法
2018/05/07 Python
解决Python 命令行执行脚本时,提示导入的包找不到的问题
2019/01/19 Python
python按照多个条件排序的方法
2019/02/08 Python
python简单实现矩阵的乘,加,转置和逆运算示例
2019/07/10 Python
python3 实现爬取TOP500的音乐信息并存储到mongoDB数据库中
2019/08/24 Python
Centos7 下安装最新的python3.8
2019/10/28 Python
使用PyOpenGL绘制三维坐标系实例
2019/12/24 Python
python字典和json.dumps()的遇到的坑分析
2020/03/11 Python
解决python使用list()时总是报错的问题
2020/05/05 Python
详解background属性的8个属性值(面试题)
2020/11/02 HTML / CSS
Canal官网:巴西女性时尚品牌
2019/10/16 全球购物
火灾现场处置方案
2014/05/28 职场文书
关键在于落实心得体会
2014/09/03 职场文书
2014个人年终工作总结范文
2014/12/15 职场文书
如何写一份具有法律效力的借款协议书?
2019/07/02 职场文书
iPhone13再次曝光
2021/04/15 数码科技
python自动计算图像数据集的RGB均值
2021/06/18 Python