pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
利用Python破解验证码实例详解
Dec 08 Python
Django如何实现内容缓存示例详解
Sep 24 Python
详谈Python3 操作系统与路径 模块(os / os.path / pathlib)
Apr 26 Python
int在python中的含义以及用法
Jun 27 Python
pip指定python位置安装软件包的方法
Jul 12 Python
python中用logging实现日志滚动和过期日志删除功能
Aug 20 Python
Python创建一个元素都为0的列表实例
Nov 28 Python
Pycharm最常用的快捷键及使用技巧
Mar 05 Python
django实现后台显示媒体文件
Apr 07 Python
基于Python的Jenkins的二次开发操作
May 12 Python
python+requests接口自动化框架的实现
Aug 31 Python
在pycharm创建scrapy项目的实现步骤
Dec 01 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
一个odbc连mssql分页的类
2006/10/09 PHP
推荐php模板技术[转]
2007/01/04 PHP
php二维数组排序与默认自然排序的方法介绍
2013/04/27 PHP
Yii2使用小技巧之通过 Composer 添加 FontAwesome 字体资源
2014/06/22 PHP
对PHP PDO的一些认识小结
2015/01/23 PHP
PHP读取汉字的点阵数据
2015/06/22 PHP
Laravel 中使用简单的方法跟踪用户是否在线(推荐)
2019/10/30 PHP
解析jquery中的ajax缓存问题
2013/12/19 Javascript
JS获取各种宽度、高度的简单介绍
2014/12/19 Javascript
详解.vue文件中style标签的几个标识符
2018/07/17 Javascript
详解vue-cli3多页应用改造
2019/06/04 Javascript
JS实现单张或多张图片持续无缝滚动的示例代码
2020/05/10 Javascript
VSCode launch.json配置详细教程
2020/06/18 Javascript
[03:43]TI9战队采访——PSG.LGD
2019/08/22 DOTA
使用Python进行二进制文件读写的简单方法(推荐)
2016/09/12 Python
python实现socket+threading处理多连接的方法
2019/07/23 Python
python读写csv文件并增加行列的实例代码
2019/08/01 Python
pytorch中的transforms模块实例详解
2019/12/31 Python
tensorflow通过模型文件,使用tensorboard查看其模型图Graph方式
2020/01/23 Python
Python中使用socks5设置全局代理的方法示例
2020/04/15 Python
python 抓取知乎指定回答下视频的方法
2020/07/09 Python
python批量生成条形码的示例
2020/10/10 Python
伦敦所有西区剧院演出官方票务代理:Theatre Tickets Direct
2017/05/26 全球购物
城野医生官方海外旗舰店:风靡亚洲毛孔收敛水
2018/04/26 全球购物
英国手机零售商:Metrofone
2019/03/18 全球购物
SCDKey德国:全球领先的数字游戏市场
2019/04/09 全球购物
某公司Java工程师面试题笔试题
2016/03/27 面试题
System.Array.CopyTo()和System.Array.Clone()有什么区别
2016/06/20 面试题
一句话工作感言
2014/03/01 职场文书
企业形象策划方案
2014/05/29 职场文书
学用政策心得体会
2014/09/10 职场文书
干部竞争上岗演讲稿
2014/09/11 职场文书
公务员个人年终总结
2015/02/12 职场文书
英文产品推荐信
2015/03/27 职场文书
CSS3点击按钮圆形进度打钩效果的实现代码
2021/03/30 HTML / CSS
Android开发之WECHAT微信小程序路由跳转的两种形式
2022/04/12 Java/Android