pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
老生常谈Python之装饰器、迭代器和生成器
Jul 26 Python
Python微信库:itchat的用法详解
Aug 14 Python
用python做游戏的细节详解
Jun 25 Python
python获取Linux发行版名称
Aug 30 Python
python 协程 gevent原理与用法分析
Nov 22 Python
Python包,__init__.py功能与用法分析
Jan 07 Python
python GUI库图形界面开发之PyQt5时间控件QTimer详细使用方法与实例
Feb 26 Python
pyqt5数据库使用详细教程(打包解决方案)
Mar 25 Python
Python爬虫实现百度翻译功能过程详解
May 29 Python
Python实现将元组中的元素作为参数传入函数的操作
Jun 05 Python
Django如何实现防止XSS攻击
Oct 13 Python
python mongo 向数据中的数组类型新增数据操作
Dec 05 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
一个PHP并发访问实例代码
2012/09/06 PHP
解析dedecms空间迁移步骤详解
2013/05/15 PHP
php的sso单点登录实现方法
2015/01/08 PHP
54个提高PHP程序运行效率的方法
2015/07/19 PHP
PHP递归实现层级树状展开
2016/04/01 PHP
thinkphp跨库操作的简单代码实例
2016/09/22 PHP
Prototype使用指南之hash.js
2007/01/10 Javascript
Extjs学习笔记之五 一个小细节renderTo和applyTo的区别
2010/01/07 Javascript
JavaScript 开发规范要求(图文并茂)
2010/06/11 Javascript
fixedBox固定div漂浮代码支持ie6以上大部分主流浏览器
2014/06/26 Javascript
js调试工具Console命令详解
2014/10/21 Javascript
JavaScript中的object转换函数toString()与valueOf()介绍
2014/12/31 Javascript
AngularJS基础 ng-href 指令用法
2016/08/01 Javascript
很棒的js Tab选项卡切换效果
2016/08/30 Javascript
jQuery zTree树插件简单使用教程
2017/01/10 Javascript
纯JS单页面赛车游戏制作代码分享
2017/03/03 Javascript
详解让sublime text3支持Vue语法高亮显示的示例
2017/09/29 Javascript
10行代码实现微信小程序滑动tab切换
2018/12/28 Javascript
在微信小程序中使用图表的方法示例
2019/04/25 Javascript
微信小程序上线发布流程图文详解
2019/05/06 Javascript
亲自动手实现vue日历控件
2019/06/26 Javascript
react-native 实现购物车滑动删除效果的示例代码
2021/01/15 Javascript
centos系统升级python 2.7.3
2014/07/03 Python
tensorflow-gpu安装的常见问题及解决方案
2020/01/20 Python
浅谈Python程序的错误:变量未定义
2020/06/02 Python
HTML5网页音乐播放器的示例代码
2017/11/09 HTML / CSS
自荐信不宜过于夸大
2013/11/06 职场文书
军训自我鉴定100字
2014/02/13 职场文书
班主任工作经验交流材料
2014/05/13 职场文书
警察正风肃纪剖析材料
2014/10/16 职场文书
乡镇党的群众路线教育实践活动总结报告
2014/10/30 职场文书
安徽导游词
2015/02/12 职场文书
在校生证明
2015/06/17 职场文书
如何在Mac上通过docker配置PHP开发环境
2021/05/29 PHP
MySQL 常见存储引擎的优劣
2021/06/02 MySQL
详解MySQL中timestamp和datetime时区问题导致做DTS遇到的坑
2021/12/06 MySQL