Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)


Posted in Python onJuly 20, 2020

摘要

在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。
这里就简单的介绍一下对于DataFrame去重和取重复值的操作。

创建DataFrame

这里首先创建一个包含一行重复值的DataFrame。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

2.DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我们就可以根据刚刚上面我们得到的两个DataFrame来concat到一起之后去重不保留重复值就可以。这样就把重复值取出来了。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

###############################
分割线:补充
###############################

4.DataFrame根据某列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

5.DataFrame根据某几列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

到此这篇关于Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)的文章就介绍到这了,更多相关DataFrame使用drop_duplicates去重内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 Python
python中cPickle用法例子分享
Jan 03 Python
使用python装饰器验证配置文件示例
Feb 24 Python
在Linux下调试Python代码的各种方法
Apr 17 Python
Python数据报表之Excel操作模块用法分析
Mar 11 Python
django如何通过类视图使用装饰器
Jul 24 Python
在Python中利用pickle保存变量的实例
Dec 30 Python
Python selenium使用autoIT上传附件过程详解
May 26 Python
python3.7中安装paddleocr及paddlepaddle包的多种方法
Nov 27 Python
python基于opencv批量生成验证码的示例
Apr 28 Python
Python进阶学习之带你探寻Python类的鼻祖-元类
May 08 Python
pytorch训练神经网络爆内存的解决方案
May 22 Python
python pandas dataframe 去重函数的具体使用
Jul 20 #Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
You might like
PHP数组操作简单案例分析
2016/10/15 PHP
PHP 根据key 给二维数组分组
2016/12/09 PHP
jQuery LigerUI 使用教程入门篇
2012/01/18 Javascript
js模拟点击事件实现代码
2012/11/06 Javascript
js使浏览器窗口最大化实现代码(适用于IE)
2013/08/07 Javascript
JavaScript阻止事件冒泡示例分享
2014/12/28 Javascript
jQuery实现批量判断表单中文本框非空的方法(2种方法)
2015/12/09 Javascript
vue.js表格组件开发的实例详解
2016/10/12 Javascript
javascript简易画板开发
2020/04/12 Javascript
js实现常见的工具条效果
2017/03/02 Javascript
webpack+vue2构建vue项目骨架的方法
2018/01/09 Javascript
vant-ui组件调用Dialog弹窗异步关闭操作
2020/11/04 Javascript
[02:05]2014DOTA2西雅图邀请赛 老队长全明星大猜想谁不服就按进显示器
2014/07/08 DOTA
[52:27]2018DOTA2亚洲邀请赛 3.31 小组赛B组 paiN vs Secret
2018/04/01 DOTA
Python生成随机密码
2015/03/10 Python
Python中使用装饰器时需要注意的一些问题
2015/05/11 Python
通过实例浅析Python对比C语言的编程思想差异
2015/08/30 Python
Python爬虫之正则表达式的使用教程详解
2018/10/25 Python
Django框架设置cookies与获取cookies操作详解
2019/05/27 Python
十分钟搞定pandas(入门教程)
2019/06/21 Python
Django之使用celery和NGINX生成静态页面实现性能优化
2019/10/08 Python
python图像处理模块Pillow的学习详解
2019/10/09 Python
浅析Python3 pip换源问题
2020/01/06 Python
Python正则表达式高级使用方法汇总
2020/06/18 Python
Python接口测试环境搭建过程详解
2020/06/29 Python
浅谈css3中的前缀
2016/07/20 HTML / CSS
使用CSS实现弹性视频html5案例实践
2012/12/26 HTML / CSS
美国奢侈品在线团购网站:Gilt City
2017/11/16 全球购物
在对linux系统分区进行格式化时需要对磁盘簇(或i节点密度)的大小进行选择,请说明选择的原则
2012/11/24 面试题
后勤人员自我鉴定
2013/10/20 职场文书
《将心比心》教学反思
2014/04/08 职场文书
卫生系统先进事迹
2014/05/13 职场文书
中秋晚会策划方案
2014/06/12 职场文书
2014年调度员工作总结
2014/11/19 职场文书
2015年绩效考核工作总结
2015/05/23 职场文书
Python通过m3u8文件下载合并ts视频的操作
2021/04/16 Python