Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)


Posted in Python onJuly 20, 2020

摘要

在进行数据分析时,我们经常需要对DataFrame去重,但有时候也会需要只保留重复值。
这里就简单的介绍一下对于DataFrame去重和取重复值的操作。

创建DataFrame

这里首先创建一个包含一行重复值的DataFrame。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

2.DataFrame去重,可以选择是否保留重复值,默认是保留重复值,想要不保留重复值的话直接设置参数keep为False即可。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

3.取DataFrame重复值。大多时候我们都是需要将数据去重,但是有时候很我们也需要取重复数据,这个时候我们就可以根据刚刚上面我们得到的两个DataFrame来concat到一起之后去重不保留重复值就可以。这样就把重复值取出来了。

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

###############################
分割线:补充
###############################

4.DataFrame根据某列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

5.DataFrame根据某几列去重

Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)

到此这篇关于Python DataFrame使用drop_duplicates()函数去重(保留重复值,取重复值)的文章就介绍到这了,更多相关DataFrame使用drop_duplicates去重内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
简单了解Python下用于监视文件系统的pyinotify包
Nov 13 Python
Python基于SMTP协议实现发送邮件功能详解
Aug 14 Python
python 实现对文件夹中的图像连续重命名方法
Oct 25 Python
Python 从列表中取值和取索引的方法
Dec 25 Python
Django接收自定义http header过程详解
Aug 23 Python
Python如何使用函数做字典的值
Nov 30 Python
Python autoescape标签用法解析
Jan 17 Python
Python面向对象程序设计之类和对象、实例变量、类变量用法分析
Mar 23 Python
基于python实现计算且附带进度条代码实例
Mar 31 Python
Python使用Pyqt5实现简易浏览器(最新版本测试过)
Apr 27 Python
python连接mysql数据库并读取数据的实现
Sep 25 Python
基于python模拟bfs和dfs代码实例
Nov 19 Python
python pandas dataframe 去重函数的具体使用
Jul 20 #Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
You might like
php下将XML转换为数组
2010/01/01 PHP
在IIS7.0下面配置PHP 5.3.2运行环境的方法
2010/04/13 PHP
PHP静态文件生成类实例
2014/11/29 PHP
PHP遍历数组的三种方法及效率对比分析
2015/02/12 PHP
PHP的Yii框架中行为的定义与绑定方法讲解
2016/03/18 PHP
PHP的openssl加密扩展使用小结(推荐)
2016/07/18 PHP
mysql alter table命令修改表结构实例详解
2016/09/24 PHP
PHP中rename()函数的妙用讲解
2019/02/28 PHP
JavaScript 乱码问题
2009/08/06 Javascript
JQuery将文本转化成JSON对象需要注意的问题
2011/05/09 Javascript
动态加载js、css等文件跨iframe实现
2014/02/24 Javascript
jQuery中多个元素的Hover事件解决方案
2014/06/12 Javascript
IE浏览器IFrame对象内存不释放问题解决方法
2014/08/22 Javascript
javascript自动生成包含数字与字符的随机字符串
2015/02/09 Javascript
第三篇Bootstrap网格基础
2016/06/21 Javascript
详解JavaScript时间处理之几个月前或几个月后的指定日期
2016/12/21 Javascript
使用bootstrap-paginator.js 分页来进行ajax 异步分页请求示例
2017/03/09 Javascript
使用jquery datatable和bootsrap创建表格实例代码
2017/03/17 Javascript
基于input动态模糊查询的实现方法
2017/12/12 Javascript
vue父组件向子组件(props)传递数据的方法
2018/01/02 Javascript
JS document form表单元素操作完整示例
2020/01/13 Javascript
JS常用跨域方法实现原理解析
2020/12/09 Javascript
使用python 获取进程pid号的方法
2014/03/10 Python
python实现基于两张图片生成圆角图标效果的方法
2015/03/26 Python
Scrapy基于selenium结合爬取淘宝的实例讲解
2018/06/13 Python
python远程连接服务器MySQL数据库
2018/07/02 Python
Python实现的对一个数进行因式分解操作示例
2019/06/27 Python
PyPDF2读取PDF文件内容保存到本地TXT实例
2020/05/12 Python
PyTorch中Tensor的数据类型和运算的使用
2020/09/03 Python
解决H5的a标签的download属性下载service上的文件出现跨域问题
2019/07/16 HTML / CSS
使用HTML5 Canvas API绘制弧线的教程
2016/03/22 HTML / CSS
客服文员岗位职责
2013/11/29 职场文书
人事主管岗位职责范本
2013/12/04 职场文书
二手书店创业计划书
2014/01/16 职场文书
离婚民事起诉状
2015/08/03 职场文书
mysql sum(if())和count(if())的用法说明
2022/01/18 MySQL