Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中wx将图标显示在右下角的脚本代码
Mar 08 Python
Python实现的文本简单可逆加密算法示例
May 18 Python
python安装模块如何通过setup.py安装(超简单)
May 05 Python
Python计算开方、立方、圆周率,精确到小数点后任意位的方法
Jul 17 Python
Python DataFrame.groupby()聚合函数,分组级运算
Sep 18 Python
pandas.DataFrame删除/选取含有特定数值的行或列实例
Nov 07 Python
详解Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)
Mar 26 Python
使用Python实现跳一跳自动跳跃功能
Jul 10 Python
通过实例解析python描述符原理作用
Jan 22 Python
Python3以GitHub为例来实现模拟登录和爬取的实例讲解
Jul 30 Python
python/golang实现循环链表的示例代码
Sep 14 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
May 14 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
PHP 日常开发小技巧
2009/09/23 PHP
php各种编码集详解和以及在什么情况下进行使用
2011/09/11 PHP
php实现设计模式中的单例模式详解
2014/10/11 PHP
window.addeventjs事件驱动函数集合addEvent等
2008/02/19 Javascript
js中cookie的添加、取值、删除示例代码
2013/10/21 Javascript
javascript的函数作用域
2014/11/12 Javascript
浅谈JavaScript对象的创建方式
2016/06/13 Javascript
JS之相等操作符详解
2016/09/13 Javascript
详解vue跨组件通信的几种方法
2017/06/15 Javascript
js实现图片轮播效果学习笔记
2017/07/26 Javascript
基于jQuery实现的单行公告活动轮播效果
2017/08/23 jQuery
webpack4.0 入门实践教程
2018/10/08 Javascript
搭建基于express框架运行环境的方法步骤
2018/11/15 Javascript
详解Angular Karma测试的持续集成实践
2019/11/15 Javascript
vue print.js打印支持Echarts图表操作
2020/11/13 Javascript
Python multiprocessing.Manager介绍和实例(进程间共享数据)
2014/11/21 Python
学习python类方法与对象方法
2016/03/15 Python
浅谈Python用QQ邮箱发送邮件时授权码的问题
2018/01/29 Python
对Python 文件夹遍历和文件查找的实例讲解
2018/04/26 Python
Python中利用xpath解析HTML的方法
2018/05/14 Python
python3中使用__slots__限定实例属性操作分析
2020/02/14 Python
使用Django xadmin 实现修改时间选择器为不可输入状态
2020/03/30 Python
html5使用canvas实现跟随光标跳动的火焰效果
2014/01/07 HTML / CSS
美国开幕式潮店:Opening Ceremony
2018/02/10 全球购物
巴西一家专门从事家居和装饰的连锁店:Camicado
2019/08/14 全球购物
英国电气世界:Electrical World
2019/09/08 全球购物
员工自我鉴定
2013/10/09 职场文书
小区门卫值班制度
2014/01/24 职场文书
事业单位分类改革实施方案
2014/03/21 职场文书
小区门卫的岗位职责
2014/09/26 职场文书
党的群众路线教育实践活动个人对照检查材料(校长)
2014/11/05 职场文书
个人思想政治总结
2015/03/05 职场文书
2016年学校十一国庆节活动总结
2016/04/01 职场文书
python实现简单聊天功能
2021/07/07 Python
彩虹社八名人气艺人全新周边限时推出,性转女装男装一次拥有!
2022/04/01 日漫
PYTHON基于Pyecharts绘制常见的直角坐标系图表
2022/04/28 Python