Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python程序语言快速上手教程
Jul 18 Python
python实现按任意键继续执行程序
Dec 30 Python
Python获取CPU、内存使用率以及网络使用状态代码
Feb 08 Python
Python实现获取nginx服务器ip及流量统计信息功能示例
May 18 Python
Django中数据库的数据关系:一对一,一对多,多对多
Oct 21 Python
浅谈python中真正关闭socket的方法
Dec 18 Python
对python:循环定义多个变量的实例详解
Jan 20 Python
python实现桌面壁纸切换功能
Jan 21 Python
python代码打印100-999之间的回文数示例
Nov 24 Python
pymysql 插入数据 转义处理方式
Mar 02 Python
pycharm + django跨域无提示的解决方法
Dec 06 Python
Django利用AJAX技术实现博文实时搜索
May 06 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
最新的php 文件上传模型,支持多文件上传
2009/08/13 PHP
php使用str_replace实现输入框回车替换br的方法
2014/11/24 PHP
PHP中strpos、strstr和stripos、stristr函数分析
2016/06/11 PHP
php微信公众号js-sdk开发应用
2016/11/28 PHP
文本框回车提交与禁止提交示例
2013/09/27 Javascript
使用JS或jQuery模拟鼠标点击a标签事件代码
2014/03/10 Javascript
JavaScript中的typeof操作符用法实例
2014/04/05 Javascript
JavaScript实现图像模糊化的方法实例
2017/01/15 Javascript
基于JavaScript实现自定义滚动条
2017/01/25 Javascript
关于JavaScript中的this指向问题总结篇
2017/07/23 Javascript
使用Vue动态生成form表单的实例代码
2018/04/26 Javascript
koa2的中间件功能及应用示例
2020/03/05 Javascript
vue-cli单页面预渲染seo-prerender-spa-plugin操作
2020/08/10 Javascript
python开发的小球完全弹性碰撞游戏代码
2013/10/15 Python
python采用django框架实现支付宝即时到帐接口
2016/05/17 Python
python算法表示概念扫盲教程
2017/04/13 Python
利用python操作SQLite数据库及文件操作详解
2017/09/22 Python
python九九乘法表的实例
2017/09/26 Python
python如何使用unittest测试接口
2018/04/04 Python
Python获取航线信息并且制作成图的讲解
2019/01/03 Python
Django数据库类库MySQLdb使用详解
2019/04/28 Python
python并发编程多进程 互斥锁原理解析
2019/08/20 Python
Pycharm激活方法及详细教程(详细且实用)
2020/05/12 Python
pycharm激活方法到2099年(激活流程)
2020/09/22 Python
CSS3转换功能transform主要属性值分析及实现分享
2012/05/06 HTML / CSS
利用HTML5 Canvas制作键盘及鼠标动画的实例分享
2016/03/15 HTML / CSS
浅谈react路由传参的几种方式
2021/03/23 Javascript
公司委托书格式
2014/08/01 职场文书
竞聘演讲稿开场白
2014/08/25 职场文书
民主生活会对照检查材料思想汇报
2014/09/27 职场文书
法人身份证明书
2014/10/08 职场文书
民政局标准版离婚协议书
2014/12/01 职场文书
三峡导游词
2015/01/31 职场文书
2015年幼儿园教育教学工作总结
2015/05/25 职场文书
python爬不同图片分别保存在不同文件夹中的实现
2021/04/02 Python
深入解析MySQL索引数据结构
2021/10/16 MySQL