Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python解决字典中的值是列表问题的方法
Mar 04 Python
python实现倒计时的示例
Feb 14 Python
Python模块搜索概念介绍及模块安装方法介绍
Jun 03 Python
Python正则表达式使用范例分享
Dec 04 Python
Python3.6正式版新特性预览
Dec 15 Python
Python实现PS滤镜的旋转模糊功能示例
Jan 20 Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 Python
Python将string转换到float的实例方法
Jul 29 Python
Python绘制股票移动均线的实例
Aug 24 Python
python调用函数、类和文件操作简单实例总结
Nov 29 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
Mar 25 Python
python飞机大战游戏实例讲解
Dec 04 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
destoon找回管理员密码的方法
2014/06/21 PHP
PHP提示Deprecated: mysql_connect(): The mysql extension is deprecated的解决方法
2014/08/28 PHP
PHP中strpos、strstr和stripos、stristr函数分析
2016/06/11 PHP
php利用ZipArchive类操作文件的实例
2020/01/21 PHP
javascript字典探测用户名工具
2006/10/05 Javascript
利用javascript中的call实现继承
2007/01/22 Javascript
jQuery 使用个人心得
2009/02/26 Javascript
动态创建样式表在各浏览器中的差异测试代码
2011/09/13 Javascript
封装了一个js图片轮换效果的函数
2011/09/28 Javascript
简介JavaScript中的getUTCFullYear()方法的使用
2015/06/10 Javascript
浅谈js的异步执行
2016/10/18 Javascript
Jquery Easyui自定义下拉框组件使用详解(21)
2020/12/31 Javascript
js生成随机数方法和实例
2017/01/17 Javascript
遍历json获得数据的几种方法小结
2017/01/21 Javascript
JavaScript中最常用的10种代码简写技巧总结
2017/06/28 Javascript
JavaScript实现图片切换效果
2017/08/12 Javascript
angular2路由切换改变页面title的示例代码
2017/08/23 Javascript
webpack之devtool详解
2018/02/10 Javascript
详解Angular-ui-BootStrap组件的解释以及使用
2018/07/13 Javascript
对vuex中getters计算过滤操作详解
2019/11/06 Javascript
微信小程序将页面按钮悬浮固定在底部的实现代码
2020/10/29 Javascript
vue自定义组件实现双向绑定
2021/01/13 Vue.js
[04:30]显微镜下的DOTA2第五期——拉比克
2013/09/26 DOTA
Python虚拟环境项目实例
2017/11/20 Python
使用Python搭建虚拟环境的配置方法
2018/02/28 Python
详解python分布式进程
2018/10/08 Python
Python实现的统计文章单词次数功能示例
2019/07/08 Python
Python使用Tkinter实现滚动抽奖器效果
2020/01/06 Python
Python线程threading模块用法详解
2020/02/26 Python
python实现猜拳游戏
2020/03/04 Python
深入浅析Python 命令行模块 Click
2020/03/11 Python
Jupyter 无法下载文件夹如何实现曲线救国
2020/04/22 Python
大专生自荐信
2013/10/04 职场文书
逃课打麻将检讨书
2014/10/05 职场文书
老公给老婆的检讨书(精华篇)
2014/10/18 职场文书
结婚保证书
2015/01/16 职场文书