Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python高级应用实例对比:高效计算大文件中的最长行的长度
Jun 08 Python
Python内存管理方式和垃圾回收算法解析
Nov 11 Python
Python使用combinations实现排列组合的方法
Nov 13 Python
Python类和对象的定义与实际应用案例分析
Dec 27 Python
python实现代码统计程序
Sep 19 Python
pytorch实现mnist数据集的图像可视化及保存
Jan 14 Python
postman和python mock测试过程图解
Feb 22 Python
jupyter修改文件名方式(TensorFlow)
Apr 21 Python
PyInstaller运行原理及常用操作详解
Jun 13 Python
如何通过命令行进入python
Jul 06 Python
python利用蒙版抠图(使用PIL.Image和cv2)输出透明背景图
Aug 04 Python
mac系统下安装pycharm、永久激活、中文汉化详细教程
Nov 24 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
DOTA2 1月28日更新:监管系统降临刀塔世界
2021/01/28 DOTA
html中select语句读取mysql表中内容
2006/10/09 PHP
PHP学习笔记之二 php入门知识
2011/01/12 PHP
分享下页面关键字抓取www.icbase.com站点代码(带asp.net参数的)
2014/01/30 PHP
php通过递归方式复制目录和子目录的方法
2015/03/13 PHP
PHP实现表单提交时去除斜杠的方法
2016/12/26 PHP
JavaScript初学者应注意的七个细节详细介绍
2012/12/27 Javascript
javascript操纵OGNL标签示例代码
2014/06/16 Javascript
jQuery实现的图片分组切换焦点图插件
2015/01/06 Javascript
基于javascript如何传递特殊字符
2015/11/30 Javascript
每日十条JavaScript经验技巧(一)
2016/06/23 Javascript
bootstrap table小案例
2016/10/21 Javascript
jsTree使用记录实例
2016/12/01 Javascript
深入理解Javascript中的观察者模式
2017/02/20 Javascript
深入理解react-router@4.0 使用和源码解析
2017/05/23 Javascript
Javascript继承机制详解
2017/05/30 Javascript
requireJS模块化实现返回顶部功能的方法详解
2017/10/16 Javascript
vue.js实现点击后动态添加class及删除同级class的实现代码
2018/04/04 Javascript
在vue中使用SockJS实现webSocket通信的过程
2018/08/29 Javascript
Javascript实现鼠标移入方向感知
2020/06/24 Javascript
vue实现移动端拖动排序
2020/08/21 Javascript
利用python将pdf输出为txt的实例讲解
2018/04/23 Python
django 发送手机验证码的示例代码
2018/04/25 Python
Django实现从数据库中获取到的数据转换为dict
2020/03/27 Python
Python如何实现的二分查找算法
2020/05/27 Python
Pycharm新手使用教程(图文详解)
2020/09/17 Python
HTML5之SVG 2D入门2—图形绘制(基本形状)介绍及使用
2013/01/30 HTML / CSS
基于html5绘制圆形多角图案
2016/04/21 HTML / CSS
结婚典礼证婚词
2014/01/11 职场文书
《祁黄羊》教学反思
2014/04/22 职场文书
会计岗位职责范本
2015/04/02 职场文书
培训简讯范文
2015/07/20 职场文书
仓库管理制度范本
2015/08/04 职场文书
严以用权学习心得体会
2016/01/12 职场文书
WordPress多语言翻译插件 - WPML使用教程
2021/04/01 PHP
使用 JavaScript 制作页面效果
2021/04/21 Javascript