Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python yield 使用方法浅析
May 20 Python
浅谈django model的get和filter方法的区别(必看篇)
May 23 Python
python+django加载静态网页模板解析
Dec 12 Python
使用实现pandas读取csv文件指定的前几行
Apr 20 Python
Python安装pycurl失败的解决方法
Oct 15 Python
Numpy之将矩阵拉成向量的实例
Nov 30 Python
django框架单表操作之增删改实例分析
Dec 16 Python
使用python实现哈希表、字典、集合操作
Dec 22 Python
使用TFRecord存取多个数据案例
Feb 17 Python
Python实现清理微信僵尸粉功能示例【基于itchat模块】
May 29 Python
python数据抓取3种方法总结
Feb 07 Python
解决Pyinstaller打包软件失败的一个坑
Mar 04 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
php文件夹的创建与删除方法
2015/01/24 PHP
php访问数组最后一个元素的函数end()用法
2015/03/18 PHP
php上传图片客户端和服务器端实现方法
2015/03/30 PHP
PHP使用MPDF类生成PDF的方法
2015/12/08 PHP
php 生成签名及验证签名详解
2016/10/26 PHP
基于jquery的获取浏览器窗口大小的代码
2011/03/28 Javascript
JavaScript中的this关键字介绍与使用实例
2013/06/21 Javascript
jquery $.each()使用探讨
2013/09/23 Javascript
给超链接添加特效鼠标移动展示提示信息且随鼠标移动
2013/10/17 Javascript
javascript确认框的三种使用方法
2013/12/17 Javascript
jQuery的end()方法使用详解
2015/07/15 Javascript
javascript作用域链(Scope Chain)用法实例解析
2015/11/30 Javascript
Bootstrap插件全集
2016/07/18 Javascript
AngularJS 基础ng-class-even指令用法
2016/08/01 Javascript
jQuery ajaxForm()的应用
2016/10/14 Javascript
微信小程序调用微信支付接口的实现方法
2019/04/29 Javascript
jQuery实现弹出层效果
2019/12/10 jQuery
原生js实现贪吃蛇游戏
2020/10/26 Javascript
实用的 vue tags 创建缓存导航的过程实现
2020/12/03 Vue.js
Python实现定期检查源目录与备份目录的差异并进行备份功能示例
2019/02/27 Python
简单了解python中对象的取反运算符
2019/07/01 Python
pandas条件组合筛选和按范围筛选的示例代码
2019/08/26 Python
Python csv模块使用方法代码实例
2019/08/29 Python
python Django框架实现web端分页呈现数据
2019/10/31 Python
Python3实现监控新型冠状病毒肺炎疫情的示例代码
2020/02/13 Python
Python在线和离线安装第三方库的方法
2020/10/31 Python
在购买印度民族服饰:Soch
2020/09/15 全球购物
为什么要做架构设计
2015/07/08 面试题
毕业实习个人鉴定范文
2013/12/10 职场文书
市政工程技术专业自荐书
2014/07/06 职场文书
财会专业大学生求职信
2014/09/26 职场文书
教师学期末个人总结
2015/02/13 职场文书
八年级作文之感悟亲情
2019/11/20 职场文书
Golang二维切片初始化的实现
2021/04/08 Golang
MySQL 覆盖索引的优点
2021/05/19 MySQL
POST提交数据常见的四种方式
2022/01/18 HTML / CSS