Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的生成随机迷宫算法核心代码分享(含游戏完整代码)
Jul 11 Python
对于Python编程中一些重用与缩减的建议
Apr 14 Python
Python延时操作实现方法示例
Aug 14 Python
numpy基础教程之np.linalg
Feb 12 Python
Python3 执行系统命令并获取实时回显功能
Jul 09 Python
Python3操作Excel文件(读写)的简单实例
Sep 02 Python
使用python制作游戏下载进度条的代码(程序说明见注释)
Oct 24 Python
基于python实现语音录入识别代码实例
Jan 17 Python
解决django框架model中外键不落实到数据库问题
May 20 Python
python 实现非极大值抑制算法(Non-maximum suppression, NMS)
Oct 15 Python
python接口自动化框架实战
Dec 23 Python
python热力图实现简单方法
Jan 29 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
php 无法载入mysql扩展
2010/03/12 PHP
让php处理图片变得简单 基于gb库的图片处理类附实例代码下载
2011/05/17 PHP
php下载excel无法打开的解决方法
2013/12/24 PHP
百度站点地图(百度sitemap)生成方法分享
2014/01/09 PHP
PHP 魔术变量和魔术函数详解
2015/02/25 PHP
Yii2 rbac权限控制之rule教程详解
2016/06/23 PHP
PHP实现数组array转换成xml的方法
2016/07/19 PHP
php使用自带dom扩展进行元素匹配的原理解析
2020/05/29 PHP
(JS实现)MapBar中坐标的加密和解密的脚本
2007/05/16 Javascript
一实用的实现table排序的Javascript类库
2007/09/12 Javascript
检测是否已安装 .NET Framework 3.5的js脚本
2009/02/14 Javascript
jquery ajax学习笔记2 使用XMLHttpRequest对象的responseXML
2011/10/16 Javascript
easyui中combotree循环获取父节点至根节点并输出路径实现方法
2016/11/10 Javascript
微信小程序 地图map详解及简单实例
2017/01/10 Javascript
React Native实现进度条弹框的示例代码
2017/07/17 Javascript
Vue前后端不同端口的实现方法
2018/09/19 Javascript
webpack dll打包重复问题优化的解决
2018/10/10 Javascript
vue-router懒加载速度缓慢问题及解决方法
2018/11/25 Javascript
antd组件Upload实现自己上传的实现示例
2018/12/18 Javascript
微信小程序实现用table显示数据库反馈的多条数据功能示例
2019/05/07 Javascript
JavaScript或jQuery 获取option value值方法解析
2020/05/12 jQuery
antd日期选择器禁止选择当天之前的时间操作
2020/10/29 Javascript
[51:15]完美世界DOTA2联赛PWL S2 PXG vs Magma 第一场 11.21
2020/11/24 DOTA
python访问系统环境变量的方法
2015/04/29 Python
Python使用剪切板的方法
2017/06/06 Python
Python交互式图形编程的实现
2019/07/25 Python
python实现上传文件到linux指定目录的方法
2020/01/03 Python
python中xlrd模块的使用详解
2021/02/01 Python
用html5的canvas和JavaScript创建一个绘图程序的简单实例
2016/07/06 HTML / CSS
美国运动鞋和运动服零售商:Footaction
2017/04/07 全球购物
TobyDeals美国:在电子产品上获得最好的优惠和折扣
2019/08/11 全球购物
编程用JAVA解析XML的方式
2013/07/07 面试题
合唱兴趣小组活动总结
2014/07/10 职场文书
预备党员入党思想汇报(范文)
2019/08/14 职场文书
anaconda python3.8安装后降级
2021/06/11 Python
分享python函数常见关键字
2022/04/26 Python