Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python字符串加密解密的三种方法分享(base64 win32com)
Jan 19 Python
Python多线程爬虫简单示例
Mar 04 Python
Python使用dis模块把Python反编译为字节码的用法详解
Jun 14 Python
Python只用40行代码编写的计算器实例
May 10 Python
Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例
Aug 18 Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 Python
Python实现去除列表中重复元素的方法总结【7种方法】
Feb 16 Python
python2爬取百度贴吧指定关键字和图片代码实例
Aug 14 Python
Django shell调试models输出的SQL语句方法
Aug 29 Python
Python笔记之观察者模式
Nov 20 Python
python 多线程爬取壁纸网站的示例
Feb 20 Python
Python OpenCV超详细讲解调整大小与图像操作的实现
Apr 02 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
Thinkphp5框架实现图片、音频和视频文件的上传功能详解
2019/08/27 PHP
JavaScript 学习 - 提高篇
2007/02/02 Javascript
修改jQuery.Autocomplete插件 支持中文输入法 避免TAB、ENTER键失效、导致表单提交
2009/10/11 Javascript
解决jQuery插件tipswindown与hintbox冲突
2010/11/05 Javascript
两个Javascript小tip资料
2010/11/23 Javascript
javascript延时加载之defer测试
2012/12/28 Javascript
JavaScript自定义事件介绍
2013/08/29 Javascript
JS获取屏幕高度的简单实现代码
2016/05/24 Javascript
AngularJs bootstrap详解及示例代码
2016/09/01 Javascript
vue的安装及element组件的安装方法
2018/03/09 Javascript
基于Webpack4和React hooks搭建项目的方法
2019/02/05 Javascript
详解jQuery-each()方法
2019/03/13 jQuery
layui的表单提交以及验证和修改弹框的实例
2019/09/09 Javascript
vue quill editor 使用富文本添加上传音频功能
2020/01/14 Javascript
[20:30]职业巡回赛回顾
2018/08/09 DOTA
[01:25:38]DOTA2-DPC中国联赛 正赛 VG vs LBZS BO3 第一场 1月19日
2021/03/11 DOTA
python装饰器初探(推荐)
2016/07/21 Python
python爬取w3shcool的JQuery课程并且保存到本地
2017/04/06 Python
Python实现可设置持续运行时间、线程数及时间间隔的多线程异步post请求功能
2018/01/11 Python
python用fsolve、leastsq对非线性方程组求解
2018/12/15 Python
基于python全局设置id 自动化测试元素定位过程解析
2019/09/04 Python
使用pyqt 实现重复打开多个相同界面
2019/12/13 Python
Python魔法方法 容器部方法详解
2020/01/02 Python
PyTorch中 tensor.detach() 和 tensor.data 的区别详解
2020/01/06 Python
python 6.7 编写printTable()函数表格打印(完整代码)
2020/03/25 Python
关于探究python中sys.argv时遇到的问题详解
2021/02/23 Python
希腊品牌鞋类销售网站:epapoutsia.gr
2020/03/18 全球购物
应届生骨科医生求职信
2013/10/31 职场文书
党委班子对照检查材料
2014/08/19 职场文书
党员批评与自我批评(5篇)
2014/09/23 职场文书
小学运动会报道稿
2014/10/04 职场文书
男方婚前保证书
2015/02/28 职场文书
初中生活随笔
2015/08/15 职场文书
Mysql数据库值的添加、修改、删除及清空操作实例
2021/06/20 MySQL
关于Python OS模块常用文件/目录函数详解
2021/07/01 Python
python机器学习Github已达8.9Kstars模型解释器LIME
2021/11/23 Python