Pandas 同元素多列去重的实例


Posted in Python onJuly 03, 2018

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:

G1 G2
a b
b a
c d
d c
e f

对这样的两列数据进行同元素去重,最终得到结果为:

G1 G2
a b
c d
e f

代码如下:

#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
  tmp = sorted(i.split('|')) # The most important part,sort 
  p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')

以上这篇Pandas 同元素多列去重的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
分析Python编程时利用wxPython来支持多线程的方法
Apr 07 Python
Python中用format函数格式化字符串的用法
Apr 08 Python
Python缩进和冒号详解
Jun 01 Python
Python中属性和描述符的正确使用
Aug 23 Python
教你用 Python 实现微信跳一跳(Mac+iOS版)
Jan 04 Python
Python 获得命令行参数的方法(推荐)
Jan 24 Python
Python使用numpy模块创建数组操作示例
Jun 20 Python
python3 selenium自动化测试 强大的CSS定位方法
Aug 23 Python
Python3的socket使用方法详解
Feb 18 Python
使用keras实现densenet和Xception的模型融合
May 23 Python
大数据分析用java还是Python
Jul 06 Python
Python+OpenCV图像处理——打印图片属性、设置存储路径、调用摄像头
Oct 22 Python
Python中Numpy包的安装与使用方法简明教程
Jul 03 #Python
Python单元测试简单示例
Jul 03 #Python
Python3使用pandas模块读写excel操作示例
Jul 03 #Python
Python+pandas计算数据相关系数的实例
Jul 03 #Python
在dataframe两列日期相减并且得到具体的月数实例
Jul 03 #Python
python设置值及NaN值处理方法
Jul 03 #Python
数据清洗--DataFrame中的空值处理方法
Jul 03 #Python
You might like
PHP学习笔记(一) 简单了解PHP
2014/08/04 PHP
PHP删除指定目录中的所有目录及文件的方法
2015/02/26 PHP
PHP通过加锁实现并发情况下抢码功能
2016/08/10 PHP
php 获取xml接口数据的处理方法
2018/05/31 PHP
JavaScript中数组的排序、乱序和搜索实现代码
2011/11/30 Javascript
通过JS获取用户本地图片路径并显示的代码
2012/02/16 Javascript
关于jQuery对象数据缓存Cache原理以及jQuery.data详解
2013/04/07 Javascript
js获取上传文件大小示例代码
2014/04/10 Javascript
Node.js中使用Log.io在浏览器中实时监控日志(等同tail -f命令)
2014/09/17 Javascript
innerHTML在IE中报错解决方案
2014/12/15 Javascript
修复jQuery tablesorter无法正确排序的bug(加千分位数字后)
2016/03/30 Javascript
jQuery事件用法详解
2016/10/06 Javascript
KnockoutJS 3.X API 第四章之事件event绑定
2016/10/10 Javascript
JS如何判断浏览器类型和详细区分IE各版本浏览器
2017/03/04 Javascript
javaScript之split与join的区别(详解)
2017/11/08 Javascript
jQuery基于闭包实现的显示与隐藏div功能示例
2018/06/09 jQuery
webpack4 升级迁移的实现
2018/09/12 Javascript
vue+openlayers绘制省市边界线
2020/12/24 Vue.js
[02:04]2016国际邀请赛中国区预选赛VG.R晋级之路
2016/07/01 DOTA
详细分析python3的reduce函数
2017/12/05 Python
提升Python效率之使用循环机制代替递归函数
2019/07/23 Python
python如何使用socketserver模块实现并发聊天
2019/12/14 Python
Python打开文件、文件读写操作、with方式、文件常用函数实例分析
2020/01/07 Python
使用CSS3实现一个3D相册效果实例
2016/12/03 HTML / CSS
详解window.open被浏览器拦截的解决方案
2019/07/18 HTML / CSS
简述数组与指针的区别
2014/01/02 面试题
实习自荐信
2013/10/13 职场文书
股票投资建议书
2014/05/19 职场文书
化学教育专业求职信
2014/07/08 职场文书
励志演讲稿600字
2014/08/21 职场文书
办理房产证委托书
2014/09/18 职场文书
2015年学校图书室工作总结
2015/05/19 职场文书
幼儿园安全管理制度
2015/08/05 职场文书
Html5页面播放M4a音频文件
2021/03/30 HTML / CSS
centos8安装MongoDB的详细过程
2021/10/24 MongoDB
一文弄懂MySQL索引创建原则
2022/02/28 MySQL