Pandas 同元素多列去重的实例


Posted in Python onJuly 03, 2018

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:

G1 G2
a b
b a
c d
d c
e f

对这样的两列数据进行同元素去重,最终得到结果为:

G1 G2
a b
c d
e f

代码如下:

#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
  tmp = sorted(i.split('|')) # The most important part,sort 
  p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')

以上这篇Pandas 同元素多列去重的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python输出指定月份日历的方法
Apr 23 Python
深入讲解Python中的迭代器和生成器
Oct 26 Python
python简单实例训练(21~30)
Nov 15 Python
浅析python协程相关概念
Jan 20 Python
详谈Python中列表list,元祖tuple和numpy中的array区别
Apr 18 Python
Python根据已知邻接矩阵绘制无向图操作示例
Jun 23 Python
Python实现简单层次聚类算法以及可视化
Mar 18 Python
Python读写文件基础知识点
Jun 10 Python
python多进程下的生产者和消费者模型
May 07 Python
Python scrapy爬取小说代码案例详解
Jul 09 Python
如何在windows下安装配置python工具Ulipad
Oct 27 Python
Python识别花卉种类鉴定网络热门植物并自动整理分类
Apr 08 Python
Python中Numpy包的安装与使用方法简明教程
Jul 03 #Python
Python单元测试简单示例
Jul 03 #Python
Python3使用pandas模块读写excel操作示例
Jul 03 #Python
Python+pandas计算数据相关系数的实例
Jul 03 #Python
在dataframe两列日期相减并且得到具体的月数实例
Jul 03 #Python
python设置值及NaN值处理方法
Jul 03 #Python
数据清洗--DataFrame中的空值处理方法
Jul 03 #Python
You might like
smarty模板数学运算示例
2016/12/11 PHP
云网广告中的代码,提示出错,大家找找
2006/11/21 Javascript
引入JS文件IE6报语法错误或缺少对象问题的解决方法
2014/01/09 Javascript
原生js结合html5制作简易的双色子游戏
2015/03/30 Javascript
关于JavaScript的变量的数据类型的判断方法
2015/08/14 Javascript
JavaScript自学笔记(必看篇)
2016/06/23 Javascript
Vuejs第十三篇之组件——杂项
2016/09/09 Javascript
js判断浏览器是否支持严格模式的方法
2016/10/04 Javascript
基于javascript实现的快速排序
2016/12/02 Javascript
wap手机端解决返回上一页的js实例
2016/12/08 Javascript
JS中mouseup事件丢失的原因与解决办法
2017/06/14 Javascript
Angular4学习笔记之根模块与Ng模块
2017/09/09 Javascript
详解vue项目的构建,打包,发布全过程
2017/11/23 Javascript
SpringBoot+Vue前后端分离,使用SpringSecurity完美处理权限问题的解决方法
2018/01/09 Javascript
深入浅析Vue全局组件与局部组件的区别
2018/06/15 Javascript
vue基础之使用get、post、jsonp实现交互功能示例
2019/03/12 Javascript
详解nodejs http请求相关总结
2019/03/31 NodeJs
Vue修改项目启动端口号方法
2019/11/07 Javascript
node.js开发辅助工具nodemon安装与配置详解
2020/02/06 Javascript
Python中对元组和列表按条件进行排序的方法示例
2015/11/10 Python
为Python的Tornado框架配置使用Jinja2模板引擎的方法
2016/06/30 Python
Python面向对象编程中关于类和方法的学习笔记
2016/06/30 Python
python爬取网页转换为PDF文件
2018/06/07 Python
python 格式化输出百分号的方法
2019/01/20 Python
python快排算法详解
2019/03/04 Python
python实现简单银行管理系统
2019/10/25 Python
Python基于tkinter canvas实现图片裁剪功能
2020/11/05 Python
瑜伽服装品牌:露露柠檬(lululemon athletica)
2017/06/04 全球购物
网络工程师面试(三木通信技术有限公司)
2013/06/05 面试题
行政助理求职自荐信
2013/10/26 职场文书
纪念九一八事变演讲稿:青少年应树立远大理想
2014/09/14 职场文书
道路交通事故人身损害赔偿协议书
2014/11/19 职场文书
小学生通知书评语
2014/12/31 职场文书
幼儿园新生开学寄语
2015/05/27 职场文书
北京爱情故事观后感
2015/06/12 职场文书
演讲稿之我的初心我的成长
2019/08/12 职场文书