Pandas 同元素多列去重的实例


Posted in Python onJuly 03, 2018

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:

G1 G2
a b
b a
c d
d c
e f

对这样的两列数据进行同元素去重,最终得到结果为:

G1 G2
a b
c d
e f

代码如下:

#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
  tmp = sorted(i.split('|')) # The most important part,sort 
  p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')

以上这篇Pandas 同元素多列去重的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python黑魔法之参数传递
Feb 12 Python
Python实现获取命令行输出结果的方法
Jun 10 Python
python+POP3实现批量下载邮件附件
Jun 19 Python
python实现简单多人聊天室
Dec 11 Python
python保存字典和读取字典的实例代码
Jul 07 Python
Python调用Windows命令打印文件
Feb 07 Python
matplotlib.pyplot.plot()参数使用详解
Jul 28 Python
Python面向对象多态实现原理及代码实例
Sep 16 Python
如何利用python检测图片是否包含二维码
Oct 15 Python
Python实现随机爬山算法
Jan 29 Python
Python实战之OpenCV实现猫脸检测
Jun 26 Python
python playwright 自动等待和断言详解
Nov 27 Python
Python中Numpy包的安装与使用方法简明教程
Jul 03 #Python
Python单元测试简单示例
Jul 03 #Python
Python3使用pandas模块读写excel操作示例
Jul 03 #Python
Python+pandas计算数据相关系数的实例
Jul 03 #Python
在dataframe两列日期相减并且得到具体的月数实例
Jul 03 #Python
python设置值及NaN值处理方法
Jul 03 #Python
数据清洗--DataFrame中的空值处理方法
Jul 03 #Python
You might like
php 按指定元素值去除数组元素的实现方法
2011/11/04 PHP
PHP 5.5 创建和验证哈希最简单的方法详解
2013/11/07 PHP
php错误日志简单配置方法
2016/07/11 PHP
PHP错误处理函数register_shutdown_function使用示例
2017/07/03 PHP
jquery教程ajax请求json数据示例
2014/01/13 Javascript
js获取视频时长代码
2014/04/10 Javascript
用javascript关闭本窗口不弹出询问框的方法
2014/09/12 Javascript
jQuery中attr()方法用法实例
2015/01/05 Javascript
js进行表单验证实例分析
2015/02/10 Javascript
在Ubuntu系统上安装Ghost博客平台的教程
2015/06/17 Javascript
js图片轮播特效代码分享
2015/09/07 Javascript
如何在Linux上安装Node.js
2016/04/01 Javascript
Bootstrap每天必学之响应式导航、轮播图
2016/04/25 Javascript
vue el-table实现行内编辑功能
2019/12/11 Javascript
[01:19:11]Ti4 循环赛第二日 NaVi.us vs iG
2014/07/11 DOTA
python3+PyQt5自定义视图详解
2018/04/24 Python
在Pycharm中设置默认自动换行的方法
2019/01/16 Python
Python删除n行后的其他行方法
2019/01/28 Python
python+selenium 定位到元素,无法点击的解决方法
2019/01/30 Python
NumPy 数组使用大全
2019/04/25 Python
win7上tensorflow2.2.0安装成功 引用DLL load failed时找不到指定模块 tensorflow has no attribute xxx 解决方法
2020/05/20 Python
Python预测2020高考分数和录取情况
2020/07/08 Python
vscode调试django项目的方法
2020/08/06 Python
英国电动工具购买网站:Anglia Tool Centre
2017/04/25 全球购物
Blue Nile台湾:钻石珠宝商,订婚首饰、结婚戒指和精品首饰
2017/11/24 全球购物
就业推荐表自我鉴定
2013/10/29 职场文书
中专生自我鉴定范文
2013/12/19 职场文书
城市创卫标语
2014/06/17 职场文书
自我介绍演讲稿范文
2014/08/21 职场文书
公司合作协议范文
2014/10/01 职场文书
仓库保管员岗位职责
2015/02/09 职场文书
公司员工体检通知
2015/04/21 职场文书
工资证明范本
2015/06/12 职场文书
英语读书笔记
2015/07/02 职场文书
CSS实现章节添加自增序号的方法
2021/06/23 HTML / CSS
源码分析Redis中 set 和 sorted set 的使用方法
2022/03/22 Redis