pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python进阶教程之模块(module)介绍
Aug 30 Python
python实现获取序列中最小的几个元素
Sep 25 Python
给Python初学者的一些编程技巧
Apr 03 Python
常见的在Python中实现单例模式的三种方法
Apr 08 Python
python单元测试unittest实例详解
May 11 Python
详解python 字符串和日期之间转换 StringAndDate
May 04 Python
在python中使用正则表达式查找可嵌套字符串组
Oct 24 Python
Django用户认证系统 组与权限解析
Aug 02 Python
余弦相似性计算及python代码实现过程解析
Sep 18 Python
python 中的[:-1]和[::-1]的具体使用
Feb 13 Python
Pycharm中安装wordcloud等库失败问题及终端通过pip安装的Python库如何添加到Pycharm解释器中(推荐)
May 10 Python
Python如何读取、写入JSON数据
Jul 28 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
php获得文件扩展名三法
2006/11/25 PHP
[转帖]PHP世纪万年历
2006/12/06 PHP
PHP面向对象编程快速入门
2006/12/14 PHP
深入解析php中的foreach问题
2013/06/30 PHP
PHP变量的定义、可变变量、变量引用、销毁方法
2013/12/20 PHP
php检索或者复制远程文件的方法
2015/03/13 PHP
WordPress中缩略图的使用以及相关技巧
2015/11/24 PHP
PHP消息队列用法实例分析
2016/02/12 PHP
PHP网站常见安全漏洞,及相应防范措施总结
2021/03/01 PHP
js 静态动态成员 and 信息的封装和隐藏
2011/05/29 Javascript
使用 JScript 创建 .exe 或 .dll 文件的方法
2011/07/13 Javascript
基于Jquery的文字自动截取(提供源代码)
2011/08/09 Javascript
Knockout visible绑定使用方法
2013/11/15 Javascript
js随机生成字母数字组合的字符串 随机动画数字
2015/09/02 Javascript
基于JavaScript实现瀑布流效果(循环渐近)
2016/01/27 Javascript
AngularJS入门教程之更多模板详解
2016/08/19 Javascript
vue cli2.0单页面title修改方法
2018/06/07 Javascript
微信小程序跨页面传递data数据方法解析
2019/12/13 Javascript
vue倒计时刷新页面不会从头开始的解决方法
2020/03/03 Javascript
JavaScript中的Proxy对象
2020/11/27 Javascript
[03:37]2016完美“圣”典 风云人物:Mikasa专访
2016/12/07 DOTA
python遍历类中所有成员的方法
2015/03/18 Python
Python自动调用IE打开某个网站的方法
2015/06/03 Python
python数据处理实战(必看篇)
2017/06/11 Python
详谈python read readline readlines的区别
2017/09/22 Python
python实现反转部分单向链表
2018/09/27 Python
详解Python的数据库操作(pymysql)
2019/04/04 Python
西班牙多品牌鞋店连锁店:Krack
2018/11/30 全球购物
Nisbets爱尔兰:英国最大的厨房和餐饮设备供应商
2019/01/26 全球购物
英文版餐饮业求职信
2013/10/18 职场文书
自主招生自荐信范文
2013/12/04 职场文书
销售业务员岗位职责
2014/01/29 职场文书
学校消防演习方案
2014/02/19 职场文书
留学经费担保书
2014/05/12 职场文书
面试自我评价范文
2014/09/17 职场文书
大学生推广普通话演讲稿
2014/09/21 职场文书