pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python时区设置方法与pytz查询时区教程
Nov 27 Python
用Python编写一个国际象棋AI程序
Nov 28 Python
讲解Python中的递归函数
Apr 27 Python
Python2随机数列生成器简单实例
Sep 04 Python
python 读取文件并替换字段的实例
Jul 12 Python
pycharm 解除默认unittest模式的方法
Nov 30 Python
Python除法之传统除法、Floor除法及真除法实例详解
May 23 Python
Python Numpy 控制台完全输出ndarray的实现
Feb 19 Python
matplotlib quiver箭图绘制案例
Apr 17 Python
10个示例带你掌握python中的元组
Nov 23 Python
如何用 Python 处理不平衡数据集
Jan 04 Python
Python 实现定积分与二重定积分的操作
May 26 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
PHP语法速查表
2006/12/06 PHP
弄了个检测传输的参数是否为数字的Function
2006/12/06 PHP
php银联网页支付实现方法
2015/03/04 PHP
PHP实现图片上传并压缩
2015/12/22 PHP
Yii2 assets清除缓存的方法
2016/05/16 PHP
php 生成Tab键或逗号分隔的CSV
2016/09/24 PHP
php获取字符串前几位的实例(substr返回字符串的子串用法)
2017/03/08 PHP
对php 判断http还是https,以及获得当前url的方法详解
2019/01/15 PHP
laravel在中间件内生成参数并且传递到控制器中的2种姿势
2019/10/15 PHP
ie下动态加态js文件的方法
2011/09/13 Javascript
jQuery在html有效在jsp无效的原因及解决方法
2013/08/02 Javascript
js 立即调用的函数表达式如何写
2014/01/12 Javascript
jQuery遍历json中多个map的方法
2015/02/12 Javascript
浅谈js 闭包引起的内存泄露问题
2015/06/22 Javascript
javascript创建函数的20种方式汇总
2015/06/23 Javascript
轻松实现javascript数据双向绑定
2015/11/11 Javascript
微信小程序 开发指南详解
2016/09/27 Javascript
vue使用iframe嵌入网页的示例代码
2020/06/09 Javascript
看看“疫苗查询”小程序有温度的代码
2018/07/31 Javascript
koa大型web项目中使用路由装饰器的方法示例
2019/04/02 Javascript
详解微信小程序用定时器实现倒计时效果
2019/04/30 Javascript
bootstrap-table formatter 使用vue组件的方法
2019/05/09 Javascript
JavaScript实现简单计算器
2020/03/19 Javascript
js模拟实现百度搜索
2020/06/28 Javascript
Ant Design Pro 之 ProTable使用操作
2020/10/31 Javascript
[36:29]2018DOTA2亚洲邀请赛 4.1 小组赛 A组加赛 LGD vs TNC
2018/04/02 DOTA
python如何派生内置不可变类型并修改实例化行为
2018/03/21 Python
python判断数字是否是超级素数幂
2018/09/27 Python
django的聚合函数和aggregate、annotate方法使用详解
2019/07/23 Python
python中的 zip函数详解及用法举例
2020/02/16 Python
tensorflow安装成功import tensorflow 出现问题
2020/04/16 Python
python爬虫可以爬什么
2020/06/16 Python
团队精神的演讲稿
2014/05/14 职场文书
离婚协议书标准格式
2014/10/04 职场文书
2019最新版劳务派遣管理制度
2019/08/16 职场文书
ElementUI实现el-form表单重置功能按钮
2021/07/21 Javascript