pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
matplotlib绘制符合论文要求的图片实例(必看篇)
Jun 02 Python
Django自定义分页效果
Jun 27 Python
python 对dataframe下面的值进行大规模赋值方法
Jun 09 Python
Pycharm配置远程调试的方法步骤
Dec 17 Python
Python 中的参数传递、返回值、浅拷贝、深拷贝
Jun 25 Python
Python批量查询关键词微信指数实例方法
Jun 27 Python
libreoffice python 操作word及excel文档的方法
Jul 04 Python
python的json中方法及jsonpath模块用法分析
Dec 06 Python
详解从Django Allauth中进行登录改造小结
Dec 18 Python
Python openpyxl模块实现excel读写操作
Jun 30 Python
django 将自带的数据库sqlite3改成mysql实例
Jul 09 Python
LeetCode189轮转数组python示例
Aug 05 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
PHP的面向对象编程
2006/10/09 PHP
php源代码安装常见错误与解决办法分享
2013/05/28 PHP
Codeigniter中mkdir创建目录遇到权限问题和解决方法
2014/07/25 PHP
[原创]ThinkPHP让../Public在模板不解析(直接输出)的方法
2015/10/09 PHP
Yii操作数据库实现动态获取表名的方法
2016/03/29 PHP
php pdo操作数据库示例
2017/03/10 PHP
php检测mysql表是否存在的方法小结
2017/07/20 PHP
Locate a File Using a File Open Dialog Box
2007/06/18 Javascript
两种简单实现菜单高亮显示的JS类代码
2010/06/27 Javascript
利用谷歌地图API获取点与点的距离的js代码
2012/10/11 Javascript
jquery图片放大功能简单实现
2013/08/01 Javascript
javascript实现类似百度分享功能的方法
2015/07/27 Javascript
黑帽seo劫持程序,js劫持搜索引擎代码
2015/09/15 Javascript
浅谈jQuery的bind和unbind事件(绑定和解绑事件)
2017/03/02 Javascript
Vue使用lodop实现打印小结
2019/07/06 Javascript
Vue3新特性之在Composition API中使用CSS Modules
2020/07/13 Javascript
vant 中van-list的用法说明
2020/11/11 Javascript
[06:42]DOTA2每周TOP10 精彩击杀集锦vol.1
2014/06/25 DOTA
[49:18]2018DOTA2亚洲邀请赛 3.31 小组赛 A组 OG vs TNC
2018/04/01 DOTA
[48:56]2018DOTA2亚洲邀请赛 3.31 小组赛 A组 VG vs KG
2018/03/31 DOTA
python操作mongodb根据_id查询数据的实现方法
2015/05/20 Python
Python匹配中文的正则表达式
2016/05/11 Python
python2与python3共存问题的解决方法
2018/09/18 Python
Python 获取异常(Exception)信息的几种方法
2020/12/29 Python
会计专业自荐信
2013/12/02 职场文书
2014年公务员思想汇报范文:全心全意为人民服务
2014/03/06 职场文书
残疾人小组计划书
2014/04/27 职场文书
高中课程设置方案
2014/05/28 职场文书
星级党支部申报材料
2014/05/31 职场文书
报考公务员诚信承诺书
2014/08/29 职场文书
物流管理专业推荐信
2014/09/06 职场文书
2014年民主评议党员工作总结
2014/12/02 职场文书
满月酒邀请函
2015/01/30 职场文书
2015年感恩父亲节演讲稿
2015/03/19 职场文书
2015年学校教务处工作总结
2015/05/11 职场文书
CSS布局之浮动(float)和定位(position)属性的区别
2021/09/25 HTML / CSS