pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中动态检测编码chardet的使用教程
Jul 06 Python
TensorFlow损失函数专题详解
Apr 26 Python
Python中的TCP socket写法示例
May 11 Python
Python测试网络连通性示例【基于ping】
Aug 03 Python
详解Python循环作用域与闭包
Mar 21 Python
Python面向对象之私有属性和私有方法应用案例分析
Dec 31 Python
python颜色随机生成器的实例代码
Jan 10 Python
python GUI库图形界面开发之PyQt5拖放控件实例详解
Feb 25 Python
解决ROC曲线画出来只有一个点的问题
Feb 28 Python
Python+OpenCV实现图像的全景拼接
Mar 05 Python
python使用openpyxl操作excel的方法步骤
May 28 Python
Python如何实现FTP功能
May 28 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
聊天室php&mysql(四)
2006/10/09 PHP
php header Content-Type类型小结
2011/07/03 PHP
PHP面向对象之后期静态绑定功能介绍
2015/05/18 PHP
php获取给定日期相差天数的方法分析
2017/02/20 PHP
使用JQUERY Tabs插件宿主IFRAMES
2010/01/01 Javascript
定义JavaScript二维数组采用定义数组的数组来实现
2012/12/09 Javascript
如何让页面加载完成后执行js
2013/06/26 Javascript
javascript:void(0)的问题使用探讨
2014/04/10 Javascript
jQuery层动画定位滑动效果的方法
2015/04/30 Javascript
jquery实现表单输入时提示文字滑动向上效果
2015/08/10 Javascript
js与jQuery实现checkbox复选框全选/全不选的方法
2016/01/05 Javascript
JavaScript html5 canvas绘制时钟效果(二)
2016/03/27 Javascript
JavaScript sort数组排序方法和自我实现排序方法小结
2016/06/06 Javascript
JavaScript编写九九乘法表(两种任选)
2017/02/04 Javascript
js中new一个对象的过程
2017/02/20 Javascript
js获取浏览器的各种属性
2017/04/27 Javascript
JS 组件系列之BootstrapTable的treegrid功能
2017/06/16 Javascript
Vue自定义指令封装节流函数的方法示例
2018/07/09 Javascript
Nodejs实现的操作MongoDB数据库功能完整示例
2019/02/02 NodeJs
Python 面向对象 成员的访问约束
2008/12/23 Python
详解字典树Trie结构及其Python代码实现
2016/06/03 Python
python3.4实现邮件发送功能
2018/05/28 Python
利用Python如何批量更新服务器文件
2018/07/29 Python
Python模块的加载讲解
2019/01/15 Python
python数组循环处理方法
2019/08/26 Python
python datetime中strptime用法详解
2019/08/29 Python
python的faker库用法
2019/11/28 Python
python实现百度OCR图片识别过程解析
2020/01/17 Python
利用CSS3实现毛玻璃效果示例源码
2016/09/25 HTML / CSS
Html5之title吸顶功能
2018/06/04 HTML / CSS
表达自我的市场:Society6
2018/08/01 全球购物
Linux中如何用命令创建目录
2016/12/02 面试题
党员民主生活会对照检查材料思想汇报
2014/09/28 职场文书
2014年小学美术工作总结
2014/12/20 职场文书
开工典礼致辞
2015/07/29 职场文书
Python数组变形的几种实现方法
2022/05/30 Python