pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
kNN算法python实现和简单数字识别的方法
Nov 18 Python
django 创建过滤器的实例详解
Aug 14 Python
简单谈谈python中的lambda表达式
Jan 19 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 Python
python读取文本绘制动态速度曲线
Jun 21 Python
python计算两个数的百分比方法
Jun 29 Python
python中下标和切片的使用方法解析
Aug 27 Python
python离线安装外部依赖包的实现
Feb 13 Python
利用python实现逐步回归
Feb 24 Python
keras .h5转移动端的.tflite文件实现方式
May 25 Python
用gpu训练好的神经网络,用tensorflow-cpu跑出错的原因及解决方案
Mar 03 Python
新手必备Python开发环境搭建教程
May 28 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
与数据库连接
2006/10/09 PHP
php下清空字符串中的HTML标签的代码
2010/09/06 PHP
PHP中英混合字符串截取函数代码
2011/07/17 PHP
页面乱码问题的根源及其分析
2013/08/09 PHP
Eclipse的PHP插件PHPEclipse安装和使用
2014/07/20 PHP
EXTJS FORM HIDDEN TEXTFIELD 赋值 使用value不好用的问题
2011/04/16 Javascript
javascript实现tabs选项卡切换效果(自写原生js)
2013/03/19 Javascript
获取鼠标在div中的相对位置的实现代码
2013/12/30 Javascript
Javascript Objects详解
2014/09/04 Javascript
jQuery无刷新分页完整实例代码
2015/10/27 Javascript
JS实现网页上随机产生超链接地址的方法
2015/11/09 Javascript
JavaScript中的原始值和复杂值
2016/01/07 Javascript
AngularJS实现星星等级评分功能
2016/09/24 Javascript
nodejs中全局变量的实例解析
2017/03/07 NodeJs
利用Javascript实现一套自定义事件机制
2017/12/14 Javascript
js 取消页面可以选中文字的功能方法
2018/01/02 Javascript
解决layui中table异步数据请求不支持自定义返回数据格式的问题
2018/08/19 Javascript
Vue插件打包与发布的方法示例
2018/08/20 Javascript
深入剖析JavaScript instanceof 运算符
2019/06/14 Javascript
Vue 微信端扫描二维码苹果端却只能保存图片问题(解决方法)
2020/01/19 Javascript
vue键盘事件点击事件加native操作
2020/07/27 Javascript
python实现根据ip地址反向查找主机名称的方法
2015/04/29 Python
pandas数据预处理之dataframe的groupby操作方法
2018/04/13 Python
django认证系统实现自定义权限管理的方法
2018/07/16 Python
pycharm第三方库安装失败的问题及解决经验分享
2020/05/09 Python
英国的知名精品百货公司:House of Fraser(福来德)
2016/08/14 全球购物
Evisu官方网站:日本牛仔品牌,时尚街头设计风格
2016/12/30 全球购物
获取邓白氏信用报告:Dun & Bradstreet
2019/01/22 全球购物
语文教学随笔感言
2014/02/18 职场文书
食品流通安全承诺书
2014/05/22 职场文书
年终考核实施方案
2014/05/26 职场文书
保护环境的标语
2014/06/09 职场文书
学校消防安全责任书
2014/07/23 职场文书
MongoDB日志切割的三种方式总结
2021/09/15 MongoDB
Python Flask搭建yolov3目标检测系统详解流程
2021/11/07 Python
win server2012 r2服务器共享文件夹如何设置
2022/06/21 Servers