pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
深入浅析Python字符编码
Nov 12 Python
将字典转换为DataFrame并进行频次统计的方法
Apr 08 Python
基于Django URL传参 FORM表单传数据 get post的用法实例
May 28 Python
pandas 将list切分后存入DataFrame中的实例
Jul 03 Python
利用Python将每日一句定时推送至微信的实现方法
Aug 13 Python
使用Python横向合并excel文件的实例
Dec 11 Python
python实现连续图文识别
Dec 18 Python
对Python 语音识别框架详解
Dec 24 Python
Pytorch卷积层手动初始化权值的实例
Aug 17 Python
详解Python 实现 ZeroMQ 的三种基本工作模式
Mar 24 Python
python更新数据库中某个字段的数据(方法详解)
Nov 18 Python
python DataFrame中stack()方法、unstack()方法和pivot()方法浅析
Apr 06 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
使用XDebug调试及单元测试覆盖率分析
2011/01/27 PHP
php中使用DOM类读取XML文件的实现代码
2011/12/14 PHP
探讨PHP函数ip2long转换IP时数值太大产生负数的解决方法
2013/06/06 PHP
PHP中file_exists函数不支持中文名的解决方法
2014/07/26 PHP
php微信支付接口开发程序
2016/08/02 PHP
JavaScript 学习技巧
2010/02/17 Javascript
js读取注册表的键值示例
2013/09/25 Javascript
Javascript简单实现可拖动的div
2013/10/22 Javascript
javascript常用代码段搜集
2014/12/04 Javascript
EasyUI在表单提交之前进行验证的实例代码
2016/06/24 Javascript
BootStrap学习系列之Bootstrap Typeahead 组件实现百度下拉效果(续)
2016/07/07 Javascript
React Native中TabBarIOS的简单使用方法示例
2017/10/13 Javascript
微信小程序实现红包功能(后端PHP实现逻辑)
2018/07/11 Javascript
vue.js父子组件通信动态绑定的实例
2018/09/28 Javascript
vue通过cookie获取用户登录信息的思路详解
2018/10/30 Javascript
layer.js之回调销毁对话框的例子
2019/09/11 Javascript
jquery检测上传文件大小示例
2020/04/26 jQuery
uni-app使用countdown插件实现倒计时
2020/11/01 Javascript
2款Python内存检测工具介绍和使用方法
2014/06/01 Python
python3使用urllib模块制作网络爬虫
2016/04/08 Python
Python实现的矩阵类实例
2017/08/22 Python
Python使用装饰器进行django开发实例代码
2018/02/06 Python
python3中获取文件当前绝对路径的两种方法
2018/04/26 Python
PyCharm搭建Spark开发环境实现第一个pyspark程序
2019/06/13 Python
如何安装2019Pycharm最新版本(详细教程)
2019/09/26 Python
解决python使用list()时总是报错的问题
2020/05/05 Python
详解WebSocket跨域问题解决
2018/08/06 HTML / CSS
美国鞋类购物网站:Shiekh Shoes
2016/08/21 全球购物
我们在web应用开发过程中经常遇到输出某种编码的字符,如iso8859-1等,如何输出一个某种编码的字符串?
2014/03/30 面试题
优秀研究生自我鉴定
2013/12/04 职场文书
小学毕业感言500字
2014/02/28 职场文书
武夷山导游词
2015/02/03 职场文书
2015年高校图书馆工作总结
2015/04/30 职场文书
Python中的min及返回最小值索引的操作
2021/05/10 Python
SpringCloud的JPA连接PostgreSql的教程
2021/06/26 Java/Android
Windows11性能真的上涨35%? 桌面酷睿i9实测结果公开
2021/11/21 数码科技