pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python读取ini文件、操作mysql、发送邮件实例
Jan 01 Python
Python删除空文件和空文件夹的方法
Jul 14 Python
python 获取list特定元素下标的实例讲解
Apr 09 Python
PyQt5每天必学之日历控件QCalendarWidget
Apr 19 Python
Python 修改列表中的元素方法
Jun 26 Python
对numpy Array [: ,] 的取值方法详解
Jul 02 Python
Python logging模块用法示例
Aug 28 Python
python进阶之多线程对同一个全局变量的处理方法
Nov 09 Python
如何用python处理excel表格
Jun 09 Python
Python容器类型公共方法总结
Aug 19 Python
Python读写锁实现实现代码解析
Nov 28 Python
利用Matlab绘制各类特殊图形的实例代码
Jul 16 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
全国FM电台频率大全 - 24 贵州省
2020/03/11 无线电
php数组函数序列之rsort() - 对数组的元素值进行降序排序
2011/11/02 PHP
Codeigniter整合Tank Auth权限类库详解
2014/06/12 PHP
ThinkPHP中URL路径访问与模块控制器之间的关系
2014/08/23 PHP
PHP框架实现WebSocket在线聊天通讯系统
2019/11/21 PHP
浅析PHP中的 inet_pton 网络函数
2019/12/16 PHP
json 定义
2008/06/10 Javascript
学习JavaScript设计模式之责任链模式
2016/01/18 Javascript
JavaScript输出所选择起始与结束日期的方法
2017/07/12 Javascript
node实现定时发送邮件的示例代码
2017/08/26 Javascript
AngularJS实现表单验证功能详解
2017/10/12 Javascript
vue路由跳转时判断用户是否登录功能的实现
2017/10/26 Javascript
官方推荐react-navigation的具体使用详解
2018/05/08 Javascript
js中的reduce()函数讲解
2019/01/18 Javascript
jQuery+PHP+Ajax实现动态数字统计展示功能
2019/12/25 jQuery
全面分析Python的优点和缺点
2018/02/07 Python
通过Python 接口使用OpenCV的方法
2018/04/02 Python
pandas删除指定行详解
2019/04/04 Python
python循环定时中断执行某一段程序的实例
2019/06/29 Python
Django继承自带user表并重写的例子
2019/11/18 Python
python实现滑雪者小游戏
2020/02/22 Python
利用Python实现字幕挂载(把字幕文件与视频合并)思路详解
2020/10/21 Python
python 将html转换为pdf的几种方法
2020/12/29 Python
浅谈HTML5新增及移除的元素
2016/06/27 HTML / CSS
HTML5头部标签的一些常用信息小结
2016/10/23 HTML / CSS
html5手机键盘弹出收起的处理
2020/01/20 HTML / CSS
香港现代设计家具品牌:Ziinlife Furniture
2018/11/13 全球购物
法国高保真音响和家庭影院商店:Son Video
2019/04/26 全球购物
求网格中的黑点分布
2013/11/06 面试题
中学自我评价
2014/01/31 职场文书
广告学专业自荐信范文
2014/02/24 职场文书
电视节目策划方案
2014/05/16 职场文书
作弊检讨书范文
2015/05/06 职场文书
法律意见书范文
2015/06/04 职场文书
聘任通知书
2015/09/21 职场文书
Win11 Build 22000.829更新补丁KB5015882发布(附更新修复内容汇总)
2022/07/15 数码科技