pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 性能优化方法小结
Mar 31 Python
Python安装图文教程 Pycharm安装教程
Mar 27 Python
python2.7实现FTP文件下载功能
Apr 15 Python
Pycharm 操作Django Model的简单运用方法
May 23 Python
python re模块的高级用法详解
Jun 06 Python
解决pandas.DataFrame.fillna 填充Nan失败的问题
Nov 06 Python
Python人脸识别第三方库face_recognition接口说明文档
May 03 Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 Python
python 计算概率密度、累计分布、逆函数的例子
Feb 25 Python
python字符串常用方法及文件简单读写的操作方法
Mar 04 Python
python实现猜数游戏(保存游戏记录)
Jun 22 Python
Pycharm安装python库的方法
Nov 24 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
php网上商城购物车设计代码分享
2012/02/15 PHP
spl_autoload_register与autoload的区别详解
2013/06/03 PHP
php程序内部post数据的方法
2015/03/31 PHP
php获取百度收录、百度热词及百度快照的方法
2015/04/02 PHP
使用PHP和JavaScript判断请求是否来自微信内浏览器
2015/08/18 PHP
PHP处理CSV表格文件的常用操作方法总结
2016/07/01 PHP
PHP自动补全表单的两种方法
2017/03/06 PHP
node.js入门教程
2014/06/01 Javascript
Jquery Easyui分割按钮组件SplitButton使用详解(17)
2016/12/18 Javascript
js实现鼠标左右移动,图片也跟着移动效果
2017/01/25 Javascript
Centos6.8下Node.js安装教程
2017/05/12 Javascript
详解Javascript获取缓存和清除缓存API
2017/05/25 Javascript
gulp解决跨域的配置文件问题
2017/06/08 Javascript
详解nodeJs文件系统(fs)与流(stream)
2018/01/24 NodeJs
jQuery实现动态加载select下拉列表项功能示例
2018/05/31 jQuery
Vue作用域插槽slot-scope实例代码
2018/09/05 Javascript
vue实现带过渡效果的下拉菜单功能
2020/02/19 Javascript
[02:28]PWL开团时刻DAY3——Ink Ice与DeMonsTer之间的勾心斗角
2020/11/03 DOTA
Python使用scrapy采集时伪装成HTTP/1.1的方法
2015/04/08 Python
玩转python爬虫之爬取糗事百科段子
2016/02/17 Python
Python手机号码归属地查询代码
2016/05/04 Python
python爬虫使用requests发送post请求示例详解
2020/08/05 Python
使用html2canvas实现浏览器截图的示例代码
2018/01/26 HTML / CSS
Abbacino官网:包、钱包和女士配饰
2019/04/15 全球购物
英国鲜花递送:Blossoming Gifts
2020/07/10 全球购物
南京迈特望C/C++面试题
2012/07/09 面试题
数据管理员的自我评价分享
2013/11/15 职场文书
工艺工程师工作职责
2013/11/23 职场文书
手机促销活动方案
2014/02/05 职场文书
行政部工作岗位职责范本
2014/03/05 职场文书
业务内勤岗位职责
2014/04/30 职场文书
中班下学期幼儿评语
2014/12/30 职场文书
公司股份转让协议书范本
2015/01/28 职场文书
大学毕业生自我评价
2015/03/02 职场文书
社区志愿服务活动感想
2015/08/07 职场文书
对讲机知识
2022/04/07 无线电