编程 Python

Pandas DataFrame求差集的示例代码

Posted in Python onDecember 13, 2020

在Pandas中求差集没有专门的函数。处理办法就是将两个DataFrame追加合并，然后去重。

divident.append(hasThisYearDivident)
noHasThisYearDivident = divident.drop_duplicates(subset='ts_code', keep=False, inplace=True, ignore_index=True)

具体函数用法：

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html#pandas.DataFrame.append

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates

补充示例：Pandas中两个DataFrame的差集

在pandas中，两个DataFrame的差集并没有直接的库内置方法，现在我们希望有一种方法，就像python中set内置的求差集一样，来找到两个DataFrame的差集。

>>> a=set((1,2,3))
>>> a
{1, 2, 3}
>>> b=set((2,3,4))
>>> b
{2, 3, 4}
>>> a-b
{1}

上面代码片段是对set的内置求差集方法的回顾，现在我们希望能有类似的方法来找两个DataFrame的差集。

解决思路是这样的：

对于有同样Index的a,b两个DataFrame，如果现在要求a对b的差集，那么可以（1)连续两次扩充a，使用append方法（2）然后使用drop_duplicates方法对a进行去重，并且参数keep=False。原理很简单，也很巧妙，连续扩充2次a，那么新扩充完后的DataFrame中来自b的row肯定是重复的，去重时候，b全部被删除，与此同时，a中跟b重复的row也会顺带着被删除。

代码实现：

>>> import pandas as pd
>>> data_a={'state':[1,1,2],'pop':['a','b','c']}
>>> data_b={'state':[1,2,3],'pop':['b','c','d']}
>>> a=pd.DataFrame(data_a)
>>> b=pd.DataFrame(data_b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
>>> b
  state pop
0   1  b
1   2  c
2   3  d
>>> a=a.append(b)
>>> a=a.append(b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
0   1  b
1   2  c
2   3  d
0   1  b
1   2  c
2   3  d
>>> a.drop_duplicates(subset=['state','pop'],keep=False)
  state pop
0   1  a

到此这篇关于Pandas DataFrame求差集的示例代码的文章就介绍到这了,更多相关Pandas DataFrame求差集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Pandas DataFrame求差集的示例代码

- Author -

@凌晨三点半

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python实现爬虫从网络上下载文档的实例代码

Jun 13 Python

解决python3捕获cx_oracle抛出的异常错误问题

Oct 18 Python

python 计算平均平方误差(MSE)的实例

Jun 29 Python

django多文件上传,form提交,多对多外键保存的实例

Aug 06 Python

Python3 main函数使用sys.argv传入多个参数的实现

Dec 25 Python

Python面向对象之私有属性和私有方法应用案例分析

Dec 31 Python

python super函数使用方法详解

Feb 14 Python

一文轻松掌握python语言命名规范规则

Jun 18 Python

Python 忽略文件名编码的方法

Aug 01 Python

关于python3.9安装wordcloud出错的问题及解决办法

Nov 02 Python

Python实现小黑屋游戏的完整实例

Jan 06 Python

python程序的组织结构详解

Dec 06 Python

pandas实现导出数据的四种方式

Dec 13 #Python

python绘图pyecharts+pandas的使用详解

Dec 13 #Python

Pandas对每个分组应用apply函数的实现

Dec 13 #Python

python安装及变量名介绍详解

Dec 12 #Python

在python中对于bool布尔值的取反操作

Dec 11 #Python

python 基于opencv 绘制图像轮廓

Dec 11 #Python

python通过cython加密代码

Dec 11 #Python

You might like

php巧获服务器端信息

2006/12/06 PHP

解析如何用php screw加密php源代码

2013/06/20 PHP

php object转数组示例

2014/01/15 PHP

php实例分享之html转为rtf格式

2014/06/02 PHP

javascript 通用简单的table选项卡实现

2010/05/07 Javascript

JS定义回车事件(实现代码)

2013/07/08 Javascript

Javascript 浮点运算的问题分析与解决方法

2013/08/27 Javascript

原生js ActiveXObject获取execl里面的值

2013/11/01 Javascript

jQuery移除元素自动解绑事件实现思路及代码

2014/05/31 Javascript

js从Cookies里面取值的简单实现

2014/06/30 Javascript

nodejs实现获取某宝商品分类

2015/05/28 NodeJs

jQuery实现带动画效果的多级下拉菜单代码

2015/09/08 Javascript

JavaScript中的Array 对象（数组对象）

2016/06/02 Javascript

js生成随机数(指定范围)的实例代码

2016/07/10 Javascript

浅谈addEventListener和attachEvent的区别

2016/07/14 Javascript

Vue上传组件vue Simple Uploader的用法示例

2017/08/25 Javascript

详解如何使用PM2将Node.js的集群变得更加容易

2017/11/15 Javascript

JS实现获取毫秒值及转换成年月日时分秒的方法

2018/08/15 Javascript

jQuery访问json文件中数据的方法示例

2019/01/28 jQuery

keep-alive不能缓存多层级路由菜单问题解决

2020/03/10 Javascript

微信小程序上传帖子的实例代码(含有文字图片的微信验证)

2020/07/11 Javascript

vue实现在进行增删改操作后刷新页面

2020/08/05 Javascript

Python中的lstrip()方法使用简介

2015/05/19 Python

Python实现动态图解析、合成与倒放

2018/01/18 Python

常用python爬虫库介绍与简要说明

2020/01/25 Python

米兰必去买手店排行榜首位：Antonioli

2016/09/11 全球购物

Rodd & Gunn澳大利亚官网：新西兰男装品牌

2018/09/25 全球购物

乐高瑞士官方商店：LEGO CH

2020/08/16 全球购物

乔迁宴答谢词

2014/01/21 职场文书

家长学校培训材料

2014/08/20 职场文书

学年个人总结范文

2015/03/05 职场文书

求职信内容一般写什么？

2015/03/20 职场文书

教师求职自荐信

2015/03/26 职场文书

立春观后感

2015/06/18 职场文书

个人工作总结怎么写？

2019/04/09 职场文书

《中国机长》观后感：敬畏生命，敬畏职责

2019/11/12 职场文书