Pandas DataFrame求差集的示例代码


Posted in Python onDecember 13, 2020

在Pandas中 求差集没有专门的函数。处理办法就是将两个DataFrame追加合并,然后去重。

divident.append(hasThisYearDivident)
noHasThisYearDivident = divident.drop_duplicates(subset='ts_code', keep=False, inplace=True, ignore_index=True)

具体函数用法:

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html#pandas.DataFrame.append

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates

补充示例:Pandas中两个DataFrame的差集

在pandas中,两个DataFrame的差集并没有直接的库内置方法,现在我们希望有一种方法,就像python中set内置的求差集一样,来找到两个DataFrame的差集。

>>> a=set((1,2,3))
>>> a
{1, 2, 3}
>>> b=set((2,3,4))
>>> b
{2, 3, 4}
>>> a-b
{1}

上面代码片段是对set的内置求差集方法的回顾,现在我们希望能有类似的方法来找两个DataFrame的差集。

解决思路是这样的:

对于有同样Index的a,b两个DataFrame,如果现在要求a对b的差集,那么可以(1)连续两次扩充a,使用append方法(2)然后使用drop_duplicates方法对a进行去重,并且参数keep=False。原理很简单,也很巧妙,连续扩充2次a,那么新扩充完后的DataFrame中来自b的row肯定是重复的,去重时候,b全部被删除,与此同时,a中跟b重复的row也会顺带着被删除。

代码实现:

>>> import pandas as pd
>>> data_a={'state':[1,1,2],'pop':['a','b','c']}
>>> data_b={'state':[1,2,3],'pop':['b','c','d']}
>>> a=pd.DataFrame(data_a)
>>> b=pd.DataFrame(data_b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
>>> b
  state pop
0   1  b
1   2  c
2   3  d
>>> a=a.append(b)
>>> a=a.append(b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
0   1  b
1   2  c
2   3  d
0   1  b
1   2  c
2   3  d
>>> a.drop_duplicates(subset=['state','pop'],keep=False)
  state pop
0   1  a

到此这篇关于Pandas DataFrame求差集的示例代码的文章就介绍到这了,更多相关Pandas DataFrame求差集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现爬虫从网络上下载文档的实例代码
Jun 13 Python
解决python3捕获cx_oracle抛出的异常错误问题
Oct 18 Python
python 计算平均平方误差(MSE)的实例
Jun 29 Python
django多文件上传,form提交,多对多外键保存的实例
Aug 06 Python
Python3 main函数使用sys.argv传入多个参数的实现
Dec 25 Python
Python面向对象之私有属性和私有方法应用案例分析
Dec 31 Python
python super函数使用方法详解
Feb 14 Python
一文轻松掌握python语言命名规范规则
Jun 18 Python
Python 忽略文件名编码的方法
Aug 01 Python
关于python3.9安装wordcloud出错的问题及解决办法
Nov 02 Python
Python实现小黑屋游戏的完整实例
Jan 06 Python
python程序的组织结构详解
Dec 06 Python
pandas实现导出数据的四种方式
Dec 13 #Python
python绘图pyecharts+pandas的使用详解
Dec 13 #Python
Pandas对每个分组应用apply函数的实现
Dec 13 #Python
python安装及变量名介绍详解
Dec 12 #Python
在python中对于bool布尔值的取反操作
Dec 11 #Python
python 基于opencv 绘制图像轮廓
Dec 11 #Python
python通过cython加密代码
Dec 11 #Python
You might like
php巧获服务器端信息
2006/12/06 PHP
解析如何用php screw加密php源代码
2013/06/20 PHP
php object转数组示例
2014/01/15 PHP
php实例分享之html转为rtf格式
2014/06/02 PHP
javascript 通用简单的table选项卡实现
2010/05/07 Javascript
JS定义回车事件(实现代码)
2013/07/08 Javascript
Javascript 浮点运算的问题分析与解决方法
2013/08/27 Javascript
原生js ActiveXObject获取execl里面的值
2013/11/01 Javascript
jQuery移除元素自动解绑事件实现思路及代码
2014/05/31 Javascript
js从Cookies里面取值的简单实现
2014/06/30 Javascript
nodejs实现获取某宝商品分类
2015/05/28 NodeJs
jQuery实现带动画效果的多级下拉菜单代码
2015/09/08 Javascript
JavaScript中的Array 对象(数组对象)
2016/06/02 Javascript
js生成随机数(指定范围)的实例代码
2016/07/10 Javascript
浅谈addEventListener和attachEvent的区别
2016/07/14 Javascript
Vue上传组件vue Simple Uploader的用法示例
2017/08/25 Javascript
详解如何使用PM2将Node.js的集群变得更加容易
2017/11/15 Javascript
JS实现获取毫秒值及转换成年月日时分秒的方法
2018/08/15 Javascript
jQuery访问json文件中数据的方法示例
2019/01/28 jQuery
keep-alive不能缓存多层级路由菜单问题解决
2020/03/10 Javascript
微信小程序上传帖子的实例代码(含有文字图片的微信验证)
2020/07/11 Javascript
vue实现在进行增删改操作后刷新页面
2020/08/05 Javascript
Python中的lstrip()方法使用简介
2015/05/19 Python
Python实现动态图解析、合成与倒放
2018/01/18 Python
常用python爬虫库介绍与简要说明
2020/01/25 Python
米兰必去买手店排行榜首位:Antonioli
2016/09/11 全球购物
Rodd & Gunn澳大利亚官网:新西兰男装品牌
2018/09/25 全球购物
乐高瑞士官方商店:LEGO CH
2020/08/16 全球购物
乔迁宴答谢词
2014/01/21 职场文书
家长学校培训材料
2014/08/20 职场文书
学年个人总结范文
2015/03/05 职场文书
求职信内容一般写什么?
2015/03/20 职场文书
教师求职自荐信
2015/03/26 职场文书
立春观后感
2015/06/18 职场文书
个人工作总结怎么写?
2019/04/09 职场文书
《中国机长》观后感:敬畏生命,敬畏职责
2019/11/12 职场文书