Pandas DataFrame求差集的示例代码


Posted in Python onDecember 13, 2020

在Pandas中 求差集没有专门的函数。处理办法就是将两个DataFrame追加合并,然后去重。

divident.append(hasThisYearDivident)
noHasThisYearDivident = divident.drop_duplicates(subset='ts_code', keep=False, inplace=True, ignore_index=True)

具体函数用法:

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html#pandas.DataFrame.append

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates

补充示例:Pandas中两个DataFrame的差集

在pandas中,两个DataFrame的差集并没有直接的库内置方法,现在我们希望有一种方法,就像python中set内置的求差集一样,来找到两个DataFrame的差集。

>>> a=set((1,2,3))
>>> a
{1, 2, 3}
>>> b=set((2,3,4))
>>> b
{2, 3, 4}
>>> a-b
{1}

上面代码片段是对set的内置求差集方法的回顾,现在我们希望能有类似的方法来找两个DataFrame的差集。

解决思路是这样的:

对于有同样Index的a,b两个DataFrame,如果现在要求a对b的差集,那么可以(1)连续两次扩充a,使用append方法(2)然后使用drop_duplicates方法对a进行去重,并且参数keep=False。原理很简单,也很巧妙,连续扩充2次a,那么新扩充完后的DataFrame中来自b的row肯定是重复的,去重时候,b全部被删除,与此同时,a中跟b重复的row也会顺带着被删除。

代码实现:

>>> import pandas as pd
>>> data_a={'state':[1,1,2],'pop':['a','b','c']}
>>> data_b={'state':[1,2,3],'pop':['b','c','d']}
>>> a=pd.DataFrame(data_a)
>>> b=pd.DataFrame(data_b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
>>> b
  state pop
0   1  b
1   2  c
2   3  d
>>> a=a.append(b)
>>> a=a.append(b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
0   1  b
1   2  c
2   3  d
0   1  b
1   2  c
2   3  d
>>> a.drop_duplicates(subset=['state','pop'],keep=False)
  state pop
0   1  a

到此这篇关于Pandas DataFrame求差集的示例代码的文章就介绍到这了,更多相关Pandas DataFrame求差集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python动态参数用法实例分析
May 25 Python
Python中在for循环中嵌套使用if和else语句的技巧
Jun 20 Python
python 容器总结整理
Apr 04 Python
python实现周期方波信号频谱图
Jul 21 Python
pyhton中__pycache__文件夹的产生与作用详解
Nov 24 Python
python分布式计算dispy的使用详解
Dec 22 Python
Python运行DLL文件的方法
Jan 17 Python
Python输出指定字符串的方法
Feb 06 Python
Python语法垃圾回收机制原理解析
Mar 25 Python
2021年值得向Python开发者推荐的VS Code扩展插件
Jan 25 Python
pycharm 如何查看某一函数源码的快捷键
May 12 Python
Python中基础数据类型 set集合知识点总结
Aug 02 Python
pandas实现导出数据的四种方式
Dec 13 #Python
python绘图pyecharts+pandas的使用详解
Dec 13 #Python
Pandas对每个分组应用apply函数的实现
Dec 13 #Python
python安装及变量名介绍详解
Dec 12 #Python
在python中对于bool布尔值的取反操作
Dec 11 #Python
python 基于opencv 绘制图像轮廓
Dec 11 #Python
python通过cython加密代码
Dec 11 #Python
You might like
php使用指定编码导出mysql数据到csv文件的方法
2015/03/31 PHP
laravel 出现command not found问题的解决方案
2019/10/23 PHP
捕获键盘事件(且兼容各浏览器)
2013/07/03 Javascript
js中自定义方法实现停留几秒sleep
2014/07/11 Javascript
jQuery实现行文字链接提示效果的方法
2015/03/10 Javascript
javascript中createElement的两种创建方式
2015/05/14 Javascript
jQuery 获取屏幕高度、宽度的简单实现案例
2016/05/17 Javascript
JavaScript数据操作_浅谈原始值和引用值的操作本质
2016/08/23 Javascript
基于Vue、Vuex、Vue-router实现的购物商城(原生切换动画)效果
2018/01/09 Javascript
jQuery实现基本淡入淡出效果的方法详解
2018/09/05 jQuery
如何通过Proxy实现JSBridge模块化封装
2020/10/22 Javascript
使用python实现扫描端口示例
2014/03/29 Python
Python 不同对象比较大小示例探讨
2014/08/21 Python
python与C、C++混编的四种方式(小结)
2019/07/15 Python
Python爬取视频(其实是一篇福利)过程解析
2019/08/01 Python
wxpython绘制圆角窗体
2019/11/18 Python
浅谈Python3实现两个矩形的交并比(IoU)
2020/01/18 Python
如何实现在jupyter notebook中播放视频(不停地展示图片)
2020/04/23 Python
Python+Dlib+Opencv实现人脸采集并表情判别功能的代码
2020/07/01 Python
使用PyWeChatSpy自动回复微信拍一拍功能的实现代码
2020/07/02 Python
Python字典fromkeys()方法使用代码实例
2020/07/20 Python
Visual Studio code 配置Python开发环境
2020/09/11 Python
CSS3 Flexbox中flex-shrink属性的用法示例介绍
2013/12/30 HTML / CSS
New Era英国官网:美国棒球帽品牌
2018/03/21 全球购物
学生实习推荐信范文
2013/11/26 职场文书
2014升学宴答谢词
2014/01/26 职场文书
2014年四风问题个人对照自查剖析材料
2014/09/15 职场文书
基层党组织整改方案
2014/10/25 职场文书
2015年仓库工作总结
2015/04/09 职场文书
资料员岗位职责范本
2015/04/13 职场文书
六一晚会主持词开场白
2015/05/28 职场文书
2016春季运动会通讯稿
2015/07/18 职场文书
党员反邪教心得体会
2016/01/15 职场文书
解决Python字典查找报Keyerror的问题
2021/05/26 Python
分享一些Java的常用工具
2021/06/11 Java/Android
Java中生成微信小程序太阳码的实现方案
2022/06/01 Java/Android