Pandas DataFrame求差集的示例代码


Posted in Python onDecember 13, 2020

在Pandas中 求差集没有专门的函数。处理办法就是将两个DataFrame追加合并,然后去重。

divident.append(hasThisYearDivident)
noHasThisYearDivident = divident.drop_duplicates(subset='ts_code', keep=False, inplace=True, ignore_index=True)

具体函数用法:

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html#pandas.DataFrame.append

Pandas DataFrame求差集的示例代码

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates

补充示例:Pandas中两个DataFrame的差集

在pandas中,两个DataFrame的差集并没有直接的库内置方法,现在我们希望有一种方法,就像python中set内置的求差集一样,来找到两个DataFrame的差集。

>>> a=set((1,2,3))
>>> a
{1, 2, 3}
>>> b=set((2,3,4))
>>> b
{2, 3, 4}
>>> a-b
{1}

上面代码片段是对set的内置求差集方法的回顾,现在我们希望能有类似的方法来找两个DataFrame的差集。

解决思路是这样的:

对于有同样Index的a,b两个DataFrame,如果现在要求a对b的差集,那么可以(1)连续两次扩充a,使用append方法(2)然后使用drop_duplicates方法对a进行去重,并且参数keep=False。原理很简单,也很巧妙,连续扩充2次a,那么新扩充完后的DataFrame中来自b的row肯定是重复的,去重时候,b全部被删除,与此同时,a中跟b重复的row也会顺带着被删除。

代码实现:

>>> import pandas as pd
>>> data_a={'state':[1,1,2],'pop':['a','b','c']}
>>> data_b={'state':[1,2,3],'pop':['b','c','d']}
>>> a=pd.DataFrame(data_a)
>>> b=pd.DataFrame(data_b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
>>> b
  state pop
0   1  b
1   2  c
2   3  d
>>> a=a.append(b)
>>> a=a.append(b)
>>> a
  state pop
0   1  a
1   1  b
2   2  c
0   1  b
1   2  c
2   3  d
0   1  b
1   2  c
2   3  d
>>> a.drop_duplicates(subset=['state','pop'],keep=False)
  state pop
0   1  a

到此这篇关于Pandas DataFrame求差集的示例代码的文章就介绍到这了,更多相关Pandas DataFrame求差集内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python基于回溯法子集树模板解决m着色问题示例
Sep 07 Python
python编程测试电脑开启最大线程数实例代码
Feb 09 Python
python爬取哈尔滨天气信息
Jul 14 Python
python并发和异步编程实例
Nov 15 Python
深入浅析Python2.x和3.x版本的主要区别
Nov 30 Python
Python逐行读取文件中内容的简单方法
Feb 26 Python
python按修改时间顺序排列文件的实例代码
Jul 25 Python
Python爬虫运用正则表达式的方法和优缺点
Aug 25 Python
调用其他python脚本文件里面的类和方法过程解析
Nov 15 Python
Python如何使用BeautifulSoup爬取网页信息
Nov 26 Python
centos7中安装python3.6.4的教程
Dec 11 Python
使用python将HTML转换为PDF pdfkit包(wkhtmltopdf) 的使用方法
Apr 21 Python
pandas实现导出数据的四种方式
Dec 13 #Python
python绘图pyecharts+pandas的使用详解
Dec 13 #Python
Pandas对每个分组应用apply函数的实现
Dec 13 #Python
python安装及变量名介绍详解
Dec 12 #Python
在python中对于bool布尔值的取反操作
Dec 11 #Python
python 基于opencv 绘制图像轮廓
Dec 11 #Python
python通过cython加密代码
Dec 11 #Python
You might like
将数字格式的计算结果转为汉字格式
2006/10/09 PHP
html中select语句读取mysql表中内容
2006/10/09 PHP
木翼下载系统中说明的PHP安全配置方法
2007/06/16 PHP
如何设置mysql允许外网访问
2013/06/04 PHP
PHP json_decode函数详细解析
2014/02/17 PHP
php实现数字补零的方法总结
2018/09/12 PHP
jQuery生成asp.net服务器控件的代码
2010/02/04 Javascript
jquery异步调用页面后台方法‏(asp.net)
2011/03/01 Javascript
iframe父页面获取子页面参数的方法
2014/02/21 Javascript
nodejs下打包模块archiver详解
2014/12/03 NodeJs
jQuery中DOM树操作之使用反向插入方法实例分析
2015/01/23 Javascript
js限制input标签中只能输入中文
2015/06/26 Javascript
JS模拟实现Select效果代码
2015/09/24 Javascript
利用浮层使select不可选的实现方法
2016/12/03 Javascript
手把手教你 CKEDITOR 4 扩展插件制作
2019/06/18 Javascript
vue实现日历备忘录功能
2020/09/24 Javascript
解决vue打包后刷新页面报错:Unexpected token
2019/08/27 Javascript
[02:10]DOTA2亚洲邀请赛 EG战队出场宣传片
2015/02/07 DOTA
[01:04:48]VGJ.S vs TNC Supermajor 败者组 BO3 第一场 6.6
2018/06/07 DOTA
Python数据结构与算法之二叉树结构定义与遍历方法详解
2017/12/12 Python
Django migrations 默认目录修改的方法教程
2018/09/28 Python
selenium获取当前页面的url、源码、title的方法
2019/06/12 Python
python使用pandas处理excel文件转为csv文件的方法示例
2019/07/18 Python
Python StringIO如何在内存中读写str
2020/01/07 Python
tensorboard显示空白的解决
2020/02/15 Python
python 安装移动复制第三方库操作
2020/07/13 Python
python爬虫调度器用法及实例代码
2020/11/30 Python
css3 给背景设置渐变色的方法
2019/09/12 HTML / CSS
加拿大在线隐形眼镜和眼镜店:VisionPros
2019/10/06 全球购物
MIRTA官网:手工包,100%意大利制造
2020/02/11 全球购物
Prototype是怎么扩展DOM的
2014/10/01 面试题
日语专业个人求职信范文
2014/02/02 职场文书
2014年施工员工作总结
2014/11/18 职场文书
党校学习党性分析材料
2014/12/19 职场文书
先进党支部事迹材料
2014/12/24 职场文书
golang interface判断为空nil的实现代码
2021/04/24 Golang