使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python装饰器用法实例总结
Feb 07 Python
从运行效率与开发效率比较Python和C++
Dec 14 Python
把pandas转换int型为str型的方法
Jan 29 Python
Django框架基础模板标签与filter使用方法详解
Jul 23 Python
解决Django Static内容不能加载显示的问题
Jul 28 Python
python自定义时钟类、定时任务类
Feb 22 Python
浅谈django2.0 ForeignKey参数的变化
Aug 06 Python
MNIST数据集转化为二维图片的实现示例
Jan 10 Python
pycharm 激活码及使用方式的详细教程
May 12 Python
基于Python实现下载网易音乐代码实例
Aug 10 Python
python3中数组逆序输出方法
Dec 01 Python
使用Python下载抖音各大V视频的思路详解
Feb 06 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
全国FM电台频率大全 - 16 河南省
2020/03/11 无线电
无数据库的详细域名查询程序PHP版(4)
2006/10/09 PHP
剖析 PHP 中的输出缓冲
2006/12/21 PHP
yii实现图片上传及缩略图生成的方法
2014/12/04 PHP
基于php实现随机合并数组并排序(原排序)
2015/11/26 PHP
php图片上传类 附调用方法
2016/05/15 PHP
浅谈ThinkPHP5.0版本和ThinkPHP3.2版本的区别
2017/06/17 PHP
JavaScript语言中的Literal Syntax特性分析
2007/03/08 Javascript
Nodejs使用mysql模块之获得更新和删除影响的行数的方法
2014/03/18 NodeJs
JavaScript DOM基础
2015/04/13 Javascript
ECMAScript6块级作用域及新变量声明(let)
2015/06/12 Javascript
详解JavaScript编程中的数组结构
2015/10/24 Javascript
解决JavaScript数字精度丢失问题的方法
2015/12/03 Javascript
JavaScript事件代理和委托详解
2016/04/08 Javascript
easyui导出excel无法弹出下载框的快速解决方法
2016/11/10 Javascript
通过Ajax使用FormData对象无刷新上传文件方法
2016/12/08 Javascript
jQuery移除或禁用html元素点击事件常用方法小结
2017/02/10 Javascript
JavaScript中的遍历详解(多种遍历)
2017/04/07 Javascript
Nodejs 和Session 原理及实战技巧小结
2017/08/25 NodeJs
vue 组件中slot插口的具体用法
2018/04/03 Javascript
JavaScript实现图片懒加载的方法分析
2018/07/05 Javascript
微信小程序实现点击图片旋转180度并且弹出下拉列表
2018/11/27 Javascript
JS+DIV实现拖动效果
2020/02/11 Javascript
python创建一个最简单http webserver服务器的方法
2015/05/08 Python
Python中datetime常用时间处理方法
2015/06/15 Python
Python Flask框架模板操作实例分析
2019/05/03 Python
如何运行.ipynb文件的图文讲解
2019/06/27 Python
使用python socket分发大文件的实现方法
2019/07/08 Python
简单介绍一下pyinstaller打包以及安全性的实现
2020/06/02 Python
Python开发.exe小工具的详细步骤
2021/01/27 Python
SmartBuyGlasses台湾:名牌眼镜,名牌太阳眼镜及隐形眼镜
2017/01/04 全球购物
3个CCIE对一个工程师的面试题
2012/05/06 面试题
客服实习的个人自我鉴定
2013/10/20 职场文书
公司人力资源的自我评价
2014/01/02 职场文书
会计的岗位职责
2014/03/15 职场文书
中班教师个人总结
2015/02/05 职场文书