使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
零基础写python爬虫之爬虫的定义及URL构成
Nov 04 Python
给Python入门者的一些编程建议
Jun 15 Python
Python常用库推荐
Dec 04 Python
python操作 hbase 数据的方法
Dec 18 Python
matplotlib绘制符合论文要求的图片实例(必看篇)
Jun 02 Python
python入门前的第一课 python怎样入门
Mar 06 Python
react+django清除浏览器缓存的几种方法小结
Jul 17 Python
python框架django项目部署相关知识详解
Nov 04 Python
在django admin详情表单显示中添加自定义控件的实现
Mar 11 Python
django 读取图片到页面实例
Mar 27 Python
tensorflow基于CNN实战mnist手写识别(小白必看)
Jul 20 Python
python异步的ASGI与Fast Api实现
Jul 16 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
PHP 函数语法介绍一
2009/06/14 PHP
深入mysql_fetch_row()与mysql_fetch_array()的区别详解
2013/06/05 PHP
php获取随机数组列表的方法
2014/11/13 PHP
php mysql_list_dbs()函数用法示例
2017/03/29 PHP
laravel框架之数据库查出来的对象实现转化为数组
2019/10/23 PHP
基于jquery的获取浏览器窗口大小的代码
2011/03/28 Javascript
Javascript中找到子元素在父元素内相对位置的代码
2012/07/21 Javascript
jquery Mobile入门—外部链接切换示例代码
2013/01/08 Javascript
JS实现的自定义右键菜单实例二则
2015/09/01 Javascript
jQuery进行组件开发完整实例
2015/12/15 Javascript
JavaScript实现的商品抢购倒计时功能示例
2017/04/17 Javascript
JS使用插件cryptojs进行加密解密数据实例
2017/05/11 Javascript
jquery实现垂直手风琴菜单
2020/03/04 jQuery
详解vue之自行实现派发与广播(dispatch与broadcast)
2021/01/19 Vue.js
[04:29]DOTA2亚洲邀请赛小组赛第一日 TOP10精彩集锦
2015/02/01 DOTA
[44:04]OG vs Mineski 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
Python变量作用范围实例分析
2015/07/07 Python
浅谈python中set使用
2016/06/30 Python
在python中安装basemap的教程
2018/09/20 Python
Python 序列化和反序列化库 MarshMallow 的用法实例代码
2020/02/25 Python
Python判断远程服务器上Excel文件是否被人打开的方法
2020/07/13 Python
CSS3 简单又实用的5个属性
2010/03/04 HTML / CSS
HTML5等待加载动画效果
2017/07/27 HTML / CSS
HTML5的hidden属性兼容老浏览器的方法
2014/04/23 HTML / CSS
goodhealth官方海外旗舰店:新西兰国民营养师
2017/12/15 全球购物
JAVA程序设计笔试题面试题一套
2015/07/28 面试题
会计专业自我鉴定范文
2013/10/06 职场文书
网吧最新创业计划书范文
2014/03/27 职场文书
文明工地标语
2014/06/16 职场文书
2014年企业党建工作总结
2014/12/18 职场文书
2014年学生管理工作总结
2014/12/20 职场文书
2015年药店店长工作总结
2015/04/29 职场文书
2016年党校科级干部培训班学习心得体会
2016/01/06 职场文书
小学思品教学反思
2016/02/20 职场文书
签证扫盲贴,41个常见签证知识,需要的拿走
2019/08/09 职场文书
MySQL 亿级数据导入导出及迁移笔记
2021/06/18 MySQL