使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python设置tmpfs来加速项目的教程
Apr 17 Python
编写Python脚本来获取Google搜索结果的示例
May 04 Python
python网络爬虫之如何伪装逃过反爬虫程序的方法
Nov 23 Python
在python中按照特定顺序访问字典的方法详解
Dec 14 Python
将tensorflow模型打包成PB文件及PB文件读取方式
Jan 23 Python
python实现简单颜色识别程序
Feb 19 Python
Python装饰器结合递归原理解析
Jul 02 Python
Python高并发解决方案实现过程详解
Jul 31 Python
pycharm 添加解释器的方法步骤
Aug 31 Python
Python 数据分析之逐块读取文本的实现
Dec 14 Python
如何用Python提取10000份log中的产品信息
Jan 14 Python
Python创建SQL数据库流程逐步讲解
Sep 23 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
destoon复制新模块的方法
2014/06/21 PHP
php switch语句多个值匹配同一代码块应用示例
2014/07/29 PHP
常用PHP数组排序函数归纳
2016/08/08 PHP
php 截取utf-8格式的字符串实例代码
2016/10/30 PHP
PHP基于GD库实现的生成图片缩略图函数示例
2017/07/05 PHP
Laravel中encrypt和decrypt的实现方法
2017/09/24 PHP
使用Zookeeper分布式部署PHP应用程序
2019/03/15 PHP
用js判断用户浏览器是否是XP SP2的IE6
2007/03/08 Javascript
js substr支持中文截取函数代码(中文是双字节)
2013/04/17 Javascript
jquery插件jquery.confirm弹出确认消息
2015/12/22 Javascript
浅析jQuery 遍历函数,javascript中的each遍历
2016/05/25 Javascript
Javascript 严格模式use strict详解
2017/09/16 Javascript
vue element-ui table表格滚动加载方法
2018/03/02 Javascript
Bootstrap实现可折叠分组侧边导航菜单
2018/03/07 Javascript
浅谈Vue路由快照实现思路及其问题
2018/06/07 Javascript
Nodejs异步回调之异常处理实例分析
2018/06/22 NodeJs
微信小程序 弹窗输入组件的实现解析
2019/08/12 Javascript
javascript实现打砖块小游戏(附完整源码)
2020/09/18 Javascript
Python的Django框架可适配的各种数据库介绍
2015/07/15 Python
python字符串连接方法分析
2016/04/12 Python
numpy中实现ndarray数组返回符合特定条件的索引方法
2018/04/17 Python
Python迭代器定义与简单用法分析
2018/04/30 Python
python实现时间o(1)的最小栈的实例代码
2018/07/23 Python
在Pycharm中使用GitHub的方法步骤
2019/06/13 Python
jupyter 导入csv文件方式
2020/04/21 Python
详解python变量与数据类型
2020/08/25 Python
在C#中如何实现多态
2014/07/02 面试题
中国入世承诺
2014/04/01 职场文书
校园环保广播稿(3篇)
2014/09/15 职场文书
运动会跳远广播稿5篇
2014/09/17 职场文书
个人查摆问题自查报告
2014/10/16 职场文书
司考复习计划
2015/01/19 职场文书
爱心捐款感谢信
2015/01/20 职场文书
社区党支部公开承诺书
2015/04/29 职场文书
入党积极分子培养人意见
2015/06/02 职场文书
三八妇女节主持词
2015/07/04 职场文书