使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现完整的事务操作示例
Jun 20 Python
python登录并爬取淘宝信息代码示例
Dec 09 Python
查看django版本的方法分享
May 14 Python
Python面向对象之类的封装操作示例
Jun 08 Python
Python队列RabbitMQ 使用方法实例记录
Aug 05 Python
Python3实现配置文件差异对比脚本
Nov 18 Python
Python Celery多队列配置代码实例
Nov 22 Python
python 初始化一个定长的数组实例
Dec 02 Python
Django配置文件代码说明
Dec 04 Python
Python将二维列表list的数据输出(TXT,Excel)
Apr 23 Python
增大python字体的方法步骤
Jul 05 Python
PyQt5-QDateEdit的简单使用操作
Jul 12 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
php类中的各种拦截器用法分析
2014/11/03 PHP
php curl登陆qq后获取用户信息时证书错误
2015/02/03 PHP
Laravel5.5新特性之友好报错以及展示详解
2017/08/13 PHP
TP5框架实现自定义分页样式的方法示例
2020/04/05 PHP
解放web程序员的输入验证
2006/10/06 Javascript
基于JQuery的密码强度验证代码
2010/03/01 Javascript
javascript中的prototype属性使用说明(函数功能扩展)
2010/08/16 Javascript
通过JS自动隐藏手机浏览器的地址栏实现原理与代码
2013/01/02 Javascript
ie与ff下的event事件使用介绍
2013/11/25 Javascript
jquery插件之定时查询待处理任务数量
2014/05/01 Javascript
js焦点文字滚动效果代码分享
2015/08/25 Javascript
AngularJS基础 ng-hide 指令用法及示例代码
2016/08/01 Javascript
微信小程序 WXML、WXSS 和JS介绍及详解
2016/10/08 Javascript
canvas绘制七巧板
2017/02/03 Javascript
canvas实现图像截取功能
2017/02/06 Javascript
vue时间格式化实例代码
2017/06/13 Javascript
浅谈MUI框架中加载外部网页或服务器数据的方法
2018/01/31 Javascript
深入浅析Vue.js 中的 v-for 列表渲染指令
2018/11/19 Javascript
详解JSON.stringify()的5个秘密特性
2020/05/26 Javascript
JS前后端实现身份证号验证代码解析
2020/07/23 Javascript
对DataFrame数据中的重复行,利用groupby累加合并的方法详解
2019/01/30 Python
Pandas之Fillna填充缺失数据的方法
2019/06/25 Python
Python 解决相对路径问题:"No such file or directory"
2020/06/05 Python
基于python实现简单网页服务器代码实例
2020/09/14 Python
英国网上自行车商店:Tredz Bikes
2019/10/29 全球购物
美团网旗下网上订餐平台:美团外卖
2020/03/05 全球购物
幼儿园儿童节活动主持词+串词大全
2014/03/21 职场文书
求职信结尾怎么写
2014/05/26 职场文书
业务员岗位职责范本
2015/04/03 职场文书
2015年学校减负工作总结
2015/05/19 职场文书
2015年信息宣传工作总结
2015/05/26 职场文书
单位工资证明范本
2015/06/12 职场文书
tensorflow+k-means聚类简单实现猫狗图像分类的方法
2021/04/28 Python
JS Canvas接口和动画效果大全
2021/04/29 Javascript
MySQL删除和插入数据很慢的问题解决
2021/06/03 MySQL
SpringBoot2零基础到精通之数据与页面响应
2022/03/22 Java/Android