使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python lambda和Python def区别分析
Nov 30 Python
详解Golang 与python中的字符串反转
Jul 21 Python
TensorFlow实现Softmax回归模型
Mar 09 Python
Python装饰器知识点补充
May 28 Python
python+ffmpeg批量去视频开头的方法
Jan 09 Python
Python多叉树的构造及取出节点数据(treelib)的方法
Aug 09 Python
python从zip中删除指定后缀文件(推荐)
Dec 05 Python
Python进阶之迭代器与迭代器切片教程
Jan 29 Python
Python使用monkey.patch_all()解决协程阻塞问题
Apr 15 Python
Python读取JSON数据操作实例解析
May 18 Python
python安装和pycharm环境搭建设置方法
May 27 Python
python中@contextmanager实例用法
Feb 07 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
全国FM电台频率大全 - 31 新疆维吾尔族自治区
2020/03/11 无线电
用Zend Studio+PHPnow+Zend Debugger搭建PHP服务器调试环境步骤
2014/01/19 PHP
PHP按行读取、处理较大CSV文件的代码实例
2014/04/09 PHP
php强制文件下载而非在浏览器打开的自定义函数分享
2014/05/08 PHP
PHP中file_exists()判断中文文件名无效的解决方法
2014/11/12 PHP
php实现utf-8转unicode函数分享
2015/01/06 PHP
PHP+redis实现添加处理投票的方法
2015/11/14 PHP
PHP基于rabbitmq操作类的生产者和消费者功能示例
2018/06/16 PHP
jquery实现简单的拖拽效果实例兼容所有主流浏览器(优化篇)
2013/06/28 Javascript
在JavaScript中重写jQuery对象的方法实例教程
2014/08/25 Javascript
jQuery实现宽屏图片轮播实例教程
2015/11/24 Javascript
javascript的replace方法结合正则使用实例总结
2016/06/16 Javascript
js 判断各种数据类型的简单方法(推荐)
2016/08/29 Javascript
AngularJS动态菜单操作指令
2017/04/25 Javascript
javascript编写简易计算器
2017/05/06 Javascript
使用puppeteer破解极验的滑动验证码
2018/02/24 Javascript
微信JSSDK实现打开摄像头拍照再将相片保存到服务器
2019/11/15 Javascript
VueQuillEditor富文本上传图片(非base64)
2020/06/03 Javascript
python 字典(dict)按键和值排序
2016/06/28 Python
python实现字典(dict)和字符串(string)的相互转换方法
2017/03/01 Python
python中文乱码不着急,先看懂字节和字符
2017/12/20 Python
Python比较2个时间大小的实现方法
2018/04/10 Python
解决Python安装后pip不能用的问题
2018/06/12 Python
Flask Web开发入门之文件上传(八)
2018/08/17 Python
python实现两个dict合并与计算操作示例
2019/07/01 Python
对Tensorflow中tensorboard日志的生成与显示详解
2020/02/04 Python
Python3+Selenium+Chrome实现自动填写WPS表单
2020/02/12 Python
CSS3实现类似翻书效果的过渡动画的示例代码
2019/09/06 HTML / CSS
CSS3教程:边框属性border的极致应用
2009/04/02 HTML / CSS
副厂长岗位职责
2014/02/02 职场文书
国际贸易专业个人求职信格式
2014/02/02 职场文书
董事长助理工作职责
2014/06/08 职场文书
乡党委干部党的群众路线教育实践活动个人对照检查材料思想汇报
2014/10/01 职场文书
2016春季田径运动会广播稿
2015/12/21 职场文书
2016年“我们的节日·清明节”活动总结
2016/04/01 职场文书
Docker容器harbor私有仓库部署和管理
2022/08/05 Servers