使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
有关wxpython pyqt内存占用问题分析
Jun 09 Python
Python算法应用实战之栈详解
Feb 04 Python
python使用opencv进行人脸识别
Apr 07 Python
Python实现文件内容批量追加的方法示例
Aug 29 Python
异步任务队列Celery在Django中的使用方法
Jun 07 Python
Python实现的knn算法示例
Jun 14 Python
Python实现的NN神经网络算法完整示例
Jun 19 Python
python整合ffmpeg实现视频文件的批量转换
May 31 Python
tornado+celery的简单使用详解
Dec 21 Python
TensorFlow实现打印每一层的输出
Jan 21 Python
如何卸载python插件
Jul 08 Python
OpenCV图像变换之傅里叶变换的一些应用
Jul 26 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
当年上海收录机产品生产,进口和价格情况
2021/03/04 无线电
PHP 文本文章分页代码 按标记或长度(不涉及数据库)
2012/06/07 PHP
美图秀秀web开放平台--PHP流式上传和表单上传示例分享
2014/06/22 PHP
php实现改变图片直接打开为下载的方法
2015/04/14 PHP
PHP SPL标准库之SplFixedArray使用实例
2015/05/12 PHP
详解thinkphp中的volist标签
2018/01/15 PHP
javascript Array.remove() 数组删除
2009/08/06 Javascript
推荐20家国外的脚本下载网站
2011/04/28 Javascript
jQuery编辑器KindEditor4.1.4代码高亮显示设置教程
2013/03/01 Javascript
js导出格式化的excel 实例方法
2013/07/17 Javascript
Mac地址验证的javascript代码
2013/11/09 Javascript
使用vux实现上拉刷新功能遇到的坑
2018/02/08 Javascript
浅谈webpack 自动刷新与解析
2018/04/09 Javascript
微信小程序 scroll-view 实现锚点跳转功能
2019/12/12 Javascript
为react组件库添加typescript类型提示的方法
2020/06/15 Javascript
浅谈JS for循环中使用break和continue的区别
2020/07/21 Javascript
如何在面试中手写出javascript节流和防抖函数
2020/10/22 Javascript
JavaScript实现跟随鼠标移动的盒子
2021/01/28 Javascript
[02:51]DOTA2 Supermajor小组分组对阵抽签仪式
2018/06/01 DOTA
Python Web开发模板引擎优缺点总结
2014/05/06 Python
python利用urllib和urllib2访问http的GET/POST详解
2017/09/27 Python
解决Python的str强转int时遇到的问题
2018/04/09 Python
python中 _、__、__xx__()区别及使用场景
2020/06/30 Python
Python模拟键盘输入自动登录TGP
2020/11/27 Python
css3选择器基本介绍
2014/12/15 HTML / CSS
介绍下Java的输入输出流
2014/01/22 面试题
请写出一段Python代码实现删除一个list里面的重复元素
2015/12/29 面试题
会计岗位职责
2013/11/08 职场文书
心理学专业大学生职业生涯规划范文
2014/02/19 职场文书
领导四风问题整改措施思想汇报
2014/10/13 职场文书
思想作风建设心得体会
2014/10/22 职场文书
2016年党校科级干部培训班学习心得体会
2016/01/06 职场文书
导游词之潮音寺
2019/09/26 职场文书
PHP对接阿里云虚拟号的实现(号码隐私保护)
2021/04/06 PHP
python3实现常见的排序算法(示例代码)
2021/07/04 Python
Redis分布式锁Redlock的实现
2021/08/07 Redis