使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 算法 排序实现快速排序
Jun 05 Python
python使用pyhook监控键盘并实现切换歌曲的功能
Jul 18 Python
python获取当前运行函数名称的方法实例代码
Apr 06 Python
Python运维开发之psutil库的使用详解
Oct 18 Python
使用Py2Exe for Python3创建自己的exe程序示例
Oct 31 Python
python初学者,用python实现基本的学生管理系统(python3)代码实例
Apr 10 Python
Pythony运维入门之Socket网络编程详解
Apr 15 Python
pyqt5中QThread在使用时出现重复emit的实例
Jun 21 Python
python 队列基本定义与使用方法【初始化、赋值、判断等】
Oct 24 Python
利用Python的turtle库绘制玫瑰教程
Nov 23 Python
通过实例解析Python return运行原理
Mar 04 Python
sklearn中的交叉验证的实现(Cross-Validation)
Feb 22 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
php的ajax框架xajax入门与试用介绍
2010/12/19 PHP
PHP文件读写操作之文件写入代码
2011/01/13 PHP
php中有关合并某一字段键值相同的数组合并的改进
2015/03/10 PHP
php+ajax实现无刷新动态加载数据技术
2015/04/28 PHP
php array_slice 取出数组中的一段序列实例
2016/11/04 PHP
封装的原生javascript弹出层代码
2010/09/24 Javascript
ExtJs使用总结(非常详细)
2012/03/22 Javascript
jquery dialog open后,服务器端控件失效的快速解决方法
2013/12/19 Javascript
JS的数组迭代方法
2015/02/05 Javascript
Javascript的表单验证-提交表单
2016/03/18 Javascript
JS控制层作圆周运动的方法
2016/06/20 Javascript
手机图片预览插件photoswipe.js使用总结
2016/08/25 Javascript
Angular.js中处理页面闪烁的方法详解
2017/03/09 Javascript
原生js FileReader对象实现图片上传本地预览效果
2020/03/27 Javascript
解决Layui 表单提交数据为空的问题
2018/08/15 Javascript
jquery操作select常见方法大全【7种情况】
2019/05/28 jQuery
VUE项目初建和常见问题总结
2019/09/12 Javascript
layui树形菜单动态遍历的例子
2019/09/23 Javascript
在vue中利用v-html按分号将文本换行的例子
2019/11/14 Javascript
Element InfiniteScroll无限滚动的具体使用方法
2020/07/27 Javascript
Python的collections模块中namedtuple结构使用示例
2016/07/07 Python
Python应用03 使用PyQT制作视频播放器实例
2016/12/07 Python
python匹配两个短语之间的字符实例
2018/12/25 Python
Python基础之条件控制操作示例【if语句】
2019/03/23 Python
什么是python的必选参数
2020/06/21 Python
Django生成数据库及添加用户报错解决方案
2020/10/09 Python
世界上获奖最多的手机镜头:Olloclip
2018/03/03 全球购物
美国奢侈品购物平台:Orchard Mile
2018/05/02 全球购物
2014年预备党员学习新党章思想汇报
2014/09/15 职场文书
国际政治学专业推荐信
2014/09/26 职场文书
企业务虚会发言材料
2014/10/20 职场文书
公务员政审个人总结
2015/02/12 职场文书
被告代理词范文
2015/05/25 职场文书
辛德勒的名单观后感
2015/06/03 职场文书
MySQL中的引号和反引号的区别与用法详解
2021/10/24 MySQL
Nginx 反向代理解决跨域问题多种情况分析
2022/01/18 Servers