使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现的解析crontab配置文件代码
Jun 30 Python
Python中操作符重载用法分析
Apr 29 Python
详解如何利用Cython为Python代码加速
Jan 27 Python
Python判断字符串是否为字母或者数字(浮点数)的多种方法
Aug 03 Python
ipython和python区别详解
Jun 26 Python
Django model update的多种用法介绍
Mar 28 Python
python通过链接抓取网站详解
Nov 20 Python
Python3-异步进程回调函数(callback())介绍
May 02 Python
基于Python词云分析政府工作报告关键词
Jun 02 Python
基于Python快速处理PDF表格数据
Jun 03 Python
python环境搭建和pycharm的安装配置及汉化详细教程(零基础小白版)
Aug 19 Python
python3从网络摄像机解析mjpeg http流的示例
Nov 13 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
PHP连接操作access数据库实例
2015/03/30 PHP
PHP 爬取网页的主要方法
2018/07/13 PHP
javascript实现焦点滚动图效果 具体方法
2013/06/24 Javascript
jquery操作下拉列表、文本框、复选框、单选框集合(收藏)
2014/01/08 Javascript
取得元素的左和上偏移量的方法
2014/09/17 Javascript
node.js中的http.createServer方法使用说明
2014/12/14 Javascript
Node.js + Redis Sorted Set实现任务队列
2016/09/19 Javascript
JS获取IE版本号与HTML设置IE文档模式的方法
2016/10/09 Javascript
Bootstrap基本组件学习笔记之进度条(15)
2016/12/08 Javascript
Html5+jQuery+CSS制作相册小记录
2016/12/30 Javascript
Iscrool下拉刷新功能实现方法(推荐)
2017/06/26 Javascript
[js高手之路]单例模式实现模态框的示例
2017/09/01 Javascript
微信小程序 页面滑动事件的实例详解
2017/10/12 Javascript
Vue指令v-for遍历输出JavaScript数组及json对象的常见方式小结
2019/02/11 Javascript
微信小程序设置滚动条过程详解
2019/07/25 Javascript
element-ui 实现响应式导航栏的示例代码
2020/05/08 Javascript
使用Vue-cli 中为单独页面设置背景图片铺满全屏
2020/07/17 Javascript
vue中提示$index is not defined错误的解决方式
2020/09/02 Javascript
Python selenium 三种等待方式详解(必会)
2016/09/15 Python
利用Python查看目录中的文件示例详解
2017/08/28 Python
python reduce 函数使用详解
2017/12/05 Python
pandas将numpy数组写入到csv的实例
2018/07/04 Python
pandas 快速处理 date_time 日期格式方法
2018/11/12 Python
python交易记录链的实现过程详解
2019/07/03 Python
利用python进行文件操作
2020/12/04 Python
详解CSS3选择器:nth-child和:nth-of-type之间的差异
2017/09/18 HTML / CSS
全球500多个机场的接送服务:Suntransfers
2019/06/03 全球购物
现金出纳岗位职责
2014/03/15 职场文书
感恩教师节演讲稿
2014/09/03 职场文书
纺织工程专业推荐信
2014/09/08 职场文书
小学工作总结2015
2015/05/04 职场文书
2016党员干部政治学习心得体会
2016/01/23 职场文书
巾帼建功标兵先进事迹材料
2016/02/29 职场文书
python编程学习使用管道Pipe编写优化代码
2021/11/20 Python
【海涛解说】史上最给力比赛,挑战DOTA极限
2022/04/01 DOTA
聊聊CSS粘性定位sticky案例解析
2022/06/01 HTML / CSS