编程 Python

pandas数据拼接的实现示例

Posted in Python onApril 16, 2020

一前言

pandas数据拼接有可能会用到，比如出现重复数据，需要合并两份数据的交集，并集就是个不错的选择，知识追寻者本着技多不压身的态度蛮学习了一下下；

二数据拼接

在进行学习数据转换之前，先学习一些数拼接相关的知识

2.1 join()联结

有关merge操作知识追寻者这边不提及，有空可能后面会专门出一篇相关文章，因为其学习方式根SQL的表联结类似，不是几行能说清楚的知识点；

join操作能将 2 个DataFrame 合并为一块，前提是DataFrame 之间的列没有重复；

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

data1 = {
  'user' : ['zszxz','craler','rose'],
  'price' : [100, 200, 300],
  'hobby' : ['reading','running','hiking']
}
index1 = ['user1','user2','user3']
frame1 = pd.DataFrame(data1,index1)

data2 = {
  'person' : ['zszxz','craler','rose'],
  'number' : [100, 2000, 3000],
  'activity' : ['swing','riding','climbing']
}
index2 = ['user1','user2','user3']
frame2 = pd.DataFrame(data2,index2)

join = frame1.join(frame2)
print(join)

输出

         user price    hobby person number activity
user1   zszxz    100 reading   zszxz     100     swing
user2 craler    200 running craler    2000    riding
user3    rose    300   hiking    rose    3000 climbing

2.2 concat()拼接

使用 concat() 函数能将2个 Series 拼接为一个，默认按行拼接；

ser1 = pd.Series(['111','222',np.NaN])
ser2 = pd.Series(['333','444',np.NaN])
# 默认按行拼接
print(pd.concat([ser1, ser2]))

如果按列拼接则 axis = 1

ser1 = pd.Series(['111','222',np.NaN])
ser2 = pd.Series(['333','444',np.NaN])
# 按列拼接
print(pd.concat([ser1, ser2],axis=1))

输出

0 1
0 111 333
1 222 444
2 NaN NaN

更近一步，指定key 参数输出的数据格式就和 DataFrame 一样

ser1 = pd.Series(['111','222',np.NaN])
ser2 = pd.Series(['333','444',np.NaN])
# 按列拼接
data = pd.concat([ser1, ser2],axis=1, keys=['zszxz', 'rzxx'])
print(data)

输出

zszxz rzxx
0   111 333
1   222 444
2   NaN NaN

注： DataFrame 的 concat 操作和 Series 类似；

2.3 combine_first()组合

索引重复时就可以使用combine_first进行拼接

ser1 = pd.Series(['111','222',np.NaN],index=[1,2,3])
ser2 = pd.Series(['333','444',np.NaN,'555'],index=[1,2,3,4])
data = ser1.combine_first(ser2)
print(data)

输出

1    111
2    222
3    NaN
4    555
dtype: object

将Series 位置互换一下，可以看见基准将以 ser2为准；

ser1 = pd.Series(['111','222',np.NaN],index=[1,2,3])
ser2 = pd.Series(['333','444',np.NaN,'555'],index=[1,2,3,4])
data = ser2.combine_first(ser1)
print(data)

输出

1    333
2    444
3    NaN
4    555
dtype: object

2.4 轴转换

准备的数据

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

data = {
  'user' : ['zszxz','craler','rose'],
  'price' : [100, 200, 300],
  'hobby' : ['reading','running','hiking']
}
index = ['user1','user2','user3']
frame = pd.DataFrame(data,index)
print(frame)

输出

         user price    hobby
user1   zszxz    100 reading
user2 craler    200 running
user3    rose    300   hiking

stack() 将列转为行；

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

data = {
  'user' : ['zszxz','craler','rose'],
  'price' : [100, 200, 300],
  'hobby' : ['reading','running','hiking']
}
index = ['user1','user2','user3']
frame = pd.DataFrame(data,index)
print(frame.stack())

输出

user1 user       zszxz
       price        100
       hobby    reading
user2 user      craler
       price        200
       hobby    running
user3 user        rose
       price        300
       hobby     hiking
dtype: object

使用 unstack()将数据结构重新返回

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

data = {
  'user' : ['zszxz','craler','rose'],
  'price' : [100, 200, 300],
  'hobby' : ['reading','running','hiking']
}
index = ['user1','user2','user3']
frame = pd.DataFrame(data,index)
sta = frame.stack()
print(sta.unstack())

输出

         user price    hobby
user1   zszxz   100 reading
user2 craler   200 running
user3    rose   300   hiking

到此这篇关于pandas数据拼接的实现示例的文章就介绍到这了,更多相关pandas数据拼接内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

pandas数据拼接的实现示例

- Author -

知识追寻者

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python创建日历实例

Aug 21 Python

Python自动化构建工具scons使用入门笔记

Mar 10 Python

Python中的localtime()方法使用详解

May 22 Python

python逐行读写txt文件的实例讲解

Apr 03 Python

解决pyqt5中QToolButton无法使用的问题

Jun 21 Python

Python使用sklearn实现的各种回归算法示例

Jul 04 Python

PyQt Qt Designer工具的布局管理详解

Aug 07 Python

关于python字符串方法分类详解

Aug 20 Python

在notepad++中实现直接运行python代码

Dec 18 Python

Python基于smtplib协议实现发送邮件

Jun 03 Python

pycharm中使用request和Pytest进行接口测试的方法

Jul 31 Python

python用海龟绘图写贪吃蛇游戏

Jun 18 Python

python 生成任意形状的凸包图代码

Apr 16 #Python

Python telnet登陆功能实现代码

Apr 16 #Python

基于python 凸包问题的解决

Apr 16 #Python

python实现交并比IOU教程

Apr 16 #Python

python 弧度与角度互转实例

Apr 15 #Python

使用Python三角函数公式计算三角形的夹角案例

Apr 15 #Python

Python selenium自动化测试模型图解

Apr 15 #Python

You might like

PHP 数组实例说明

2008/08/18 PHP

TP(thinkPHP)框架多层控制器和多级控制器的使用示例

2018/06/13 PHP

屏蔽鼠标右键、Ctrl+n、shift+F10、F5刷新、退格键的javascript代码

2007/04/01 Javascript

兼容FireFox 的 js 日历支持时间的获取

2009/03/04 Javascript

JS图片浏览组件PhotoLook的公开属性方法介绍和进阶实例代码

2010/11/09 Javascript

基于jquery的无刷新分页技术

2011/06/11 Javascript

ASP.NET jQuery 实例16 通过控件CustomValidator验证RadioButtonList

2012/02/03 Javascript

浅谈 jQuery 事件源码定位问题

2014/06/18 Javascript

js 判断图片是否加载完以及实现图片的预下载

2014/08/14 Javascript

jQuery实现tab标签自动切换的方法

2015/02/28 Javascript

PHP+jQuery实现随意拖动层并即时保存拖动位置

2015/04/30 Javascript

Jquery全选与反选点击执行一次的解决方案

2015/08/14 Javascript

Jquery常用的方法汇总

2015/09/01 Javascript

JS实现获取来自百度,Google,soso,sogou关键词的方法

2016/12/21 Javascript

ligerUI---ListBox(列表框可移动的实例)

2017/11/28 Javascript

react学习笔记之state以及setState的使用

2017/12/07 Javascript

详解JavaScript中操作符和表达式

2018/09/12 Javascript

解决layui的form里的元素进行动态生成,验证失效的问题

2019/09/14 Javascript

mpvue 页面预加载新增preLoad生命周期的两种方式

2019/10/17 Javascript

通过实例了解Javascript柯里化流程

2020/03/03 Javascript

Vue+Element自定义纵向表格表头教程

2020/10/26 Javascript

在antd4.0中Form使用initialValue操作

2020/11/02 Javascript

vue-axios同时请求多个接口等所有接口全部加载完成再处理操作

2020/11/09 Javascript

让python在hadoop上跑起来

2016/01/27 Python

Python字符串内置函数功能与用法总结

2019/04/16 Python

PyQt5下拉式复选框QComboCheckBox的实例

2019/06/25 Python

Python字典的概念及常见应用实例详解

2019/10/30 Python

Django websocket原理及功能实现代码

2020/11/14 Python

高级Java程序员面试要点

2013/08/02 面试题

开办大学饮食联盟创业计划书

2014/01/29 职场文书

大学生党员批评与自我批评

2014/09/28 职场文书

物流仓管员岗位职责

2015/04/01 职场文书

2015年小学英语教师工作总结

2015/05/12 职场文书

回复函范文

2015/07/14 职场文书

党员干部学习心得体会

2016/01/23 职场文书

Java 通过手写分布式雪花SnowFlake生成ID方法详解

2022/04/07 Java/Android