Pandas Shift函数的基础入门学习笔记


Posted in Python onNovember 16, 2018

Pandas Shift函数基础

在使用Pandas的过程中,有时会遇到shift函数,今天就一起来彻底学习下。先来看看帮助文档是怎么说的:

>>> import pandas
>>> help(pandas.DataFrame.shift)
Help on function shift in module pandas.core.frame:
 
shift(self, periods=1, freq=None, axis=0)
 Shift index by desired number of periods with an optional time freq
 
 Parameters
 ----------
 periods : int
 Number of periods to move, can be positive or negative
 freq : DateOffset, timedelta, or time rule string, optional
 Increment to use from the tseries module or time rule (e.g. 'EOM').
 See Notes.
 axis : {0 or 'index', 1 or 'columns'}
 
 Notes
 -----
 If freq is specified then the index values are shifted but the data
 is not realigned. That is, use freq if you would like to extend the
 index when shifting and preserve the original data.
 
 Returns
 -------
 shifted : DataFrame

该函数主要的功能就是使数据框中的数据移动,若freq=None时,根据axis的设置,行索引数据保持不变,列索引数据可以在行上上下移动或在列上左右移动;若行索引为时间序列,则可以设置freq参数,根据periods和freq参数值组合,使行索引每次发生periods*freq偏移量滚动,列索引数据不会移动。

参数详解:

  • period:表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这里移动的都是数据,而索引是不移动的,移动之后没有对应值的,就赋值为NaN。
  • freq: DateOffset, timedelta, or time rule string,可选参数,默认值为None,只适用于时间序列,如果这个参数存在,那么会按照参数值移动时间索引,而数据值没有发生变化。
  • axis: {0, 1, ‘index', ‘columns'},表示移动的方向,如果是0或者'index'表示上下移动,如果是1或者'columns',则会左右移动。

先来看一下一些简单的示例:

1、非时间索引下period的设置

假设存在一个DataFrame数据df:

index value1
A 0
B 1
C 2
D 3

如果执行以下代码  df.shift()  就会变成如下:

index value1
A NaN
B 0
C 1
D 2

执行 df.shift(2) 就会得到:

index value1
A NaN
B NaN
C 0
D 1

执行 df.shift(-1) 会得到:

index value1
A 1
B 2
C 3
D NaN

注意,shift移动的是整个数据,如果df有如下多列数据:

AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15

执行 df.shift(2) 的数据为:

AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0

如果只想移动df中的某一列数据,则需要这样操作: df['DD']= df['DD'].shift(1)

执行后的数据为:

AA BB CC DD
a 0 1 2 NaN
b 4 5 6 NaN
c 8 9 10 11
d 12 13 14 15

2、时间索引下freq 参数设置

假设存在如下DataFrame的df:

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =pd.date_range('2012-06-01','2012-06-04'))
AA BB CC DD
2012-06-01 0 1 2 3
2012-06-02 4 5 6 7
2012-06-03 8 9 10 11
2012-06-04 12 13 14 15

执行 df.shift(freq=datetime.timedelta(1))  后:

AA BB CC DD
2012-06-02 0 1 2 3
2012-06-03 4 5 6 7
2012-06-04 8 9 10 11
2012-06-05 12 13 14 15

执行 df.shift(freq=datetime.timedelta(-2)) 后:

AA BB CC DD
2012-05-30 0 1 2 3
2012-05-31 4 5 6 7
2012-06-01 8 9 10 11
2012-06-02 12 13 14 15

可以看到索引直接变了。

3、axis轴向设置

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =['a','b','c','d'])
 
df
Out[1]: 
 AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15
#当period为正时,默认是axis = 0轴的设定,向下移动
df.shift(2)
Out[2]: 
 AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0
#当axis=1,沿水平方向进行移动,正数向右移,负数向左移
df.shift(2,axis = 1)
Out[3]: 
 AA BB CC DD
a NaN NaN 0.0 1.0
b NaN NaN 4.0 5.0
c NaN NaN 8.0 9.0
d NaN NaN 12.0 13.0
#当period为负时,默认是axis = 0轴的设定,向上移动
df.shift(-1)
Out[4]: 
  AA BB CC DD
a 4.0 5.0 6.0 7.0
b 8.0 9.0 10.0 11.0
c 12.0 13.0 14.0 15.0
d NaN NaN NaN NaN

pandas 中上下两行相减(隔行相减) -- shift函数的使用

最近使用pandas处理数据,需求是想相邻两行上下相减,查API发现shift函数,很灵活,。你也可以隔任意行相减。

p['xx_1'] = p["xx"].shift(1)

上面得到的就是xx字段向下移动一行的结果,和之前相比向下移动一行,你可以设置为任意行,也可是向上向下

p['xx'] - p["xx_1"]

这就是前后两行的差值,很方便,Pandas很强大

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
Python中的装饰器用法详解
Jan 14 Python
Python编写登陆接口的方法
Jul 10 Python
对Python中gensim库word2vec的使用详解
May 08 Python
python复制列表时[:]和[::]之间有什么区别
Oct 16 Python
[原创]Python入门教程4. 元组基本操作
Oct 31 Python
python3 自动识别usb连接状态,即对usb重连的判断方法
Jul 03 Python
python中sort和sorted排序的实例方法
Aug 26 Python
Python日期格式和字符串格式相互转换的方法
Feb 18 Python
基于Python的OCR实现示例
Apr 03 Python
matplotlib对象拾取事件处理的实现
Jan 14 Python
一文搞懂python异常处理、模块与包
Jun 26 Python
Python中Schedule模块使用详解 周期任务神器
Apr 19 Python
Python补齐字符串长度的实例
Nov 15 #Python
python实现对指定字符串补足固定长度倍数截断输出的方法
Nov 15 #Python
Python 输入一个数字判断成绩分数等级的方法
Nov 15 #Python
基于numpy中数组元素的切片复制方法
Nov 15 #Python
对Python中list的倒序索引和切片实例讲解
Nov 15 #Python
对pandas里的loc并列条件索引的实例讲解
Nov 15 #Python
Pandas 按索引合并数据集的方法
Nov 15 #Python
You might like
利用PHP制作简单的内容采集器的原理分析
2008/10/01 PHP
PHP分页效率终结版(推荐)
2013/07/01 PHP
phpexcel导入excel数据使用方法实例
2013/12/24 PHP
微信网页授权(OAuth2.0) PHP 源码简单实现
2016/08/29 PHP
一个选择最快的服务器转向代码
2009/04/27 Javascript
基于jQuery的获取标签名的代码
2012/07/16 Javascript
Angular用来控制元素的展示与否的原生指令介绍
2015/01/07 Javascript
详解Bootstrap glyphicons字体图标
2016/01/04 Javascript
jQuery根据表单name获取值的方法
2016/05/24 Javascript
如何利用JSHint减少JavaScript的错误
2016/08/23 Javascript
微信小程序 教程之注册页面
2016/10/17 Javascript
vue生命周期的探索
2019/04/03 Javascript
vue项目中仿element-ui弹框效果的实例代码
2019/04/22 Javascript
Jquery动态列功能完整实例
2019/08/30 jQuery
Vue 实现显示/隐藏层的思路(加全局点击事件)
2019/12/31 Javascript
vue实现禁止浏览器记住密码功能的示例代码
2021/02/03 Vue.js
Python实现国外赌场热门游戏Craps(双骰子)
2015/03/31 Python
Python字符串处理函数简明总结
2015/04/13 Python
python中nan与inf转为特定数字方法示例
2017/05/11 Python
浅谈Pandas 排序之后索引的问题
2018/06/07 Python
matplotlib调整子图间距,调整整体空白的方法
2018/08/03 Python
python 实现在tkinter中动态显示label图片的方法
2019/06/13 Python
pyqt5移动鼠标显示坐标的方法
2019/06/21 Python
pytorch 图像中的数据预处理和批标准化实例
2020/01/15 Python
python网络编程:socketserver的基本使用方法实例分析
2020/04/09 Python
使用CSS3实现SVG路径描边动画效果入门教程
2019/10/21 HTML / CSS
浅谈html5标签css3的常用样式
2016/10/20 HTML / CSS
Canvas绘制浮动球效果的示例
2017/12/29 HTML / CSS
中专自我鉴定范文
2013/10/16 职场文书
求职信模版
2013/11/30 职场文书
面包店的创业计划书范文
2014/01/16 职场文书
大学生个人自荐信样本
2014/03/02 职场文书
消防志愿者活动方案
2014/08/23 职场文书
课题研究阶段性总结
2015/08/13 职场文书
浅谈TypeScript 索引签名的理解
2021/10/16 Javascript
Java Lambda表达式常用的函数式接口
2022/04/07 Java/Android