Pandas Shift函数的基础入门学习笔记


Posted in Python onNovember 16, 2018

Pandas Shift函数基础

在使用Pandas的过程中,有时会遇到shift函数,今天就一起来彻底学习下。先来看看帮助文档是怎么说的:

>>> import pandas
>>> help(pandas.DataFrame.shift)
Help on function shift in module pandas.core.frame:
 
shift(self, periods=1, freq=None, axis=0)
 Shift index by desired number of periods with an optional time freq
 
 Parameters
 ----------
 periods : int
 Number of periods to move, can be positive or negative
 freq : DateOffset, timedelta, or time rule string, optional
 Increment to use from the tseries module or time rule (e.g. 'EOM').
 See Notes.
 axis : {0 or 'index', 1 or 'columns'}
 
 Notes
 -----
 If freq is specified then the index values are shifted but the data
 is not realigned. That is, use freq if you would like to extend the
 index when shifting and preserve the original data.
 
 Returns
 -------
 shifted : DataFrame

该函数主要的功能就是使数据框中的数据移动,若freq=None时,根据axis的设置,行索引数据保持不变,列索引数据可以在行上上下移动或在列上左右移动;若行索引为时间序列,则可以设置freq参数,根据periods和freq参数值组合,使行索引每次发生periods*freq偏移量滚动,列索引数据不会移动。

参数详解:

  • period:表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这里移动的都是数据,而索引是不移动的,移动之后没有对应值的,就赋值为NaN。
  • freq: DateOffset, timedelta, or time rule string,可选参数,默认值为None,只适用于时间序列,如果这个参数存在,那么会按照参数值移动时间索引,而数据值没有发生变化。
  • axis: {0, 1, ‘index', ‘columns'},表示移动的方向,如果是0或者'index'表示上下移动,如果是1或者'columns',则会左右移动。

先来看一下一些简单的示例:

1、非时间索引下period的设置

假设存在一个DataFrame数据df:

index value1
A 0
B 1
C 2
D 3

如果执行以下代码  df.shift()  就会变成如下:

index value1
A NaN
B 0
C 1
D 2

执行 df.shift(2) 就会得到:

index value1
A NaN
B NaN
C 0
D 1

执行 df.shift(-1) 会得到:

index value1
A 1
B 2
C 3
D NaN

注意,shift移动的是整个数据,如果df有如下多列数据:

AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15

执行 df.shift(2) 的数据为:

AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0

如果只想移动df中的某一列数据,则需要这样操作: df['DD']= df['DD'].shift(1)

执行后的数据为:

AA BB CC DD
a 0 1 2 NaN
b 4 5 6 NaN
c 8 9 10 11
d 12 13 14 15

2、时间索引下freq 参数设置

假设存在如下DataFrame的df:

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =pd.date_range('2012-06-01','2012-06-04'))
AA BB CC DD
2012-06-01 0 1 2 3
2012-06-02 4 5 6 7
2012-06-03 8 9 10 11
2012-06-04 12 13 14 15

执行 df.shift(freq=datetime.timedelta(1))  后:

AA BB CC DD
2012-06-02 0 1 2 3
2012-06-03 4 5 6 7
2012-06-04 8 9 10 11
2012-06-05 12 13 14 15

执行 df.shift(freq=datetime.timedelta(-2)) 后:

AA BB CC DD
2012-05-30 0 1 2 3
2012-05-31 4 5 6 7
2012-06-01 8 9 10 11
2012-06-02 12 13 14 15

可以看到索引直接变了。

3、axis轴向设置

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =['a','b','c','d'])
 
df
Out[1]: 
 AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15
#当period为正时,默认是axis = 0轴的设定,向下移动
df.shift(2)
Out[2]: 
 AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0
#当axis=1,沿水平方向进行移动,正数向右移,负数向左移
df.shift(2,axis = 1)
Out[3]: 
 AA BB CC DD
a NaN NaN 0.0 1.0
b NaN NaN 4.0 5.0
c NaN NaN 8.0 9.0
d NaN NaN 12.0 13.0
#当period为负时,默认是axis = 0轴的设定,向上移动
df.shift(-1)
Out[4]: 
  AA BB CC DD
a 4.0 5.0 6.0 7.0
b 8.0 9.0 10.0 11.0
c 12.0 13.0 14.0 15.0
d NaN NaN NaN NaN

pandas 中上下两行相减(隔行相减) -- shift函数的使用

最近使用pandas处理数据,需求是想相邻两行上下相减,查API发现shift函数,很灵活,。你也可以隔任意行相减。

p['xx_1'] = p["xx"].shift(1)

上面得到的就是xx字段向下移动一行的结果,和之前相比向下移动一行,你可以设置为任意行,也可是向上向下

p['xx'] - p["xx_1"]

这就是前后两行的差值,很方便,Pandas很强大

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
Tornado服务器中绑定域名、虚拟主机的方法
Aug 22 Python
Python Paramiko模块的安装与使用详解
Nov 18 Python
如何用itertools解决无序排列组合的问题
May 18 Python
Python3下错误AttributeError: ‘dict’ object has no attribute’iteritems‘的分析与解决
Jul 06 Python
python中验证码连通域分割的方法详解
Jun 04 Python
在Python中,不用while和for循环遍历列表的实例
Feb 20 Python
Django 开发环境配置过程详解
Jul 18 Python
python获取指定日期范围内的每一天,每个月,每季度的方法
Aug 08 Python
详解python播放音频的三种方法
Sep 23 Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 Python
opencv 查找连通区域 最大面积实例
Jun 04 Python
10张动图学会python循环与递归问题
Feb 06 Python
Python补齐字符串长度的实例
Nov 15 #Python
python实现对指定字符串补足固定长度倍数截断输出的方法
Nov 15 #Python
Python 输入一个数字判断成绩分数等级的方法
Nov 15 #Python
基于numpy中数组元素的切片复制方法
Nov 15 #Python
对Python中list的倒序索引和切片实例讲解
Nov 15 #Python
对pandas里的loc并列条件索引的实例讲解
Nov 15 #Python
Pandas 按索引合并数据集的方法
Nov 15 #Python
You might like
对javascript和select部件的结合运用
2006/10/09 PHP
PHP 用数组降低程序的时间复杂度
2009/12/04 PHP
php 读写json文件及修改json的方法
2018/03/07 PHP
基于逻辑运算的简单权限系统(实现) JS 版
2007/03/24 Javascript
css3元素简单的闪烁效果实现(html5 jquery)
2013/12/28 Javascript
纯javascript实现自动发送邮件
2015/10/21 Javascript
jQuery绑定事件的几种实现方式
2016/05/09 Javascript
详解JavaScript中this关键字的用法
2016/05/26 Javascript
jQuery ajax调用后台aspx后台文件的两种常见方法(不是ashx)
2016/06/28 Javascript
详解Vue 开发模式下跨域问题
2017/06/06 Javascript
Vue学习笔记进阶篇之vue-cli安装及介绍
2017/07/18 Javascript
Vue.js如何实现路由懒加载浅析
2017/08/14 Javascript
静态页面实现 include 引入公用代码的示例
2017/09/25 Javascript
JS原型继承四步曲及原型继承图一览
2017/11/28 Javascript
Puppet的一些技巧
2018/09/17 Javascript
基于vue实现移动端圆形旋钮插件效果
2018/11/28 Javascript
js获取form表单中name属性的值
2019/02/27 Javascript
es6数值的扩展方法
2019/03/11 Javascript
vue-cli脚手架打包静态资源请求出错的原因与解决
2019/06/06 Javascript
通过说明与示例了解js五种设计模式
2019/06/17 Javascript
vue 使用微信jssdk,调用微信相册上传图片功能
2020/11/13 Javascript
[01:14]英雄,所敬略同——2018完美盛典宣传视频
2018/12/05 DOTA
[38:39]KG vs Mineski 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
如何运行Python程序的方法
2013/04/21 Python
创建pycharm的自定义python模板方法
2018/05/23 Python
Python面向对象程序设计多继承和多态用法示例
2019/04/08 Python
django数据关系一对多、多对多模型、自关联的建立
2019/07/24 Python
django 快速启动数据库客户端程序的方法示例
2019/08/16 Python
CSS3制作苹果风格键盘特效
2015/02/26 HTML / CSS
CSS3动画特效在活动页中的应用
2020/01/21 HTML / CSS
优衣库美国官网:UNIQLO美国
2018/04/14 全球购物
大三毕业自我鉴定
2014/01/15 职场文书
《东方明珠》教学反思
2014/04/20 职场文书
博士生求职信
2014/07/06 职场文书
学术会议开幕词
2016/03/03 职场文书
golang 定时任务方面time.Sleep和time.Tick的优劣对比分析
2021/05/05 Golang