Pandas Shift函数的基础入门学习笔记


Posted in Python onNovember 16, 2018

Pandas Shift函数基础

在使用Pandas的过程中,有时会遇到shift函数,今天就一起来彻底学习下。先来看看帮助文档是怎么说的:

>>> import pandas
>>> help(pandas.DataFrame.shift)
Help on function shift in module pandas.core.frame:
 
shift(self, periods=1, freq=None, axis=0)
 Shift index by desired number of periods with an optional time freq
 
 Parameters
 ----------
 periods : int
 Number of periods to move, can be positive or negative
 freq : DateOffset, timedelta, or time rule string, optional
 Increment to use from the tseries module or time rule (e.g. 'EOM').
 See Notes.
 axis : {0 or 'index', 1 or 'columns'}
 
 Notes
 -----
 If freq is specified then the index values are shifted but the data
 is not realigned. That is, use freq if you would like to extend the
 index when shifting and preserve the original data.
 
 Returns
 -------
 shifted : DataFrame

该函数主要的功能就是使数据框中的数据移动,若freq=None时,根据axis的设置,行索引数据保持不变,列索引数据可以在行上上下移动或在列上左右移动;若行索引为时间序列,则可以设置freq参数,根据periods和freq参数值组合,使行索引每次发生periods*freq偏移量滚动,列索引数据不会移动。

参数详解:

  • period:表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这里移动的都是数据,而索引是不移动的,移动之后没有对应值的,就赋值为NaN。
  • freq: DateOffset, timedelta, or time rule string,可选参数,默认值为None,只适用于时间序列,如果这个参数存在,那么会按照参数值移动时间索引,而数据值没有发生变化。
  • axis: {0, 1, ‘index', ‘columns'},表示移动的方向,如果是0或者'index'表示上下移动,如果是1或者'columns',则会左右移动。

先来看一下一些简单的示例:

1、非时间索引下period的设置

假设存在一个DataFrame数据df:

index value1
A 0
B 1
C 2
D 3

如果执行以下代码  df.shift()  就会变成如下:

index value1
A NaN
B 0
C 1
D 2

执行 df.shift(2) 就会得到:

index value1
A NaN
B NaN
C 0
D 1

执行 df.shift(-1) 会得到:

index value1
A 1
B 2
C 3
D NaN

注意,shift移动的是整个数据,如果df有如下多列数据:

AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15

执行 df.shift(2) 的数据为:

AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0

如果只想移动df中的某一列数据,则需要这样操作: df['DD']= df['DD'].shift(1)

执行后的数据为:

AA BB CC DD
a 0 1 2 NaN
b 4 5 6 NaN
c 8 9 10 11
d 12 13 14 15

2、时间索引下freq 参数设置

假设存在如下DataFrame的df:

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =pd.date_range('2012-06-01','2012-06-04'))
AA BB CC DD
2012-06-01 0 1 2 3
2012-06-02 4 5 6 7
2012-06-03 8 9 10 11
2012-06-04 12 13 14 15

执行 df.shift(freq=datetime.timedelta(1))  后:

AA BB CC DD
2012-06-02 0 1 2 3
2012-06-03 4 5 6 7
2012-06-04 8 9 10 11
2012-06-05 12 13 14 15

执行 df.shift(freq=datetime.timedelta(-2)) 后:

AA BB CC DD
2012-05-30 0 1 2 3
2012-05-31 4 5 6 7
2012-06-01 8 9 10 11
2012-06-02 12 13 14 15

可以看到索引直接变了。

3、axis轴向设置

df = pd.DataFrame(np.arange(16).reshape(4,4),columns=['AA','BB','CC','DD'],index =['a','b','c','d'])
 
df
Out[1]: 
 AA BB CC DD
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15
#当period为正时,默认是axis = 0轴的设定,向下移动
df.shift(2)
Out[2]: 
 AA BB CC DD
a NaN NaN NaN NaN
b NaN NaN NaN NaN
c 0.0 1.0 2.0 3.0
d 4.0 5.0 6.0 7.0
#当axis=1,沿水平方向进行移动,正数向右移,负数向左移
df.shift(2,axis = 1)
Out[3]: 
 AA BB CC DD
a NaN NaN 0.0 1.0
b NaN NaN 4.0 5.0
c NaN NaN 8.0 9.0
d NaN NaN 12.0 13.0
#当period为负时,默认是axis = 0轴的设定,向上移动
df.shift(-1)
Out[4]: 
  AA BB CC DD
a 4.0 5.0 6.0 7.0
b 8.0 9.0 10.0 11.0
c 12.0 13.0 14.0 15.0
d NaN NaN NaN NaN

pandas 中上下两行相减(隔行相减) -- shift函数的使用

最近使用pandas处理数据,需求是想相邻两行上下相减,查API发现shift函数,很灵活,。你也可以隔任意行相减。

p['xx_1'] = p["xx"].shift(1)

上面得到的就是xx字段向下移动一行的结果,和之前相比向下移动一行,你可以设置为任意行,也可是向上向下

p['xx'] - p["xx_1"]

这就是前后两行的差值,很方便,Pandas很强大

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
Python SQLAlchemy基本操作和常用技巧(包含大量实例,非常好)
May 06 Python
Python中DJANGO简单测试实例
May 11 Python
Python导入oracle数据的方法
Jul 10 Python
python提取字典key列表的方法
Jul 11 Python
Python中字符串的处理技巧分享
Sep 17 Python
python3调用windows dos命令的例子
Aug 14 Python
python3.8 微信发送服务器监控报警消息代码实现
Nov 05 Python
解决windows上安装tensorflow时报错,“DLL load failed: 找不到指定的模块”的问题
May 20 Python
Python基于time模块表示时间常用方法
Jun 18 Python
详解python with 上下文管理器
Sep 02 Python
matplotlib 三维图表绘制方法简介
Sep 20 Python
python安装mysql的依赖包mysql-python操作
Jan 01 Python
Python补齐字符串长度的实例
Nov 15 #Python
python实现对指定字符串补足固定长度倍数截断输出的方法
Nov 15 #Python
Python 输入一个数字判断成绩分数等级的方法
Nov 15 #Python
基于numpy中数组元素的切片复制方法
Nov 15 #Python
对Python中list的倒序索引和切片实例讲解
Nov 15 #Python
对pandas里的loc并列条件索引的实例讲解
Nov 15 #Python
Pandas 按索引合并数据集的方法
Nov 15 #Python
You might like
从零开始 教你如何搭建Discuz!4.1论坛
2006/07/07 PHP
WINXP下apache+php4+mysql
2006/11/25 PHP
PHP入门学习的几个不错的实例代码
2008/07/13 PHP
php miniBB中文乱码问题解决方法
2008/11/25 PHP
php生成的html meta和link标记在body标签里 顶部有个空行
2010/05/18 PHP
PHP XML error parsing SOAP payload on line 1
2010/06/17 PHP
淘宝ip地址查询类分享(利用淘宝ip库)
2014/01/07 PHP
Extjs ajax同步请求时post方式参数发送方式
2009/08/05 Javascript
js操作CheckBoxList实现全选/反选(在客服端完成)
2013/02/02 Javascript
jquery删除提示框弹出是否删除对话框
2014/01/07 Javascript
jquery实现下拉菜单的二级联动利用json对象从DB取值显示联动
2014/03/27 Javascript
javascript实现查找数组中最大值方法汇总
2016/02/13 Javascript
举例讲解如何判断JavaScript中对象的类型
2016/04/22 Javascript
JS限制条件补全问题实例分析
2016/12/16 Javascript
Angular.JS去掉访问路径URL中的#号详解
2017/03/30 Javascript
Three.js利用性能插件stats实现性能监听的方法
2017/09/25 Javascript
vue中本地静态图片路径写法
2018/03/06 Javascript
JavaScript DOM元素常见操作详解【添加、删除、修改等】
2018/05/09 Javascript
node和vue实现商城用户地址模块
2018/12/05 Javascript
使用vue开发移动端管理后台的注意事项
2019/03/07 Javascript
微信小程序实现3D轮播图效果(非swiper组件)
2019/09/21 Javascript
echarts柱状图背景重叠组合而非并列的实现代码
2020/12/10 Javascript
python 获取et和excel的版本号
2009/04/09 Python
定制FileField中的上传文件名称实例
2017/08/23 Python
python 使用装饰器并记录log的示例代码
2019/07/12 Python
Python生成个性签名图片获取GUI过程解析
2019/12/16 Python
浅谈python opencv对图像颜色通道进行加减操作溢出
2020/06/03 Python
Python二元算术运算常用方法解析
2020/09/15 Python
Python3 用什么IDE开发工具比较好
2020/11/28 Python
火山咖啡:Volcanica Coffee
2019/10/29 全球购物
为什么如下的代码int a=100,b=100;long int c=a * b;不能工作
2013/11/29 面试题
毕业实习评语
2014/02/10 职场文书
老同学聚会感言
2014/02/23 职场文书
交通事故委托书范本(2篇)
2014/09/21 职场文书
教师党的群众路线教育实践活动个人整改方案
2014/10/31 职场文书
Centos环境下Postgresql 安装配置及环境变量配置技巧
2021/05/18 PostgreSQL