编程 Python

python numpy实现rolling滚动案例

Posted in Python onJune 08, 2020

相比较pandas，numpy并没有很直接的rolling方法，但是numpy 有一个技巧可以让NumPy在C代码内部执行这种循环。

这是通过添加一个与窗口大小相同的额外尺寸和适当的步幅来实现的。

import numpy as np
data = np.arange(20)
def rolling_window(a, window):
  shape = a.shape[:-1] + (a.shape[-1] - window + 1, window)
  strides = a.strides + (a.strides[-1],)
  return np.lib.stride_tricks.as_strided(a, shape=shape, strides=strides)

rolling_window(data,10)
Out[12]: 
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
    [ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    [ 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
    [ 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
    [ 4, 5, 6, 7, 8, 9, 10, 11, 12, 13],
    [ 5, 6, 7, 8, 9, 10, 11, 12, 13, 14],
    [ 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
    [ 7, 8, 9, 10, 11, 12, 13, 14, 15, 16],
    [ 8, 9, 10, 11, 12, 13, 14, 15, 16, 17],
    [ 9, 10, 11, 12, 13, 14, 15, 16, 17, 18],
    [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]])

np.mean(rolling_window(data,10))
Out[13]: 9.5

np.mean(rolling_window(data,10),-1)
Out[14]: array([ 4.5, 5.5, 6.5, 7.5, 8.5, 9.5, 10.5, 11.5, 12.5, 13.5, 14.5])

补充知识：pandas中的滚动窗口rolling函数和扩展窗口expanding函数

在数据分析时，特别是在分析时间序列数据时，常会需要对一个序列进行固定长度窗口的滚动计算和分析，比如计算移动均线。只要是需要根据一个时序得到一个新的时序，就往往需要进行窗口滚动。在pandas中，DataFrame和Seies都有一个针对滚动窗口的函数，叫做rolling()。其具体的参数为：DataFrame.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None)

其中参数window可以为一个正整数或者一个offset（可以认为是时间区间长度），通过这个参数设置窗口长度；min_periods表示窗口中需要的最小的观测值，如果窗口中的成员个数少于这个设定的值，则这个窗口经过计算后就会返回NaN，比如，如果min_periods设为3,但当前的窗口中只有两个成员，那么该窗口对应的位置就会返回空值；center参数如果设为True，表示在取窗口覆盖的区间时，以当前label为中心，向两边取，若为False，则表示以当前label为窗口的最右侧，向左侧取，默认为False，要注意的是，当为True时，如果窗口长度为奇数，则中心位置很好确定，就是最中间的位置，但是如果长度为偶数，则默认中心位置为中间偏右的那一个位置；win_type参数表示不同的窗口类型，可以通过这个参数给窗口成员赋予不同的权重，默认为等权重；on参数表示指定对某一列进行rolling，而不是默认的对index进行rolling，要注意的是，当指定on参数时，指定的列必须是时间序列，不然rolling函数就会失效。

下面看一个简单的例子。下面的例子中，当窗口长度为3，设min_periods为2时，可知结果中第一个元素为NaN，因为第一个窗口只有一个值1，由于min_periods为2，所以至少需要包含两个数才行，故第一个值为空值，从第二个元素开始才有非空值，这就是min_periods参数的含义。当设置center为True时，如果窗口长度为偶数4，比如对于一个窗口[a,b,c,d]，则中心值为中心偏右的那个位置，就是c，故此时第1个窗口覆盖的元素为1和2，所以和为3，如下所示。

import pandas as pd
import numpy as np
df=pd.DataFrame([1,2,3,5],columns=['a'])
df
	a
0	1
1	2
2	3
3	5
 
df.rolling(3,min_periods=2).sum()
     a
0	NaN
1	3.0
2	6.0
3	10.0
 
df.rolling(4,min_periods=2,center=True).sum()
     a
0	3.0
1	6.0
2	11.0
3	10.0

rolling函数返回的是window对象或rolling子类，可以通过调用该对象的mean(),sum(),std(),count()等函数计算返回窗口的值，还可以通过该对象的apply(func)函数，通过自定义函数计算窗口的特定的值，具体可看文档。

从以上可以看出，rolling的窗口可以向前取值，向两边取值，但是没有向后取值，实际上只需要把原序列倒序排列后再向前取值就可以实现向后取值。下面我们再讲一下expanding函数，其为DataFrame.expanding(min_periods=1, center=False, axis=0)，其中参数的意义和rolling一样，只是其不是固定窗口长度，其长度是不断的扩大的。

以上这篇python numpy实现rolling滚动案例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python numpy实现rolling滚动案例

- Author -

brucewong0516

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

说一说Python logging

Apr 15 Python

Python实现文件内容批量追加的方法示例

Aug 29 Python

python ansible服务及剧本编写

Dec 29 Python

详细解读tornado协程(coroutine)原理

Jan 15 Python

详谈Python中列表list,元祖tuple和numpy中的array区别

Apr 18 Python

tensorflow实现简单的卷积网络

May 24 Python

详解10个可以快速用Python进行数据分析的小技巧

Jun 24 Python

python之生产者消费者模型实现详解

Jul 27 Python

django项目简单调取百度翻译接口的方法

Aug 06 Python

Python.append()与Python.expand()用法详解

Dec 18 Python

tensorflow实现二维平面模拟三维数据教程

Feb 11 Python

python 实现压缩和解压缩的示例

Sep 22 Python

Python如何向SQLServer存储二进制图片

Jun 08 #Python

python求numpy中array按列非零元素的平均值案例

Jun 08 #Python

Python过滤掉numpy.array中非nan数据实例

Jun 08 #Python

使用Python FastAPI构建Web服务的实现

Jun 08 #Python

python爬虫把url链接编码成gbk2312格式过程解析

Jun 08 #Python

给ubuntu18安装python3.7的详细教程

Jun 08 #Python

Python 实现将numpy中的nan和inf,nan替换成对应的均值

Jun 08 #Python

You might like

一个可查询所有表的“通用”查询分页类

2006/10/09 PHP

php与php MySQL 之间的关系

2009/07/17 PHP

PHP中把stdClass Object转array的几个方法

2014/05/08 PHP

简介WordPress中用于获取首页和站点链接的PHP函数

2015/12/17 PHP

巧妙破除网页右键禁用的十大绝招

2006/08/12 Javascript

srcElement表格样式

2006/09/03 Javascript

从零开始学习jQuery (二) 万能的选择器

2010/10/01 Javascript

JS代码同步文本框内容的实例方法

2013/07/12 Javascript

javascript的渐进增强与平稳退化浅谈

2013/11/12 Javascript

分享9点个人认为比较重要的javascript 编程技巧

2015/04/27 Javascript

谈谈JavaScript自定义回调函数

2015/10/18 Javascript

快速掌握Node.js环境的安装与运行方法

2016/02/16 Javascript

JavaScript编写检测用户所使用的浏览器的代码示例

2016/05/05 Javascript

js添加绑定事件的方法

2016/05/15 Javascript

jQuery dataTables与jQuery UI 对话框dialog的使用教程

2016/09/02 Javascript

JQuery控制DIV的选取实现方法

2016/09/18 Javascript

Node.js Sequelize如何实现数据库的读写分离

2016/10/23 Javascript

JS 终止执行的实现方法

2016/11/24 Javascript

ajax图片上传，图片异步上传，更新实例

2016/12/30 Javascript

Vue keep-alive实践总结（推荐）

2017/08/31 Javascript

详解Vue快速零配置的打包工具——parcel

2018/01/16 Javascript

微信小程序开发之左右分栏效果的实例代码

2019/05/20 Javascript

微信小程序获取用户信息及手机号（后端TP5.0）

2019/09/12 Javascript

JavaScript代码压缩工具UglifyJS和Google Closure Compiler的基本用法

2020/04/13 Javascript

[58:18]2018DOTA2亚洲邀请赛3月29日小组赛B组 iG VS Mineski

2018/03/30 DOTA

[32:07]完美世界DOTA2联赛PWL S3 LBZS vs Rebirth 第一场 12.16

2020/12/17 DOTA

PyQt5打开文件对话框QFileDialog实例代码

2018/02/07 Python

python scipy卷积运算的实现方法

2019/09/16 Python

C/C++程序员常见面试题一

2012/12/08 面试题

linux面试题参考答案（4）

2014/09/21 面试题

新闻记者个人求职的自我评价

2013/11/28 职场文书

继承公证书

2014/04/09 职场文书

机械制造专业大学生自我鉴定

2014/09/19 职场文书

2014年行政人事工作总结

2014/12/09 职场文书

2015年财务科工作总结范文

2015/05/13 职场文书

Java中PriorityQueue实现最小堆和最大堆的用法

2021/06/27 Java/Android