编程 Python

Pandas时间序列基础详解(转换,索引,切片)

Posted in Python onFebruary 26, 2020

时间序列的类型：

时间戳：具体的时刻

固定的时间区间：例如2007年的1月或整个2010年

时间间隔：由开始时间和结束时间表示，时间区间可以被认为是间隔的特殊情况

实验时间和消耗时间：每个时间是相对于特定开始时间的时间的量度，（例如自从被放置在烤箱中每秒烘烤的饼干的直径）

日期和时间数据的类型及工具

datetime模块中的类型：

date   使用公历日历存储日历日期（年，月，日） 
time   将时间存储为小时，分钟，秒，微秒
datetime  存储日期和时间
timedelta  表示两个datetime值之间的差（如日，秒，微秒）
tzinfo  用于存储时区信息的基本类型

from datetime import datetime
now = datetime.now()
now.year  #当时年份
now.month  #当前月份
now.day  #当前天
now.time()  #当前时间
datetime.time(12, 27, 41, 303676)

 两个时间戳运算得到一个timedelta(时间差)类型

日期时间差 timedelta类型

from datetime import timedelta

start = datetime(2019,2,5)
start + timedelta(20)  #默认为天
datetime.datetime(2019, 2, 25, 0, 0)

字符串和datetime互相转换

date.strptime方法将字符串转换为时间

values = '2019-8-9'
datetime.strptime(values,'%Y-%m-%d')  #是在已知格式的前提下转换日期的好方式
datetime.datetime(2019, 8, 9, 0, 0)

datestrs = ['2019-8-7','2019-8-9']
[datetime.strptime(values,'%Y-%m-%d') for values in datestrs]
[datetime.datetime(2019, 8, 7, 0, 0), datetime.datetime(2019, 8, 9, 0, 0)]

更为通用的日期转换格式

from dateutil.parser import parse
parse(values)
datetime.datetime(2019, 8, 9, 0, 0)
parse('8,5,2018',dayfirst=True) #dayfirst参数 第一个元素是天
datetime.datetime(2018, 5, 8, 0, 0)

pd.to_datetime() 用于轴索引或DataFrame的列

pd.to_datetime(datestrs)
DatetimeIndex(['2019-08-07', '2019-08-09'], dtype='datetime64[ns]', freq=None)

更为简单的转换

datetime(2019,1,1)
datetime.datetime(2019, 1, 1, 0, 0)

时间序列的算术运算（在日期上自动对齐）

index = pd.date_range('3/3/2018',periods=20)
ts = pd.Series(np.random.randn(20),index=index)
ts
2018-03-03 0.611591
2018-03-04 0.119168
2018-03-05 0.514390
2018-03-06 1.010600
2018-03-07 0.181763
2018-03-08 -0.290964
2018-03-09 0.252927
2018-03-10 -1.645692
2018-03-11 -0.500014
2018-03-12 -1.247355

ts1 = ts[::2]
2018-03-03 0.611591
2018-03-05 0.514390
2018-03-07 0.181763
2018-03-09 0.252927
2018-03-11 -0.500014
2018-03-13 -0.122307
2018-03-15 0.361237
2018-03-17 -1.894853
2018-03-19 -1.608989
2018-03-21 1.274982
Freq: 2D, dtype: float64

ts + ts1
2018-03-03 1.223183
2018-03-04  NaN
2018-03-05 1.028781
2018-03-06  NaN
2018-03-07 0.363526
2018-03-08  NaN
2018-03-09 0.505853
2018-03-10  NaN
2018-03-11 -1.000028
2018-03-12  NaN
2018-03-13 -0.244613
2018-03-14  NaN
2018-03-15 0.722473
2018-03-16  NaN
2018-03-17 -3.789707
2018-03-18  NaN
2018-03-19 -3.217979
2018-03-20  NaN
2018-03-21 2.549963
2018-03-22  NaN

ts.index.dtype  #数据；类型在纳秒级的分辨率下存储时间戳
dtype('<M8[ns]')

ts.index[0]  #datetimeindex中的标量值是一个时间戳（timestamp）
Timestamp('2018-03-03 00:00:00', freq='D')

时间序列的索引，选择，子集

时间序列的索引

ts = pd.Series(np.random.randn(1000),index = pd.date_range('1/1/2016',periods=1000))

s['2018-6'] #时间序列的索引 也可用ts.loc[]
2018-06-01 1.371843
2018-06-02 -0.356041
2018-06-03 0.111452
2018-06-04 0.325222
2018-06-05 -0.863138
2018-06-06 -0.115909
2018-06-07 0.062894
2018-06-08 0.223712

时间序列的切片

ts['2018-9-23':]  #时间序列的切片
2018-09-23 0.005519
2018-09-24 -1.374038
2018-09-25 1.769112
2018-09-26 -0.000306
Freq: D, dtype: float64

ts.truncate(before='2018-9-24')  #使用truncate方法向后切片
2018-09-24 -1.374038
2018-09-25 1.769112
2018-09-26 -0.000306
Freq: D, dtype: float64

ts.truncate(after='2016-1-4')  #向前切片
2016-01-01 -1.776334
2016-01-02 -0.488550
2016-01-03 -1.299889
2016-01-04 -1.883413
Freq: D, dtype: float64

含有重复索引的时间序列的分组处理

index = pd.DatetimeIndex(['1/1/2017','1/1/2017','1/2/2017','1/3/2017'])
dup_ta = pd.Series(np.arange(4),index=index)
dup_ta
2017-01-01 0
2017-01-01 1
2017-01-02 2
2017-01-03 3
dtype: int32

dup_ta.groupby(level=0).mean()

以上这篇Pandas时间序列基础详解(转换,索引,切片)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Pandas时间序列基础详解(转换,索引,切片)

- Author -

Roddy_Liu

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用迭代器捕获Generator返回值的方法

Apr 05 Python

django 通过ajax完成邮箱用户注册、激活账号的方法

Apr 17 Python

python 读取目录下csv文件并绘制曲线v111的方法

Jul 06 Python

python+flask实现API的方法

Nov 21 Python

padas 生成excel 增加sheet表的实例

Dec 11 Python

使用python 写一个静态服务(实战)

Jun 28 Python

Python(PyS60)实现简单语音整点报时

Nov 18 Python

tensorflow中tf.reduce_mean函数的使用

Apr 19 Python

完美解决Django2.0中models下的ForeignKey()问题

May 19 Python

Python使用plt.boxplot() 参数绘制箱线图

Jun 04 Python

Python Tricks 使用 pywinrm 远程控制 Windows 主机的方法

Jul 21 Python

聊聊python中的异常嵌套

Sep 01 Python

Python图像处理库PIL的ImageFont模块使用介绍

Feb 26 #Python

Python利用FFT进行简单滤波的实现

Feb 26 #Python

Python图像处理库PIL的ImageGrab模块介绍详解

Feb 26 #Python

Python图像处理库PIL的ImageDraw模块介绍详解

Feb 26 #Python

PIL包中Image模块的convert()函数的具体使用

Feb 26 #Python

Pandas —— resample()重采样和asfreq()频度转换方式

Feb 26 #Python

python实现银行实战系统

Feb 26 #Python

You might like

main.php

2006/12/09 PHP

php empty函数判断mysql表单是否为空

2010/04/12 PHP

Laravel构建即时应用的一种实现方法详解

2017/08/31 PHP

php双层循环(九九乘法表)

2017/10/23 PHP

Thinkphp5.0 框架视图view的比较标签用法分析

2019/10/12 PHP

javascript获取当前日期时间及其它操作函数

2011/01/11 Javascript

通过上下左右键和回车键切换光标实现代码

2013/03/08 Javascript

热点新闻滚动特效的js代码

2013/08/17 Javascript

JavaScript lastIndexOf方法入门实例（计算指定字符在字符串中最后一次出现的位置）

2014/10/17 Javascript

javascript实现画不相交的圆

2015/04/07 Javascript

Javascript基于AJAX回调函数传递参数实例分析

2015/12/15 Javascript

基于jQuery实现点击最后一行实现行自增效果的表格

2016/01/12 Javascript

Node.js刷新session过期时间的实现方法推荐

2016/05/18 Javascript

js修改onclick动作的四种方法(推荐)

2016/08/18 Javascript

Vue.js每天必学之指令系统与自定义指令

2016/09/07 Javascript

javascript 中null和undefined区分和比较

2017/04/19 Javascript

MUI顶部选项卡的用法(tab-top-webview-main)详解

2017/10/08 Javascript

jQuery 同时获取多个标签的指定内容并储存为数组

2018/11/20 jQuery

Layui 数据表格批量删除和多条件搜索的实例

2019/09/04 Javascript

9种方法优化jQuery代码详解

2020/02/04 jQuery

es6中Promise 对象基本功能与用法实例分析

2020/02/23 Javascript

JS实现简易贪吃蛇游戏

2020/08/24 Javascript

[46:58]完美世界DOTA2联赛PWL S3 Forest vs LBZS 第一场 12.17

2020/12/19 DOTA

python列表去重的二种方法

2014/02/14 Python

python爬虫之模拟登陆csdn的实例代码

2018/05/18 Python

PyTorch线性回归和逻辑回归实战示例

2018/05/22 Python

python+pyqt5编写md5生成器

2019/03/18 Python

详解python 中in 的用法

2019/12/12 Python

Python猜数字算法题详解

2020/03/01 Python

Python中猜拳游戏与猜筛子游戏的实现方法

2020/09/04 Python

比利时的在线灯具店：Lampen24.be

2019/07/01 全球购物

物理系毕业生自荐信

2013/11/01 职场文书

房地产管理毕业生自荐信

2013/11/04 职场文书

单位个人查摆问题及整改措施

2014/10/28 职场文书

邀请函范文

2015/02/02 职场文书

干货：如何写好观后感！

2019/05/21 职场文书