编程 Python

keras在构建LSTM模型时对变长序列的处理操作

Posted in Python onJune 29, 2020

我就废话不多说了，大家还是直接看代码吧~

print(np.shape(X))#(1920, 45, 20)
X=sequence.pad_sequences(X, maxlen=100, padding='post')
print(np.shape(X))#(1920, 100, 20)

model = Sequential()
model.add(Masking(mask_value=0,input_shape=(100,20)))
model.add(LSTM(128,dropout_W=0.5,dropout_U=0.5))
model.add(Dense(13,activation='softmax'))
model.compile(loss='categorical_crossentropy',
       optimizer='adam',
       metrics=['accuracy'])

# 用于保存验证集误差最小的参数，当验证集误差减少时，保存下来
checkpointer = ModelCheckpoint(filepath="keras_rnn.hdf5", verbose=1, save_best_only=True, )
history = LossHistory()
result = model.fit(X, Y, batch_size=10,
          nb_epoch=500, verbose=1, validation_data=(testX, testY),
          callbacks=[checkpointer, history])

model.save('keras_rnn_epochend.hdf5')

补充知识：RNN(LSTM)数据形式及Padding操作处理变长时序序列dynamic_rnn

Summary

RNN

样本一样，计算的状态值和输出结构一致，也即是说只要当前时刻的输入值也前一状态值一样，那么其当前状态值和当前输出结果一致，因为在当前这一轮训练中权重参数和偏置均未更新

RNN的最终状态值与最后一个时刻的输出值一致

输入数据要求格式为，shape=(batch_size, step_time_size, input_size),那么，state的shape=(batch_size, state_size);output的shape=(batch_size, step_time_size, state_size),并且最后一个有效输出（有效序列长度，不包括padding的部分）与状态值会一样

LSTM

LSTM与RNN基本一致，不同在于其状态有两个c_state和h_state，它们的shape一样，输出值output的最后一个有效输出与h_state一致

用变长RNN训练，要求其输入格式仍然要求为shape=(batch_size, step_time_size, input_size)，但可指定每一个批次中各个样本的有效序列长度，这样在有效长度内其状态值和输出值原理不变，但超过有效长度的部分的状态值将不会发生改变，而输出值都将是shape=(state_size,)的零向量（注：RNN也是这个原理）

需要说明的是，不是因为无效序列长度部分全padding为0而引起输出全为0，状态不变，因为输出值和状态值得计算不仅依赖当前时刻的输入值，也依赖于上一时刻的状态值。其内部原理是利用一个mask matrix矩阵标记有效部分和无效部分，这样在无效部分就不用计算了，也就是说，这一部分不会造成反向传播时对参数的更新。当然，如果padding不是零，那么padding的这部分输出和状态同样与padding为零的结果是一样的

'''
#样本数据为（batch_size，time_step_size, input_size[embedding_size]）的形式，其中samples=4，timesteps=3，features=3,其中第二个、第四个样本是只有一个时间步长和二个时间步长的，这里自动补零
'''
import pandas as pd
import numpy as np
import tensorflow as tf

train_X = np.array([[[0, 1, 2], [9, 8, 7], [3,6,8]], 
          [[3, 4, 5], [0, 10, 110], [0,0,0]], 
          [[6, 7, 8], [6, 5, 4], [1,7,4]], 
          [[9, 0, 1], [3, 7, 4], [0,0,0]],
          [[9, 0, 1], [3, 3, 4], [0,0,0]]
          ])
          
sequence_length = [3, 1, 3, 2, 2]

train_X.shape, train_X[:,2:3,:].reshape(5, 3)

tf.reset_default_graph()

x = tf.placeholder(tf.float32, shape=(None, 3, 3)) # 输入数据只需能够迭代并符合要求shape即可，list也行，shape不指定表示没有shape约束，任意shape均可
rnn_cell = tf.nn.rnn_cell.BasicRNNCell(num_units=6) # state_size[hidden_size]
lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(num_units=6) # state_size[hidden_size]
outputs1, state1 = tf.nn.dynamic_rnn(rnn_cell, x, dtype=tf.float32, sequence_length=sequence_length)
outputs2, state2 = tf.nn.dynamic_rnn(lstm_cell, x, dtype=tf.float32, sequence_length=sequence_length)

with tf.Session() as sess:
  sess.run(tf.global_variables_initializer()) # 初始化rnn_cell中参数变量
  outputs1, state1 = sess.run((outputs1, state1), feed_dict={x: train_X})
  outputs2, state2 = sess.run([outputs2, state2], feed_dict={x: train_X})
  print(outputs1.shape, state1.shape) # (4, 3, 5)->(batch_size, time_step_size, state_size), (4, 5)->(batch_size, state_size)
  print(outputs2.shape) # state2为LSTMStateTuple（c_state, h_state）
  print("---------output1<rnn>state1-----------")
  print(outputs1) # 可以看出output1的最后一个时刻的输出即为state1, 即output1[:,-1,:]与state1相等
  print(state1)
  print(np.all(outputs1[:,-1,:] == state1))
  print("---------output2<lstm>state2-----------")
  print(outputs2) # 可以看出output2的最后一个时刻的输出即为LSTMStateTuple中的h
  print(state2)
  print(np.all(outputs2[:,-1,:] == state2[1]))

再来怼怼dynamic_rnn中数据序列长度tricks

keras在构建LSTM模型时对变长序列的处理操作

思路样例代码

from collections import Counter
import numpy as np

origin_data = np.array([[1, 2, 3],
            [3, 0, 2],
            [1, 1, 4],
            [2, 1, 2],
            [0, 1, 1],
            [2, 0, 3]
            ])
# 按照指定列索引进行分组（看作RNN中一个样本序列）,如下为按照第二列分组的结果
# [[[1, 2, 3], [0, 0, 0], [0, 0, 0]],
# [[3, 0, 2], [2, 0, 3], [0, 0, 0]],
# [[1, 1, 4], [2, 1, 2], [0, 1, 1]]]

# 第一步，将原始数据按照某列序列化使之成为一个序列数据
def groupby(a, col_index): # 未加入索引越界判断
  max_len = max(Counter(a[:, col_index]).values())
  for i in set(a[:, col_index]):
    d[i] = []
  for sample in a:
    d[sample[col_index]].append(list(sample))
#   for key in d:
#     d[key].extend([[0]*a.shape[1] for _ in range(max_len-len(d[key]))])
  return list(d.values()), [len(_) for _ in d.values()]

samples, sizes = groupby(origin_data, 2)
# 第二步，根据当前这一批次的中最大序列长度max(sizes)作为padding标准（不同批次的样本序列长度可以不一样，但同一批次要求一样（包括padding的部分）），当然也可以一次性将所有样本（不按照批量）按照最大序列长度padding也行，可能空间浪费
paddig_samples = np.zeros([len(samples), max(sizes), 3])
for seq_index, seq in enumerate(samples):
  paddig_samples[seq_index, :len(seq), :] = seq
paddig_samples

以上这篇keras在构建LSTM模型时对变长序列的处理操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

keras在构建LSTM模型时对变长序列的处理操作

- Author -

xinfeng2005

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

跟老齐学Python之再深点，更懂list

Sep 20 Python

在Python的Django框架中使用通用视图的方法

Jul 21 Python

Python入门_浅谈for循环、while循环

May 16 Python

Python 实现在文件中的每一行添加一个逗号

Apr 29 Python

Python 计算任意两向量之间的夹角方法

Jul 05 Python

python自动识别文本编码格式代码

Dec 26 Python

Python OpenCV读取显示视频的方法示例

Feb 20 Python

python字典和json.dumps()的遇到的坑分析

Mar 11 Python

如何搭建pytorch环境的方法步骤

May 06 Python

Numpy中ndim、shape、dtype、astype的用法详解

Jun 14 Python

python/golang 删除链表中的元素

Sep 14 Python

Pytorch 实现变量类型转换

May 17 Python

Python爬虫爬取博客实现可视化过程解析

Jun 29 #Python

使用keras框架cnn+ctc_loss识别不定长字符图片操作

Jun 29 #Python

浅谈keras中的后端backend及其相关函数(K.prod,K.cast)

Jun 29 #Python

如何使用python记录室友的抖音在线时间

Jun 29 #Python

Python sublime安装及配置过程详解

Jun 29 #Python

keras K.function获取某层的输出操作

Jun 29 #Python

Python pytesseract验证码识别库用法解析

Jun 29 #Python

You might like

PHP获取类中常量，属性，及方法列表的方法

2009/04/09 PHP

Windows下的PHP安装pear教程

2014/10/24 PHP

php cli模式下获取参数的方法

2017/05/05 PHP

Javascript下判断是否为闰年的Datetime包

2010/10/26 Javascript

javascript一元操作符(递增、递减)使用示例

2013/08/07 Javascript

jquery实现页面百叶窗走马灯式翻滚显示效果的方法

2015/03/12 Javascript

JQuery跳出each循环的方法

2015/04/16 Javascript

cocos2dx骨骼动画Armature源码剖析(一)

2015/09/08 Javascript

JavaScript for循环 if判断语句(学习笔记)

2017/10/11 Javascript

js 只比较时间大小的实例

2017/10/26 Javascript

vue中使用iview自定义验证关键词输入框问题及解决方法

2018/03/26 Javascript

python遍历类中所有成员的方法

2015/03/18 Python

Python的自动化部署模块Fabric的安装及使用指南

2016/01/19 Python

Python中is与==判断的区别

2017/03/28 Python

sublime python3 输入换行不结束的方法

2018/04/19 Python

python中将zip压缩包转为gz.tar的方法

2018/10/18 Python

Django ORM 练习题及答案

2019/07/19 Python

利用Python校准本地时间的方法教程

2019/10/31 Python

python numpy 反转 reverse示例

2019/12/04 Python

python中id函数运行方式

2020/07/03 Python

Selenium环境变量配置(火狐浏览器)及验证实现

2020/12/07 Python

详解CSS3开启硬件加速的使用和坑

2017/08/21 HTML / CSS

HTML5 canvas标签实现刮刮卡效果

2015/04/24 HTML / CSS

欧洲最大的婴幼儿服装及内衣公司：Petit Bateau（小帆船）

2016/08/16 全球购物

如何启动时不需输入用户名与密码

2014/05/09 面试题

机械设计制造专业个人求职信

2013/09/25 职场文书

财务部出纳岗位职责

2013/12/22 职场文书

生日派对邀请函

2014/01/13 职场文书

计算机应用专业自荐信

2014/07/05 职场文书

2014五年级班主任工作总结

2014/12/05 职场文书

公司财务经理岗位职责

2015/04/08 职场文书

复活读书笔记

2015/06/29 职场文书

幼儿园2016年圣诞活动总结

2016/03/31 职场文书

mysql获取指定时间段中所有日期或月份的语句(不设存储过程，不加表)

2021/06/18 MySQL

Python可视化神器pyecharts绘制水球图

2022/07/07 Python

TypeScript实用技巧 Nominal Typing名义类型详解

2022/09/23 Javascript