目前,传统的基于LSTM网络的时间序列预测模型在对这种高维数据预测任务存在一定的局限性,首先是模型的训练过程不能并行化,因为这种递归神经网络的计算是依赖于前一个时间点的输出结果,其次原始的LSTM网络这种模型对时间序列中的不同特征的缺乏特征选择,模型对股价的全部特征一视同仁,虽然有输入层的全连接网络对输入的数据加权运算,但是这仅仅是对前一个时间点的进行加权,相当于对时间序列顺序判断其特征重要性,这种提取特征的方式并不是特别适合股价波动这种存在阶段特征的数据。

基于以上局限性,本系统进行了一些改进:

一是使用时序卷积网络作为时间序列的特征建模模型,利用卷积神经网络在一维数据上进行特征提取,使用膨胀因果卷积的深度模型提取严格时间依赖的序列特征,并使用残差连接确保模型梯度能够前向传递。时序卷积模型参考了 https://github.com/philipperemy/keras-tcn 。

二是使用基于时序特征提取的注意力机制,在传统的LSTM网络隐变量传播的过程中,使用卷积核计算每个序列隐变量的自注意力权重,相当于在序列切片内使用了自注意力机制,而且机制关注的是时间维度特征,通过卷积核进行注意力Q、K、V的计算,得到一个注意力Scoring Function,迫使模型更加关注对预测结果更相关的序列内的时间特征片段信息,结合递归网络和卷积网络的注意力特征提取机制,时序特征注意力网络可以在长时间的时间特征维度下更好的把握特征的维度信息,从而提高模型的表征能力。时序特征注意力机制参考了 https://github.com/gantheory/TPA-LSTM 。