论文原址:https://www.aaai.org/AAAI21Papers/AAAI-7907.SawhneyR.pdf
这几年研究把深度学习应用到量化交易和传统投资决策的论文并不少,但都有2个问题:
- They do not directly optimize the target of investment in terms of profit
- and treat each stock as independent from the others, ignoring the rich signals between related stocks’ temporal price movemen
为了解决这些问题,作者提出了一种叫 STHAN-SR 的超图神经网络。并通过对美3大交易所最近6年的数据,证明这个网络在当前所有股票预测算法里面是最优的
Introduction
美股市场,68万亿,19年
forecasting:预测
highly volatile and non-stationary nature – 股票市场具有很强的波动性
synergy 协同
当前主流的股票预测算法,最大的弊端就是不以投资收益为优化目标。因为这些算法,要么是基于回归来预测价格,要么基于分类来做交易决策,这种分类和回归的优化目标是为了提高股票价格走向的准确性或最小化预测股票收益的误差,而不一定是为了直接利润
(有什么不一样吗??一脸懵比)
第二个弊端就是不考虑股票之间的相关性,总是把这些股票作为独立的个体来分析,或者使用一个过于简化的股票市场模型,一个由单个股票之间的成对关系组成的图表,但在现实中,这与真正的市场是相反的
We hypothesize that stocks are often related through higher-order relations as a collective group
比如,通常一个 CEO 或者一个集团下的多个小公司,其股价通常都有一定程度的相关性
又比如上图,由于COVID-19疫情的爆发,旅游和交通等行业的公司的股价出现下跌,而与此相反,医疗保健相关股票的股价出现上涨
通过 hypergraph 能帮助我们表示这种高维度的特征关系
Methodology
论文核心:
- 把股票预测定义为一个排序学习问题,通过超图建立股票之间的高维关系,建立相应的模型
- 并通过超图卷积神经网络来捕捉股票运动中的空间和时间依赖性
1. Problem Formulation
首先,定义股票预测是一个排序学习问题。确定问题域才好找大概的解决思路
S = {s_1, s_2, ..., s_N} S表示N个股票的集合
p^t 表示 day-t 时刻的股票价格
r_{i}^{t} = \frac {p^t - p^(t-1)} {p^(t-1)} 表示 day-t 一天的回报率
Y^t = {y_1^t > y_2^t ... > y_N^t} 表示股票的最优排序(分数),对于任意两个股票s_i, s_j \in S,如果 r_i^t > r_j^t ,则我们认为 y_i^t > y_j^t
T表示股票的观测窗口
STHAN-SR 的神经网络结构
2. Temporal Evolution of Stock Prices
1)Feature Extraction
把 T-days 的数据输入给神经网络,对于每只股票计算5个时序相关的特征:1-day 回报率,5,10,20,30天均值,并把这5个特征值组成一个 vector q_\tau 表示 day-\tau 的特征
注意,论文虽然使用了 LSTM 来获得股票时间序列上的关系,但并没有直接用 LSTM 来预测最终收益,只是利用 LSTM 中形成的隐藏层
LSTM 只是 STHAN-SR 神经网络里面的其中一层
2)Temporal Attention
论文设计了一种 temporal attention 机制,能够知道怎么对那些能够影响未来股价的历史数据做加权
定义
\beta_\tau 表示学习到的某天的注意力权重,使用 softmax 归一化,关于 LSTM + attention 机制的理解,可以 google 一下其他的资料
这个公式大概的意思就是,要学习出历史上哪些天对股票未来的价格有重大的影响
特别注明一下(说实话我也看的不是特别懂,这个地方是猜测的):
- h_\tau^T 是h_\tau的转置矩阵
- W 是一个 attention 机制学习到的一个线性转换,因为 h_\tau 是一个 d 维向量,但是 \overline{h}_t 是一个 d x T 矩阵,需要 W 来转换
- \tau不同,\beta_\tau 的分母感觉是不同的
- \zeta (\overline{h}_t) 计算的是过去 T 天对当下股价的影响
3)Hawkes Attention
hawkes process 其实1971年就有了。It has been shown in financial literature that Hawkes process can be used to modelhistoric stock prices and predict future trends
对任意一只股票,计算时间序列上的特征
其中:
- \epsilon是一个刺激参数
- \gamma是一个衰减参数
Spatial Stock Hypergraph Feature Extraction
Stock Hypergraph Construction
关于股票的相关性建模,作者使用了超图
(待,感觉这篇论文很多地方写的都很粗放,看的一知半解,先放一放)