基于动态高阶关系和事件驱动的股票价格预测

hong · 发表于 2025-11-20 20:12:14

摘要

本文提出了一种新模型，旨在解释多元数据中的极端共动性及时间序列依赖性。模型结合了Hawkes过程层，以捕捉突发共动，增强市场动态的时间表示。引入动态超图，适应股市中的高阶（群体而非对偶）关系。在真实世界基准上的广泛实验表明，该方法在预测性能和投资组合稳定性方面表现出色。

简介

2023年股市市值约为111万亿美元，快速增长，股价间复杂依赖性增强。深度学习方法被广泛应用于建模股票间非线性关系，推动股价预测进入新阶段。“高阶关系”概念扩展了随机依赖，涵盖股票价格的群体依赖和极端依赖（高阶矩）。同行业股票对金融条件的反应相似，可能导致极端共动现象，对风险管理至关重要。

深度学习方法结合超图学习和霍克斯过程用于股票价格预测。超图允许多个节点通过超边连接，适合建模股票间的高阶关系。图神经网络（GNN）与超图学习结合，提升预测能力。霍克斯过程动态构建强度函数，捕捉时间序列的尾部分布。霍克斯过程有效建模金融事件（如交易）的突发时间依赖性。

股票价格的极端共动性和复杂关系尚未得到有效建模，现有方法无法解释极端共动现象。本文提出的新模型结合时间学习和超图建模，利用自注意力机制提升时间学习效率，采用霍克斯过程捕捉突变和共动模式。动态和预定义超图结合，建模随时间演变的高阶关系。模型在真实数据集上表现优越，超越现有基线，验证了各组成部分的有效性。

相关工作

基于Transformer模型

Transformer模型通过自注意力机制有效建模长期依赖，推动了深度学习的进步，尤其在自然语言处理领域。该模型被应用于时间序列预测，特别是股票价格预测，面临捕捉个股时间模式和复杂股间关系的挑战。HMG-TF模型专为金融市场设计，考虑局部依赖和层次结构。DTML模型利用时间和数据轴的注意力机制，学习非对称和动态的股票相关性。MASTER模型在DTML基础上，采用跨时间、股票和时间维度的序列注意力机制，有效建模跨时间相关性。

基于图模型

图神经网络（GNNs）用于从图结构数据中学习模式，广泛应用于社交网络、交通流和化学结构等领域。在股票价格预测中，GNNs 能建模复杂依赖关系，提升预测性能。RSR 模型利用行业和网络元数据，动态建模股票关系。RTGCN 通过构建三维图，整合时间和关系信息，增强关系建模。超图模型应对传统图模型的局限，支持高阶关系建模。STHAN-SR 使用行业和维基数据构建超图，结合超图卷积和注意力机制。ESTIMATE 通过相关性增强和小波超图卷积，捕捉局部性并提高计算效率。

预备知识

霍克斯过程

时间点过程（TPP）是一种建模连续时间轴上离散事件的随机过程，广泛应用于金融等领域。霍克斯过程是一种自激励的TPP，事件的发生会增加后续事件的发生概率。霍克斯过程的强度函数为：

，其中μ为基础强度，ϕ(t)为衰减函数。霍克斯过程可动态描述过去事件对未来事件的影响。在股市中，霍克斯过程用于建模极端价格波动和事件间的相关性，提供金融风险管理和投资策略的洞察。

超图学习

传统图仅能建模成对关系，超图通过单个边连接多个节点，捕捉更复杂的高阶关系。超图学习首次由Zhou等人于2006年提出，作为超图结构上的传播过程。超图定义为G = (V, E, W)，其中V为节点集，E为超边集，W为超边权重的对角矩阵。超图的结构可用|V| × |E|的关联矩阵H表示，矩阵元素h(k, e)定义为：

该关联矩阵灵活地捕捉传统成对连接无法建模的复杂高阶关系。

方法

问题定义

使用标准化的OHLCV数据和技术指标（如移动平均、MACD、RSI）预测股票价格变化，而非绝对价格。OHLCV数据包括开盘、最高、最低、收盘和成交量，价格变化的相对值称为OHLCV比率。定义回报比率为在τ天内的收盘价变化，允许不同股票之间的价格变动归一化。

任务定义为：给定历史数据X，预测回报比率r，目标是学习函数f，使得T_{T+τ} = f(X; θ) ∈ R^S。

最优参数θ通过最小化风险函数L获得。

时间动态表征学习

特征嵌入：通过全连接层将输入特征嵌入多维潜在空间，使用正弦位置编码保持时间序列的顺序信息。

股票间注意力：采用自注意力机制替代RNN，解决长期依赖问题，使用时间掩码保持数据的顺序性。

增强模型对时间特征的表示，多个注意力头的输出被连接并线性变换，结合残差连接以保留重要特征。

经过多头注意力后，输出通过两层全连接层（ReLU激活和dropout）处理，并应用残差连接。

hong · 发表于 2025-11-20 20:12:49

增强和聚合时间表征

引入Hawkes过程的强度函数层，以动态建模事件间的相互作用，克服静态参数化的不足。使用历史上下文H的切片来学习基础强度(μ_st)、激励因子(η_st)和衰减率(γ_st)，并通过softplus激活函数确保γ_st和λ_st为正。

通过共享权重构建参数，捕捉高市场波动期间股票的同步行为。

将Hawkes过程的强度函数与历史上下文H结合，生成增强的时间表示H^8。

采用时间注意力机制聚合时间信息，使用最后时间步的上下文向量作为查询，确保关注关键时间点的信息。

基于超图的高阶关系表示学习

构造预定义超图。构建预定义超图 G = (V, E, W) 来模拟股市关系，其中 V 为股票节点，E 为超边（行业和历史价格相关性），W 为超边权重的对角矩阵。

小波超图卷积。使用波浪超图卷积模型，基于超图拉普拉斯算子 ∆ 进行结构关系建模，利用傅里叶基和波浪基进行卷积操作。

动态超图结构学习。动态超图结构学习采用低秩方法，构建动态超图的发生矩阵 A，结合时间变化的信息，利用股票表示 Ξ 更新节点表示，得到动态表示 Ξ ˜。

模型输出

结合股票表示 Ξ、预定义表示 Ξ ˆ 和动态表示 Ξ ˜，使用可学习权重的加权和生成最终表示 z。

最终表示 Z ˆ 用于通过两层 MLP（ReLU 激活）预测每只股票的回报率。损失函数定义为真实回报率 r 与预测回报率 r ˆ 之间的均方根误差（RMSE）。

实验

进行实验以回答三个研究问题：

RQ1：提出的方法与现有最先进方法的性能比较。

RQ2：方法是否有效捕捉尾部依赖。

RQ3：动态超图学习是否有效集成和实现。

实验设置

数据集：使用S&P500市场数据，排除早期未上市股票，最终包含463只股票，分为10个阶段（24个月训练、4个月验证、8个月测试）。

实现细节：模型在PyTorch中实现，使用NVIDIA RTX A6000 GPU，超参数通过网格搜索优化，最终参数包括模型大小d e = 32，动态超边数k = 64，学习率0.0001，回溯窗口20天，前瞻窗口5天，多头注意力机制头数4，采用K=20的买持卖策略。

评估指标：预测性能使用信息系数（IC）、排名信息系数（RankIC）、Top-K精度（Prec@K）；投资组合性能使用收益率、夏普比率（SR）、最大回撤（MDD）。

基线模型：与多种最先进模型比较，包括Transformer（DTML、MASTER）、图模型（RSR、RT-GCN）和超图模型（STHAN-SR、ESTIMATE）。

RQ1：整体表现

表1展示了各模型在不同阶段的预测性能，提出的模型在大多数阶段表现优于其他基线模型，整体平均得分在IC、RankIC和Prec@10上均领先。提出的模型在ESTIMATE的IC和RankIC得分在第2和第4阶段最高，整体平均值最佳，得益于其架构和预定义超图的使用。

表2显示了各模型的平均投资组合表现，提出的模型在收益、夏普比率(SR)和最大回撤(MDD)上持续优于其他模型，表明其在捕捉突发股价变动和构建稳定投资组合方面的能力。

RQ2：长尾依赖系数

评估下尾依赖系数（LTDC），衡量极端下跌的同步性，影响投资者行为和投资组合表现。LTDC定义为：

使用经验累积分布函数计算LTDC，构建股票LTDC矩阵。图3展示了第8阶段的LTDC矩阵，涵盖市值前20家公司，模型有效捕捉了GOOG与GOOGL及V与MA的关系。其他模型未能捕捉这些关系，表明Hawkes过程强度函数的设计有效性。

RQ3：动态超图结构分析

分析动态超图结构，关注市值前20家公司和10个超边，使用蓝色表示弱连接，红色表示强连接。AAPL和MSFT在2020年10月与超边2和10连接较强，2020年11月3日后连接减弱，超边2连接显著增强。其他主要公司（如AMZN、BRK-B、UNH、JPM）也观察到类似模式，显示动态超图有效捕捉股票关系的演变。GOOG-GOOGL和V-MA在多个时间步中保持与同一超边的连接，表明动态超图保留了领域知识和时间动态。

总结

本文提出了一个新模型用于准确的股票价格预测，捕捉动态和高阶关系。模型包含Hawkes过程层，以识别共享运动模式并增强时间表示。通过预定义和动态超图，有效捕捉股票间的高阶关系。在真实的美国市场数据上进行的广泛实验显示，该模型在预测性能和投资组合稳定性上优于现有方法。通过详细分析验证了模型各组成部分的有效性。未来工作将集中于增强模型的鲁棒性，特别是在不稳定表现期间，以实现不同市场条件下的一致可靠性。

		自动登录	找回密码
密码			立即注册

基于动态高阶关系和事件驱动的股票价格预测

浏览过的版块