hong 发表于 2025-11-20 20:12:14

基于动态高阶关系和事件驱动的股票价格预测

摘要本文提出了一种新模型,旨在解释多元数据中的极端共动性及时间序列依赖性。模型结合了Hawkes过程层,以捕捉突发共动,增强市场动态的时间表示。引入动态超图,适应股市中的高阶(群体而非对偶)关系。在真实世界基准上的广泛实验表明,该方法在预测性能和投资组合稳定性方面表现出色。简介2023年股市市值约为111万亿美元,快速增长,股价间复杂依赖性增强。深度学习方法被广泛应用于建模股票间非线性关系,推动股价预测进入新阶段。“高阶关系”概念扩展了随机依赖,涵盖股票价格的群体依赖和极端依赖(高阶矩)。同行业股票对金融条件的反应相似,可能导致极端共动现象,对风险管理至关重要。深度学习方法结合超图学习和霍克斯过程用于股票价格预测。超图允许多个节点通过超边连接,适合建模股票间的高阶关系。图神经网络(GNN)与超图学习结合,提升预测能力。霍克斯过程动态构建强度函数,捕捉时间序列的尾部分布。霍克斯过程有效建模金融事件(如交易)的突发时间依赖性。https://pic2.zhimg.com/v2-263555f655374862969876bc658db4ff_1440w.jpg股票价格的极端共动性和复杂关系尚未得到有效建模,现有方法无法解释极端共动现象。本文提出的新模型结合时间学习和超图建模,利用自注意力机制提升时间学习效率,采用霍克斯过程捕捉突变和共动模式。动态和预定义超图结合,建模随时间演变的高阶关系。模型在真实数据集上表现优越,超越现有基线,验证了各组成部分的有效性。相关工作基于Transformer模型Transformer模型通过自注意力机制有效建模长期依赖,推动了深度学习的进步,尤其在自然语言处理领域。该模型被应用于时间序列预测,特别是股票价格预测,面临捕捉个股时间模式和复杂股间关系的挑战。HMG-TF模型专为金融市场设计,考虑局部依赖和层次结构。DTML模型利用时间和数据轴的注意力机制,学习非对称和动态的股票相关性。MASTER模型在DTML基础上,采用跨时间、股票和时间维度的序列注意力机制,有效建模跨时间相关性。基于图模型图神经网络(GNNs)用于从图结构数据中学习模式,广泛应用于社交网络、交通流和化学结构等领域。在股票价格预测中,GNNs 能建模复杂依赖关系,提升预测性能。RSR 模型利用行业和网络元数据,动态建模股票关系。RTGCN 通过构建三维图,整合时间和关系信息,增强关系建模。超图模型应对传统图模型的局限,支持高阶关系建模。STHAN-SR 使用行业和维基数据构建超图,结合超图卷积和注意力机制。ESTIMATE 通过相关性增强和小波超图卷积,捕捉局部性并提高计算效率。预备知识霍克斯过程时间点过程(TPP)是一种建模连续时间轴上离散事件的随机过程,广泛应用于金融等领域。霍克斯过程是一种自激励的TPP,事件的发生会增加后续事件的发生概率。霍克斯过程的强度函数为:https://pic2.zhimg.com/v2-16a0abf6225d0d1f31e78404de1782d7_1440w.jpg,其中μ为基础强度,ϕ(t)为衰减函数。霍克斯过程可动态描述过去事件对未来事件的影响。在股市中,霍克斯过程用于建模极端价格波动和事件间的相关性,提供金融风险管理和投资策略的洞察。超图学习传统图仅能建模成对关系,超图通过单个边连接多个节点,捕捉更复杂的高阶关系。超图学习首次由Zhou等人于2006年提出,作为超图结构上的传播过程。超图定义为G = (V, E, W),其中V为节点集,E为超边集,W为超边权重的对角矩阵。超图的结构可用|V| × |E|的关联矩阵H表示,矩阵元素h(k, e)定义为:https://pic2.zhimg.com/v2-1d82ceb0aac03c0e3161e12de6db968f_1440w.jpg该关联矩阵灵活地捕捉传统成对连接无法建模的复杂高阶关系。方法问题定义使用标准化的OHLCV数据和技术指标(如移动平均、MACD、RSI)预测股票价格变化,而非绝对价格。OHLCV数据包括开盘、最高、最低、收盘和成交量,价格变化的相对值称为OHLCV比率。定义回报比率为在τ天内的收盘价变化,允许不同股票之间的价格变动归一化。任务定义为:给定历史数据X,预测回报比率r,目标是学习函数f,使得T_{T+τ} = f(X; θ) ∈ R^S。https://pica.zhimg.com/v2-7eac7dc0a8180275cc24313cdf90014e_1440w.jpg最优参数θ通过最小化风险函数L获得。https://pic4.zhimg.com/v2-4033c531c0e39362fbcdfc4d3679d077_1440w.jpghttps://pic4.zhimg.com/v2-4746578f47bf5423da0b5af8c4baf557_1440w.jpg时间动态表征学习特征嵌入:通过全连接层将输入特征嵌入多维潜在空间,使用正弦位置编码保持时间序列的顺序信息。https://pic1.zhimg.com/v2-92ec5c5052c607a96514892b4639c92a_1440w.jpg股票间注意力:采用自注意力机制替代RNN,解决长期依赖问题,使用时间掩码保持数据的顺序性。https://pic3.zhimg.com/v2-5b15d60cdcd2d56ae538f53dedf4014e_1440w.jpg增强模型对时间特征的表示,多个注意力头的输出被连接并线性变换,结合残差连接以保留重要特征。经过多头注意力后,输出通过两层全连接层(ReLU激活和dropout)处理,并应用残差连接。https://pic4.zhimg.com/v2-c64dc9186c539da3d309f56c3220befb_1440w.jpg

hong 发表于 2025-11-20 20:12:49

增强和聚合时间表征引入Hawkes过程的强度函数层,以动态建模事件间的相互作用,克服静态参数化的不足。使用历史上下文H的切片来学习基础强度(μ_st)、激励因子(η_st)和衰减率(γ_st),并通过softplus激活函数确保γ_st和λ_st为正。https://pic2.zhimg.com/v2-28ca49ad5ffbfe1d51afc92257ed7563_1440w.jpg通过共享权重构建参数,捕捉高市场波动期间股票的同步行为。https://pic1.zhimg.com/v2-23e3fb91b3afcfcf70f4aa75094dac9a_1440w.jpg将Hawkes过程的强度函数与历史上下文H结合,生成增强的时间表示H^8。https://pica.zhimg.com/v2-8361b23c7b841c8f718b2c675c379432_1440w.jpg采用时间注意力机制聚合时间信息,使用最后时间步的上下文向量作为查询,确保关注关键时间点的信息。https://pic4.zhimg.com/v2-3bf982ed16b7fb8d57ea33ab2c42428b_1440w.jpg基于超图的高阶关系表示学习构造预定义超图。构建预定义超图 G = (V, E, W) 来模拟股市关系,其中 V 为股票节点,E 为超边(行业和历史价格相关性),W 为超边权重的对角矩阵。小波超图卷积。使用波浪超图卷积模型,基于超图拉普拉斯算子 ∆ 进行结构关系建模,利用傅里叶基和波浪基进行卷积操作。https://pica.zhimg.com/v2-a1bb4ea3d99025040c79cbebf4eca0ea_1440w.jpg动态超图结构学习。动态超图结构学习采用低秩方法,构建动态超图的发生矩阵 A,结合时间变化的信息,利用股票表示 Ξ 更新节点表示,得到动态表示 Ξ ˜。https://pic1.zhimg.com/v2-c51cb5a57b41b436dce659205cdcf048_1440w.jpghttps://pica.zhimg.com/v2-8a8e2f2d1a887cbe3f2e4cb664f179a4_1440w.jpg模型输出结合股票表示 Ξ、预定义表示 Ξ ˆ 和动态表示 Ξ ˜,使用可学习权重的加权和生成最终表示 z。https://pic3.zhimg.com/v2-c64a9582cb5884fafedfc0bc967bd896_1440w.jpg最终表示 Z ˆ 用于通过两层 MLP(ReLU 激活)预测每只股票的回报率。损失函数定义为真实回报率 r 与预测回报率 r ˆ 之间的均方根误差(RMSE)。https://picx.zhimg.com/v2-fa21f141b31bcc1101da962bbd327149_1440w.jpg实验进行实验以回答三个研究问题:RQ1:提出的方法与现有最先进方法的性能比较。RQ2:方法是否有效捕捉尾部依赖。RQ3:动态超图学习是否有效集成和实现。实验设置数据集:使用S&P500市场数据,排除早期未上市股票,最终包含463只股票,分为10个阶段(24个月训练、4个月验证、8个月测试)。实现细节:模型在PyTorch中实现,使用NVIDIA RTX A6000 GPU,超参数通过网格搜索优化,最终参数包括模型大小d e = 32,动态超边数k = 64,学习率0.0001,回溯窗口20天,前瞻窗口5天,多头注意力机制头数4,采用K=20的买持卖策略。评估指标:预测性能使用信息系数(IC)、排名信息系数(RankIC)、Top-K精度(Prec@K);投资组合性能使用收益率、夏普比率(SR)、最大回撤(MDD)。基线模型:与多种最先进模型比较,包括Transformer(DTML、MASTER)、图模型(RSR、RT-GCN)和超图模型(STHAN-SR、ESTIMATE)。RQ1:整体表现表1展示了各模型在不同阶段的预测性能,提出的模型在大多数阶段表现优于其他基线模型,整体平均得分在IC、RankIC和Prec@10上均领先。提出的模型在ESTIMATE的IC和RankIC得分在第2和第4阶段最高,整体平均值最佳,得益于其架构和预定义超图的使用。https://pic1.zhimg.com/v2-35d09f1608c356f1d7ef9e6c459e1936_1440w.jpg表2显示了各模型的平均投资组合表现,提出的模型在收益、夏普比率(SR)和最大回撤(MDD)上持续优于其他模型,表明其在捕捉突发股价变动和构建稳定投资组合方面的能力。https://pic2.zhimg.com/v2-9172b1146af060a67a108a7ce0c7805b_1440w.jpgRQ2:长尾依赖系数评估下尾依赖系数(LTDC),衡量极端下跌的同步性,影响投资者行为和投资组合表现。LTDC定义为:https://pic1.zhimg.com/v2-115af884b1f41b8435f3dc8e1fbf0e28_1440w.jpg使用经验累积分布函数计算LTDC,构建股票LTDC矩阵。图3展示了第8阶段的LTDC矩阵,涵盖市值前20家公司,模型有效捕捉了GOOG与GOOGL及V与MA的关系。其他模型未能捕捉这些关系,表明Hawkes过程强度函数的设计有效性。https://pic1.zhimg.com/v2-f6d6b81dd184d1765565aa953a9241e6_1440w.jpgRQ3:动态超图结构分析分析动态超图结构,关注市值前20家公司和10个超边,使用蓝色表示弱连接,红色表示强连接。AAPL和MSFT在2020年10月与超边2和10连接较强,2020年11月3日后连接减弱,超边2连接显著增强。其他主要公司(如AMZN、BRK-B、UNH、JPM)也观察到类似模式,显示动态超图有效捕捉股票关系的演变。GOOG-GOOGL和V-MA在多个时间步中保持与同一超边的连接,表明动态超图保留了领域知识和时间动态。https://pic2.zhimg.com/v2-48b7607c497dd3eb5d2e896b844992e9_1440w.jpg总结本文提出了一个新模型用于准确的股票价格预测,捕捉动态和高阶关系。模型包含Hawkes过程层,以识别共享运动模式并增强时间表示。通过预定义和动态超图,有效捕捉股票间的高阶关系。在真实的美国市场数据上进行的广泛实验显示,该模型在预测性能和投资组合稳定性上优于现有方法。通过详细分析验证了模型各组成部分的有效性。未来工作将集中于增强模型的鲁棒性,特别是在不稳定表现期间,以实现不同市场条件下的一致可靠性。
页: [1]
查看完整版本: 基于动态高阶关系和事件驱动的股票价格预测