找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 77|回复: 1

基于动态高阶关系和事件驱动的股票价格预测

[复制链接]

708

主题

140

回帖

2788

积分

金牌会员

积分
2788
发表于 2025-11-20 20:12:14 | 显示全部楼层 |阅读模式
摘要
本文提出了一种新模型,旨在解释多元数据中的极端共动性及时间序列依赖性。模型结合了Hawkes过程层,以捕捉突发共动,增强市场动态的时间表示。引入动态超图,适应股市中的高阶(群体而非对偶)关系。在真实世界基准上的广泛实验表明,该方法在预测性能和投资组合稳定性方面表现出色。
简介
2023年股市市值约为111万亿美元,快速增长,股价间复杂依赖性增强。深度学习方法被广泛应用于建模股票间非线性关系,推动股价预测进入新阶段。“高阶关系”概念扩展了随机依赖,涵盖股票价格的群体依赖和极端依赖(高阶矩)。同行业股票对金融条件的反应相似,可能导致极端共动现象,对风险管理至关重要。
深度学习方法结合超图学习和霍克斯过程用于股票价格预测。超图允许多个节点通过超边连接,适合建模股票间的高阶关系。图神经网络(GNN)与超图学习结合,提升预测能力。霍克斯过程动态构建强度函数,捕捉时间序列的尾部分布。霍克斯过程有效建模金融事件(如交易)的突发时间依赖性。
股票价格的极端共动性和复杂关系尚未得到有效建模,现有方法无法解释极端共动现象。本文提出的新模型结合时间学习和超图建模,利用自注意力机制提升时间学习效率,采用霍克斯过程捕捉突变和共动模式。动态和预定义超图结合,建模随时间演变的高阶关系。模型在真实数据集上表现优越,超越现有基线,验证了各组成部分的有效性。
相关工作
基于Transformer模型
Transformer模型通过自注意力机制有效建模长期依赖,推动了深度学习的进步,尤其在自然语言处理领域。该模型被应用于时间序列预测,特别是股票价格预测,面临捕捉个股时间模式和复杂股间关系的挑战。HMG-TF模型专为金融市场设计,考虑局部依赖和层次结构。DTML模型利用时间和数据轴的注意力机制,学习非对称和动态的股票相关性。MASTER模型在DTML基础上,采用跨时间、股票和时间维度的序列注意力机制,有效建模跨时间相关性。
基于图模型
图神经网络(GNNs)用于从图结构数据中学习模式,广泛应用于社交网络、交通流和化学结构等领域。在股票价格预测中,GNNs 能建模复杂依赖关系,提升预测性能。RSR 模型利用行业和网络元数据,动态建模股票关系。RTGCN 通过构建三维图,整合时间和关系信息,增强关系建模。超图模型应对传统图模型的局限,支持高阶关系建模。STHAN-SR 使用行业和维基数据构建超图,结合超图卷积和注意力机制。ESTIMATE 通过相关性增强和小波超图卷积,捕捉局部性并提高计算效率。
预备知识
霍克斯过程
时间点过程(TPP)是一种建模连续时间轴上离散事件的随机过程,广泛应用于金融等领域。霍克斯过程是一种自激励的TPP,事件的发生会增加后续事件的发生概率。霍克斯过程的强度函数为:
,其中μ为基础强度,ϕ(t)为衰减函数。霍克斯过程可动态描述过去事件对未来事件的影响。在股市中,霍克斯过程用于建模极端价格波动和事件间的相关性,提供金融风险管理和投资策略的洞察。
超图学习
传统图仅能建模成对关系,超图通过单个边连接多个节点,捕捉更复杂的高阶关系。超图学习首次由Zhou等人于2006年提出,作为超图结构上的传播过程。超图定义为G = (V, E, W),其中V为节点集,E为超边集,W为超边权重的对角矩阵。超图的结构可用|V| × |E|的关联矩阵H表示,矩阵元素h(k, e)定义为:
该关联矩阵灵活地捕捉传统成对连接无法建模的复杂高阶关系。
方法
问题定义
使用标准化的OHLCV数据和技术指标(如移动平均、MACD、RSI)预测股票价格变化,而非绝对价格。OHLCV数据包括开盘、最高、最低、收盘和成交量,价格变化的相对值称为OHLCV比率。定义回报比率为在τ天内的收盘价变化,允许不同股票之间的价格变动归一化。
任务定义为:给定历史数据X,预测回报比率r,目标是学习函数f,使得T_{T+τ} = f(X; θ) ∈ R^S。
最优参数θ通过最小化风险函数L获得。
时间动态表征学习
特征嵌入:通过全连接层将输入特征嵌入多维潜在空间,使用正弦位置编码保持时间序列的顺序信息。
股票间注意力:采用自注意力机制替代RNN,解决长期依赖问题,使用时间掩码保持数据的顺序性。
增强模型对时间特征的表示,多个注意力头的输出被连接并线性变换,结合残差连接以保留重要特征。
经过多头注意力后,输出通过两层全连接层(ReLU激活和dropout)处理,并应用残差连接。


708

主题

140

回帖

2788

积分

金牌会员

积分
2788
 楼主| 发表于 2025-11-20 20:12:49 | 显示全部楼层
增强和聚合时间表征
引入Hawkes过程的强度函数层,以动态建模事件间的相互作用,克服静态参数化的不足。使用历史上下文H的切片来学习基础强度(μ_st)、激励因子(η_st)和衰减率(γ_st),并通过softplus激活函数确保γ_st和λ_st为正。
通过共享权重构建参数,捕捉高市场波动期间股票的同步行为。
将Hawkes过程的强度函数与历史上下文H结合,生成增强的时间表示H^8。
采用时间注意力机制聚合时间信息,使用最后时间步的上下文向量作为查询,确保关注关键时间点的信息。
基于超图的高阶关系表示学习
构造预定义超图。构建预定义超图 G = (V, E, W) 来模拟股市关系,其中 V 为股票节点,E 为超边(行业和历史价格相关性),W 为超边权重的对角矩阵。
小波超图卷积。使用波浪超图卷积模型,基于超图拉普拉斯算子 ∆ 进行结构关系建模,利用傅里叶基和波浪基进行卷积操作。
动态超图结构学习。动态超图结构学习采用低秩方法,构建动态超图的发生矩阵 A,结合时间变化的信息,利用股票表示 Ξ 更新节点表示,得到动态表示 Ξ ˜。
模型输出
结合股票表示 Ξ、预定义表示 Ξ ˆ 和动态表示 Ξ ˜,使用可学习权重的加权和生成最终表示 z。
最终表示 Z ˆ 用于通过两层 MLP(ReLU 激活)预测每只股票的回报率。损失函数定义为真实回报率 r 与预测回报率 r ˆ 之间的均方根误差(RMSE)。
实验
进行实验以回答三个研究问题:
RQ1:提出的方法与现有最先进方法的性能比较。
RQ2:方法是否有效捕捉尾部依赖。
RQ3:动态超图学习是否有效集成和实现。
实验设置
数据集:使用S&P500市场数据,排除早期未上市股票,最终包含463只股票,分为10个阶段(24个月训练、4个月验证、8个月测试)。
实现细节:模型在PyTorch中实现,使用NVIDIA RTX A6000 GPU,超参数通过网格搜索优化,最终参数包括模型大小d e = 32,动态超边数k = 64,学习率0.0001,回溯窗口20天,前瞻窗口5天,多头注意力机制头数4,采用K=20的买持卖策略。
评估指标:预测性能使用信息系数(IC)、排名信息系数(RankIC)、Top-K精度(Prec@K);投资组合性能使用收益率、夏普比率(SR)、最大回撤(MDD)。
基线模型:与多种最先进模型比较,包括Transformer(DTML、MASTER)、图模型(RSR、RT-GCN)和超图模型(STHAN-SR、ESTIMATE)。
RQ1:整体表现
表1展示了各模型在不同阶段的预测性能,提出的模型在大多数阶段表现优于其他基线模型,整体平均得分在IC、RankIC和Prec@10上均领先。提出的模型在ESTIMATE的IC和RankIC得分在第2和第4阶段最高,整体平均值最佳,得益于其架构和预定义超图的使用。
表2显示了各模型的平均投资组合表现,提出的模型在收益、夏普比率(SR)和最大回撤(MDD)上持续优于其他模型,表明其在捕捉突发股价变动和构建稳定投资组合方面的能力。
RQ2:长尾依赖系数
评估下尾依赖系数(LTDC),衡量极端下跌的同步性,影响投资者行为和投资组合表现。LTDC定义为:
使用经验累积分布函数计算LTDC,构建股票LTDC矩阵。图3展示了第8阶段的LTDC矩阵,涵盖市值前20家公司,模型有效捕捉了GOOG与GOOGL及V与MA的关系。其他模型未能捕捉这些关系,表明Hawkes过程强度函数的设计有效性。
RQ3:动态超图结构分析
分析动态超图结构,关注市值前20家公司和10个超边,使用蓝色表示弱连接,红色表示强连接。AAPL和MSFT在2020年10月与超边2和10连接较强,2020年11月3日后连接减弱,超边2连接显著增强。其他主要公司(如AMZN、BRK-B、UNH、JPM)也观察到类似模式,显示动态超图有效捕捉股票关系的演变。GOOG-GOOGL和V-MA在多个时间步中保持与同一超边的连接,表明动态超图保留了领域知识和时间动态。
总结
本文提出了一个新模型用于准确的股票价格预测,捕捉动态和高阶关系。模型包含Hawkes过程层,以识别共享运动模式并增强时间表示。通过预定义和动态超图,有效捕捉股票间的高阶关系。在真实的美国市场数据上进行的广泛实验显示,该模型在预测性能和投资组合稳定性上优于现有方法。通过详细分析验证了模型各组成部分的有效性。未来工作将集中于增强模型的鲁棒性,特别是在不稳定表现期间,以实现不同市场条件下的一致可靠性。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|最好的中文黄金、外汇、加密货币交流论坛

GMT+8, 2025-12-1 07:02 , Processed in 0.015879 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表