热门资讯> 正文
2025-06-03 08:00
(转自:东方金工研究)
核心观点
自适应动态因子加权模型
金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题,这些问题通常会影响模型稳定性以及样本外的泛化能力。本文提出一种RNN+Neural ODE+MLP融合模型,将时序数据建模为微分动力系统,然后进行数据重构和特征提取,从而提升模型样本外的选股鲁棒性。整个模型由以下部分构成:
通过RNN和Neural ODE模型构建变分自编码层(VAE层),利用RNN进行时序数据的压缩和降维,再将神经微分方程(Neural ODE)学习时序数据隐含的时序演化规律,将数据进行去噪和重构。
最后我们将重构去噪后的数据输入MLP层进行alpha信息的捕捉和挖掘,从而对未来收益率标签进行拟合。
各模型因子对比
通过将Baseline模型和新模型因子多头绩效的对比,我们得到以下结论:
相较于Baseline模型,除2020年和今年,其余各年份Model1因子的多头超额均能大幅跑赢。而分组超额来看,Model1的Top组和Grp1组超额相较于Baseline模型分别提升了1.91%和3.07%,说明新模型相对于Baseline能大幅改善多头的表现。
在2024年出现较为极端的市场环境下,Model1因子多头超额相较于Baseline模型提升了6.63%,最大回撤也有所下降,说明Model1抗风险能力相对更强。
在各个回测区间,Model1因子的多头组合换手率相较于Baseline均有一定程度的下降。这意味着实盘可能有更高的交易成本优势。
Baseline模型和Model1模型多头超额净值走势趋同度较高,各年度的最大回撤区间基本上重合,说明各类模型从相同量价特征中提取的alpha信息一致性相对较高。
因子选股能力和行业轮动能力的表现
新模型2018年以来在中证全指上十日RankIC均值为16.33%,top组年化超额分别为54.54%。相较于基准,新模型选股效果均有明显提升。行业轮动方面,2018年以来,新模型RankIC可达12.55%,Top组年化超额可达25.27%,各项指标表现也是显著战胜基准。
本文生成因子也可以直接应用于指数增强策略,在各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,在沪深300、中证500和中证1000增强策略上2018年以来新模型年化超额收益率分别为16.67%,21.37%和32.41%,信息比率分别为3.14、3.21、4.27。
一
引言
在量化金融领域,随着大数据技术的飞速发展,深度学习模型凭借其强大的数据处理和模式识别能力,在量化投资中展现出巨大潜力。
前期报告《基于循环神经网络的多频率因子挖掘》、《基于残差网络端到端因子挖掘模型》、《融合基本面信息的ASTGNN因子挖掘模型》和《基于神经网络的alpha和beta因子协同挖掘模型》中,我们利用了带图结构的循环神经网络(RNN & ASTGNN)、残差网络(ResNets)和决策树模型等搭建了端到端AI量价选股模型框架,这套框架的输入是个股不同频率最原始的高开低收量价数据以及一些常见的基本面数据等,而最终的输出则是具有较强选股能力的alpha因子和风险因子。其中alpha因子用于构建个股未来收益率预期值,而风险因子主要用于计算组合暴露,通过构建相应的风险约束最终生成我们的选股组合。我们将其该框架生成的因子应用于选股策略。回测结果显示该策略在样本外有着十分显著的选股效果。
这套AI量价模型框架主要是基于多个不同频率数据集搭建的,这些数据集分别是风险因子(risk)、基本面(fund)、周度(week)、日度(day)、分钟线(ms)和Level-2(l2)数据集。其中风险因子数据集主要由Barra风险因子组成,目标是为了生成机器学习风险因子使用,而基本面数据集是由四类常见的基本面因子组成,如估值、成长、超预期等;周度和分钟线数据集我们分别是将每五个交易日日K线和每日半小时K线形成矩阵数据,然后将这些矩阵通过ResNets提取出相应时间频度的特征向量而形成的,而Level-2则是将原始数据通过人工合成成日频因子的方式形成的。
整个AI综合因子生成的框架分为四个部分,数据预处理、提取因子单元、因子加权以及因子汇总。数据预处理包括去极值标准化和补充缺失值三个步骤,而提取因子单元则是通过RNN、残差网络和图模型等将输入的特征转化成一系列具有一定选股能力的弱因子,与此同时我们还使用ABCM模型(参见报告《ABCM:基于神经网络的alpha和beta因子协同挖掘模型》)同时生成风险因子,因子加权则是利用决策树等对这些神经网络自动挖掘生成的弱因子进行二次加权,其中考虑到风险因子和alpha因子的性质(风险因子长期和未来收益率方向无序且不可预测,但短期具有一定的可预测性,alpha因子长期与未来收益率方向一致,且函数关系较为稳定),我们对两部分因子进行不同方式的二次加权,最后将两部分因子通过人工方式进行汇总形成综合得分,整个流程如下图所示:
上述框架中,由于个股的停牌、财报发布以及突发事件等的影响,RNN模型的输入数据往往存在缺失值,较大的噪声、数据异常等问题,而由于神经网络通常对数据微小变化较为敏感,因此如何补充缺失值以及剥离数据中的噪声影响对于模型选股能力十分重要。前期报告《基于抗噪的AI量价模型改进方案》中我们提出了基于对抗训练的方式来提升模型的鲁棒性和抗噪能力, 该方法主要是构建抗噪损失函数来训练模型,从而使得模型参数最终收敛到噪声低敏感的最优值点。
本文则是将时序数据视作一个动力系统的衍化过程,通过神经微分方程模型对时序数据自身的衍化函数建模,让微分动力系统学习出潜在的数据时序衍化规律,从而对时序数据进行重构,最终将重构数据放到新模型中训练达到降低模型输入数据噪声的影响。
二
新模型细节介绍
2.1 神经网络与微分方程的联系
传统神经网络在处理高维空间数据时往往需要使用较多的非线性层,每一层通过前一层的输出来提取特征,所以随着神经网络层数的增多,训练时反向传播过程伴随着会出现梯度爆炸和梯度消失等问题使得神经网络无法有效提取数据中的有效信息甚至训练失败。而残差网络(Residual Network,ResNet)则通过构建跳跃连接(skip connection)允许梯度直接回传至浅层,从而缓解了深层网络训练时普遍存在的梯度消失与网络退化问题,使得构建超深层网络成为可能。残差连接本质上是构建了恒等映射(Identity Mapping)的捷径路径,使网络在无需额外参数的情况下学习输入与输出的残差(即增量变化),实验表明这种设计显著提升了模型对复杂特征的提取能力。
完整的残差网络是由一系列残差块和MLP结构组成,每个残差块均含有恒等映射和残差连接两部分构成,其具有如下图所示结构:
而对于一个标准的带MLP结构的L层残差网络前向传播的过程,我们可以将其表示为如下数学公式形式:
1.3 本文模型结构和损失函数
本文中模型结构可以分为三部分构成,分别为Encoder层、Decoder层和MLP层,这里Encoder和Decoder层合称为变分自编码层(VAE)层,其中Encoder层为RNN结构作用主要是进行数据降维和特征提取,而Decoder层为Neural Jump SDE结构主要作用是拟合时序数据的时间衍化规律,从而对数据进行重构。MLP层主要是对重构数据进行特征提取,最终对个股未来收益率进行预测。整个模型结构和损失函数构建可表示为下图形式:
MLP层有两种设置方案,第一种为全连接层和非线性激活函数构成,此时我们使用预测结果和中性化标准化后的收益率标签直接计算均方误差损失,第二种则是采用我们前期报告《ABCM:基于神经网络的alpha和beta因子协同挖掘模型》中的结构,即通过两个NN-Layer同时生成风险因子和alpha因子,风险因子使用的NN-Layer为带Attention机制的图结构其对应损失函数为R-square,alpha因子的NN-Layer为简单的全连接层其对应损失函数为MSE,最后通过构建因子正交惩罚损失来剥离alpha和风险信息。整个模型的具体结构可表示为如下形式:
该模型核心的想法是通过RNN模型对数据的核心信息进行提取,通过Neural SDE模型进行数据重构,使得重构时序数据与原始数据最大程度逼近的前提下,能关于时间t形成一个连续函数。由于时序数据在时间维度上平滑,此时我们可以认为重构数据的噪声含量占比将大幅下降。最后我们将重构数据通过一个MLP变换得到最终的预测结果。
注:新模型在各种金融问题上用途广泛,除本文用法外,还可用于数据降维:比如分钟线数据提取为日频特征,股票收益率序列数据提取为具有高解释力度的统计量意义下风险因子等;因子加权:股票alpha因子加权对未来多步收益率进行预测。
1.4 新模型重构数据表现
我们使用新模型对股票预处理后的K线数据进行重构,取2013~2022年为训练集,2023年为验证集,2024年为样本外,训练时只使用重构损失和KL散度作为损失函数,统计验证集以及样本外重构损失表现,重构损失使用原始数据与重构数据的MSE损失作为度量的量。验证集损失随迭代步数的变化以及最终模型样本外的损失值曲线以及隐藏层特征 μ 在样本外对未来十天收益率的解释度如下图所示:
通过上图结果,我们可以看出:
1)验证集上损失函数下降过程较为平滑,这说明模型训练过程稳定;
2)模型在2023年验证集上重构损失值为0.2475,2024年样本外的重构损失值为0.3803,这说明模型重构能力在样本外仍具有较好的表现效果;
3)隐藏层在样本外的R-square平均值为20.73%(同期Barra模型的R-square为20.38%),这意味着隐藏层所挖掘的特征在样本外对个股未来收益有较高的解释能力,因此该方法可作为挖掘风险因子的一个新的手段。
二
各模型单因子分析
2.1 回测说明
本文的回测结果中,回测区间为20171229~20250430,若不做特殊说明,各项指标计算方法如下所示:
1. RankIC均值是当天因子与隔日未来十日收益率(T+1~T+11收盘)序列进行计算的,并且每隔十个交易日计算一次,最终将这个RankIC序列取平均得到的。
2. ICIR则是根据上述RankIC序列均值除以序列标准差计算得到的。
3. 分组测试结果中,计算top组的年化超额收益,中证全指股票池上我们是将股票池分成20组,基准则是成分股等权,周度调仓,次日收盘价成交并且不考虑交易成本计算得到的。
4. 多头组周均单边换手率是根据多头组持仓计算得到,而最大回撤和年化波动率则是根据top组超额收益净值计算得到的。
5. 各个股票池均剔除了北交所股票以及上市天数较短的股票。
并且本文将对比以下模型的绩效表现,来说明新模型对原模型的增量作用:
1. Baseline:报告《ABCM:基于神经网络的alpha和beta因子协同挖掘模型》中的模型生成因子。
2. Model1:Neural ODE模型生成因子截面标准化后与Baseline因子截面标准化后等权。
3. Model2:Neural SDE模型生成因子截面标准化后与Baseline因子截面标准化后等权。
4. Model3:Model1因子剥离掉相关短期风险因子后的残差。
2.2 因子中证全指绩效分析
首先,本节我们将展示上述模型生成的因子在中证全指股票池上的选股汇总效果、分年度的超额收益表现以及超额收益的净值走势(其中汇总表现分成2018年至2023年和2024年以及2025年三段进行展示)
1. Model1,Model2相较于Baseline模型的多头超额有较大幅度提升,其中Model1的Top组和Grp1组超额相较于Baseline模型分别提升了1.91%和3.07%,说明新模型相对于Baseline能大幅改善多头的表现。
2. 在2024年较为极端的市场环境下,Model3因子多头超额相较于另外三个模型有大幅度提升,最大回撤也有明显下降,说明通过剥离掉一些短期风险信息以后,得到的Model3抗风险能力相对更强。
3. 在各个回测区间,Model1因子的多头组合换手率相较于Baseline均有一定程度的下降。这意味着实盘可能有更高的交易成本优势。
4. Baseline模型和Model1模型多头超额净值走势趋同度较高,各年度的最大回撤区间基本上重合,说明各类模型从相同量价特征中提取的alpha信息一致性相对较高。
2.3 各模型因子相关系数分析
本节我们分析了所生成因子与各个风险因子的平均相关性结果,可以看出虽然Model3因子是在Model1因子的基础上剥离掉了短期风险,但整体来看,Model3因子在一些风格上的暴露更高比如Beta、Volatility、Liquidity、Value和Certainty等。
三
周频行业轮动绩效分析
本章将展示新模型因子应用于行业轮动策略的绩效表现,回测结果有如下说明:
行业因子合成方法:将选股因子按照行业进行聚合形成行业的得分,聚合时权重设置为个股的流通市值。
备选行业池:所有30个中信一级行业。
组合构建方式:取行业因子排名Top5的行业等权构建组合,基准为30个行业收益率等权,调仓频率为周频,每周五以收盘价格进行买卖交易。
以下是各个模型对应的回测结果:
通过上述图表结果,我们可以看出:
1.各模型均具有较强的行业轮动能力,这说明各类模型学到的alpha信息中均有一定比例来源于行业信息。
2.相较于Baseline模型,Model1模型对应的行业因子RankIC、ICIR、Top组超额等各项指标均有进一步的提升,说明通过模型VAE层对原始数据重构以后,模型能够更充分有效的提取数据的信息,因而行业轮动的表现能够进一步提升。
3.Model3因子虽然在选股问题上有较好且较稳定的表现,但在行业轮动问题上较另外三个模型来看,超额显著下滑而Top行业组合业绩的稳定性没有改善,说明所剥离的风险信息可能在选股上不具有显著alpha,但在行业上有较强且较稳定的alpha效应。
四
Top与指数增强组合表现
4.1 组合构建说明
本章将展示了新模型生成因子构建Top30组合以及在沪深300、中证500和中证1000指数增强的应用效果,关于指数增强组合有如下说明:
1)回测期20180101~20250430,组合周频调仓,假设根据每周五个股得分在次日(即下周一)以vwap 价格进行交易,股票池为中证全指剔除北交所股票和上市天数较短的股票。
2)风险因子库dfrisk2020(参见《东方A股因子风险模型(DFQ-2020)》)的所有风格因子相对暴露不超过0.5,所有行业因子相对暴露不超过2%,中证500 增强跟踪误差约束不超过5%,沪深300 增强跟踪误差约束不超过4%。个股权重偏离设置为±1%。
3)指增策略组合构建时,限制指数成分股占比,成分股占比约束为80%,周单边换手率限制记为20%。
4)组合业绩测算时假设买入成本千分之一、卖出成本千分之二,停牌和涨停不能买入、停牌和跌停不能卖出。
4.2 Top组合业绩
本节将展示新模型生成因子构建top30组合的业绩表现,组合周频调仓不做换手约束,每周一进行买卖交易,成本为买入成本千分之一、卖出成本千分之二,组合的成分股以及对应权重通过求解以下二次优化问题得到。
其中r为股票预期收益率即因子取值,矩阵 Sigma 表示barra风险模型估计的股票协方差矩阵,lambda为风险厌恶系数(取值为0.5),w为待求解的个股权重向量。
各模型构建的Top组合各年度绝对收益均为正,且Model1和Model2因子构建的组合绝对收益、夏普比率和最大回撤相较于Baseline因子均有明显提升,说明相较于基准模型,新模型能够获取更强更稳定的头部收益。Model1和Model2因子绝对净值最大回撤区间发生在时点2024年2月,最大回撤达到-40.31%;第二大回撤区间发生在时点2022年4月,最大回撤达到-30.11%。其余时间最大回撤均小于20%。可见组合的绝对收益较为稳定。
4.3 沪深300指数增强
本节将展示新模型生成因子所构建的沪深300指数增强组合业绩表现
上述图表结果可以看出,在相应约束条件下,因子所构建的沪深300指增组合表现良好,Model1、Model2的年化超额超过16%,信息比率分别为3.14和3.15,组合各项指标均显著超过Baseline因子构建组合,除2019年每年超额均在7%以上。今年面临年初的科技股暴涨的极端行情,组合依然有较为稳健的表现,截至20250430,组合累积超额达到4.37%和4.66%。
4.4 中证500指数增强
本节将展示各个模型生成因子在中证500指数增强策略应用,首先我们展示各年度超额收益以及汇总的业绩表现以及新模型因子的超额净值走势:
上述图表结果可以看出,在相应约束条件下,因子所构建的中证500指增组合表现较好,Model1和Model2的年化超额超过21%,组合各项指标均显著超过Baseline因子构建组合,信息比率可达3.21,、3.23。2024年以前组合超额均超过10%,但近两年超额有所下滑,且今年各组合业绩表现较为一般,截至20250430,组合累积超额均不到3%。
4.4 中证1000指数增强
本节将展示各个模型生成因子在中证1000指数增强策略应用,首先我们展示各年度超额收益以及汇总的业绩表现以及新模型因子的超额净值走势:
上述图表结果可以看出,在相应约束条件下,因子所构建的中证1000指增组合表现优异,其中Model1和Model2年化超额均超过31%,信息比率分别4.37和4.35,组合各项指标均显著超过Baseline因子构建组合,2023年以前组合超额均在20%以上,但近年来组合超额表现有所下滑。今年组合业绩表现也较为不俗,截至20250430,组合累积超额高达5.20和6.08%。
五
结论
前期报告中,我们基于基本面(fund)、周度(week)、日度(day)、分钟线(ms)和Level-2(l2)五个数据集,利用带图结构的RNN、ResNet和决策树模型搭建了AI量价模型框架,并将该框架生成的最终打分应用于选股策略,回测结果显示这套框架下生成的因子有着较强的选股能力。
金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题,这些问题通常会影响模型稳定性以及样本外的泛化能力。本文提出一种RNN+Neural ODE+MLP融合模型,将时序数据建模为微分动力系统,通过RNN和Neural ODE模型构建变分自编码层(VAE层),利用RNN进行时序数据的压缩和降维,再将神经微分方程(Neural ODE)学习时序数据隐含的时序演化规律,将数据进行重构,最后我们将重构去噪后的数据输入MLP模型进行alpha信息的捕捉和挖掘,从而提升模型样本外的选股鲁棒性。
通过将Baseline模型和新模型因子多头绩效的对比,我们得到以下结论:
1.相较于Baseline模型,除2020年和今年,其余各年份Model1因子的多头超额均能大幅跑赢。而分组超额来看,Model1的Top组和Grp1组超额相较于Baseline模型分别提升了1.91%和3.07%,说明新模型相对于Baseline能大幅改善多头的表现。
2.在2024年出现较为极端的市场环境下,Model1因子多头超额相较于Baseline模型提升了6.63%,最大回撤也有所下降,说明Model1抗风险能力相对更强。
3.在各个回测区间,Model1因子的多头组合换手率相较于Baseline均有一定程度的下降。这意味着实盘可能有更高的交易成本优势。
4.Baseline模型和Model1模型多头超额净值走势趋同度较高,各年度的最大回撤区间基本上重合,说明各类模型从相同量价特征中提取的alpha信息一致性相对较高。
新模型2018年以来在中证全指上十日RankIC均值为16.33%,top组年化超额分别为54.54%。相较于基准,新模型选股效果均有明显提升。行业轮动方面,2018年以来,新模型RankIC可达12.55%,Top组年化超额可达25.27%,各项指标表现也显著战胜基准。
本文生成因子也可以直接应用于指数增强策略,在各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,在沪深300、中证500和中证1000增强策略上2018年以来新模型年化超额收益率分别为16.67%,21.37%和32.41%,信息比率分别为3.14、3.21、4.27。
量化模型基于历史数据分析,未来存在失效风险,建议投资者紧密跟踪模型表现。
极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。
说明:
证券研究报告:《ADWM:基于门控机制的自适应动态因子加权模型——因子选股系列研究之一一二》
发布日期:2025年2月24日
分析师:杨怡玲 执业证书编号:S0860523040002
联系人:陶文启
重要提示(向上滑动浏览):
本订阅号为东方证券股份有限公司(以下称“东方证券”)研究所金融工程研究团队运营的唯一订阅号,并非东方证券研究报告的发布平台, 本订阅号仅转发东方证券已发布研究报告的部分内容或对报告进行的跟踪与解读。通过本订阅号发布的资料仅供东方证券研究所指定客户参考。因本订阅号无法设置访问限制,若您并非东方证券研究所指定客户,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。东方证券不因任何单纯订阅本公众号的行为而将订阅人视为客户。