熱門資訊> 正文
2025-06-03 08:00
(轉自:東方金工研究)
核心觀點
自適應動態因子加權模型
金融數據常因停牌、財報發佈和突發事件等因素存在缺失、噪聲及異常等問題,這些問題通常會影響模型穩定性以及樣本外的泛化能力。本文提出一種RNN+Neural ODE+MLP融合模型,將時序數據建模為微分動力系統,然后進行數據重構和特徵提取,從而提升模型樣本外的選股魯棒性。整個模型由以下部分構成:
通過RNN和Neural ODE模型構建變分自編碼層(VAE層),利用RNN進行時序數據的壓縮和降維,再將神經微分方程(Neural ODE)學習時序數據隱含的時序演化規律,將數據進行去噪和重構。
最后我們將重構去噪后的數據輸入MLP層進行alpha信息的捕捉和挖掘,從而對未來收益率標籤進行擬合。
各模型因子對比
通過將Baseline模型和新模型因子多頭績效的對比,我們得到以下結論:
相較於Baseline模型,除2020年和今年,其余各年份Model1因子的多頭超額均能大幅跑贏。而分組超額來看,Model1的Top組和Grp1組超額相較於Baseline模型分別提升了1.91%和3.07%,説明新模型相對於Baseline能大幅改善多頭的表現。
在2024年出現較為極端的市場環境下,Model1因子多頭超額相較於Baseline模型提升了6.63%,最大回撤也有所下降,説明Model1抗風險能力相對更強。
在各個回測區間,Model1因子的多頭組合換手率相較於Baseline均有一定程度的下降。這意味着實盤可能有更高的交易成本優勢。
Baseline模型和Model1模型多頭超額淨值走勢趨同度較高,各年度的最大回撤區間基本上重合,説明各類模型從相同量價特徵中提取的alpha信息一致性相對較高。
因子選股能力和行業輪動能力的表現
新模型2018年以來在中證全指上十日RankIC均值為16.33%,top組年化超額分別為54.54%。相較於基準,新模型選股效果均有明顯提升。行業輪動方面,2018年以來,新模型RankIC可達12.55%,Top組年化超額可達25.27%,各項指標表現也是顯著戰勝基準。
本文生成因子也可以直接應用於指數增強策略,在各寬基指數上均能獲得顯著的超額收益,在成分股不低於80%限制、周單邊換手率約束為20%約束下,在滬深300、中證500和中證1000增強策略上2018年以來新模型年化超額收益率分別為16.67%,21.37%和32.41%,信息比率分別為3.14、3.21、4.27。
一
引言
在量化金融領域,隨着大數據技術的飛速發展,深度學習模型憑藉其強大的數據處理和模式識別能力,在量化投資中展現出巨大潛力。
前期報告《基於循環神經網絡的多頻率因子挖掘》、《基於殘差網絡端到端因子挖掘模型》、《融合基本面信息的ASTGNN因子挖掘模型》和《基於神經網絡的alpha和beta因子協同挖掘模型》中,我們利用了帶圖結構的循環神經網絡(RNN & ASTGNN)、殘差網絡(ResNets)和決策樹模型等搭建了端到端AI量價選股模型框架,這套框架的輸入是個股不同頻率最原始的高開低收量價數據以及一些常見的基本面數據等,而最終的輸出則是具有較強選股能力的alpha因子和風險因子。其中alpha因子用於構建個股未來收益率預期值,而風險因子主要用於計算組合暴露,通過構建相應的風險約束最終生成我們的選股組合。我們將其該框架生成的因子應用於選股策略。回測結果顯示該策略在樣本外有着十分顯著的選股效果。
這套AI量價模型框架主要是基於多個不同頻率數據集搭建的,這些數據集分別是風險因子(risk)、基本面(fund)、周度(week)、日度(day)、分鍾線(ms)和Level-2(l2)數據集。其中風險因子數據集主要由Barra風險因子組成,目標是爲了生成機器學習風險因子使用,而基本面數據集是由四類常見的基本面因子組成,如估值、成長、超預期等;周度和分鍾線數據集我們分別是將每五個交易日日K線和每日半小時K線形成矩陣數據,然后將這些矩陣通過ResNets提取出相應時間頻度的特徵向量而形成的,而Level-2則是將原始數據通過人工合成成日頻因子的方式形成的。
整個AI綜合因子生成的框架分為四個部分,數據預處理、提取因子單元、因子加權以及因子匯總。數據預處理包括去極值標準化和補充缺失值三個步驟,而提取因子單元則是通過RNN、殘差網絡和圖模型等將輸入的特徵轉化成一系列具有一定選股能力的弱因子,與此同時我們還使用ABCM模型(參見報告《ABCM:基於神經網絡的alpha和beta因子協同挖掘模型》)同時生成風險因子,因子加權則是利用決策樹等對這些神經網絡自動挖掘生成的弱因子進行二次加權,其中考慮到風險因子和alpha因子的性質(風險因子長期和未來收益率方向無序且不可預測,但短期具有一定的可預測性,alpha因子長期與未來收益率方向一致,且函數關係較為穩定),我們對兩部分因子進行不同方式的二次加權,最后將兩部分因子通過人工方式進行匯總形成綜合得分,整個流程如下圖所示:
上述框架中,由於個股的停牌、財報發佈以及突發事件等的影響,RNN模型的輸入數據往往存在缺失值,較大的噪聲、數據異常等問題,而由於神經網絡通常對數據微小變化較為敏感,因此如何補充缺失值以及剝離數據中的噪聲影響對於模型選股能力十分重要。前期報告《基於抗噪的AI量價模型改進方案》中我們提出了基於對抗訓練的方式來提升模型的魯棒性和抗噪能力, 該方法主要是構建抗噪損失函數來訓練模型,從而使得模型參數最終收斂到噪聲低敏感的最優值點。
本文則是將時序數據視作一個動力系統的衍化過程,通過神經微分方程模型對時序數據自身的衍化函數建模,讓微分動力系統學習出潛在的數據時序衍化規律,從而對時序數據進行重構,最終將重構數據放到新模型中訓練達到降低模型輸入數據噪聲的影響。
二
新模型細節介紹
2.1 神經網絡與微分方程的聯繫
傳統神經網絡在處理高維空間數據時往往需要使用較多的非線性層,每一層通過前一層的輸出來提取特徵,所以隨着神經網絡層數的增多,訓練時反向傳播過程伴隨着會出現梯度爆炸和梯度消失等問題使得神經網絡無法有效提取數據中的有效信息甚至訓練失敗。而殘差網絡(Residual Network,ResNet)則通過構建跳躍連接(skip connection)允許梯度直接回傳至淺層,從而緩解了深層網絡訓練時普遍存在的梯度消失與網絡退化問題,使得構建超深層網絡成為可能。殘差連接本質上是構建了恆等映射(Identity Mapping)的捷徑路徑,使網絡在無需額外參數的情況下學習輸入與輸出的殘差(即增量變化),實驗表明這種設計顯著提升了模型對複雜特徵的提取能力。
完整的殘差網絡是由一系列殘差塊和MLP結構組成,每個殘差塊均含有恆等映射和殘差連接兩部分構成,其具有如下圖所示結構:
而對於一個標準的帶MLP結構的L層殘差網絡前向傳播的過程,我們可以將其表示為如下數學公式形式:
1.3 本文模型結構和損失函數
本文中模型結構可以分為三部分構成,分別為Encoder層、Decoder層和MLP層,這里Encoder和Decoder層合稱為變分自編碼層(VAE)層,其中Encoder層為RNN結構作用主要是進行數據降維和特徵提取,而Decoder層為Neural Jump SDE結構主要作用是擬合時序數據的時間衍化規律,從而對數據進行重構。MLP層主要是對重構數據進行特徵提取,最終對個股未來收益率進行預測。整個模型結構和損失函數構建可表示為下圖形式:
MLP層有兩種設置方案,第一種為全連接層和非線性激活函數構成,此時我們使用預測結果和中性化標準化后的收益率標籤直接計算均方誤差損失,第二種則是採用我們前期報告《ABCM:基於神經網絡的alpha和beta因子協同挖掘模型》中的結構,即通過兩個NN-Layer同時生成風險因子和alpha因子,風險因子使用的NN-Layer為帶Attention機制的圖結構其對應損失函數為R-square,alpha因子的NN-Layer為簡單的全連接層其對應損失函數為MSE,最后通過構建因子正交懲罰損失來剝離alpha和風險信息。整個模型的具體結構可表示為如下形式:
該模型核心的想法是通過RNN模型對數據的核心信息進行提取,通過Neural SDE模型進行數據重構,使得重構時序數據與原始數據最大程度逼近的前提下,能關於時間t形成一個連續函數。由於時序數據在時間維度上平滑,此時我們可以認為重構數據的噪聲含量佔比將大幅下降。最后我們將重構數據通過一個MLP變換得到最終的預測結果。
注:新模型在各種金融問題上用途廣泛,除本文用法外,還可用於數據降維:比如分鍾線數據提取為日頻特徵,股票收益率序列數據提取為具有高解釋力度的統計量意義下風險因子等;因子加權:股票alpha因子加權對未來多步收益率進行預測。
1.4 新模型重構數據表現
我們使用新模型對股票預處理后的K線數據進行重構,取2013~2022年為訓練集,2023年為驗證集,2024年為樣本外,訓練時只使用重構損失和KL散度作為損失函數,統計驗證集以及樣本外重構損失表現,重構損失使用原始數據與重構數據的MSE損失作為度量的量。驗證集損失隨迭代步數的變化以及最終模型樣本外的損失值曲線以及隱藏層特徵 μ 在樣本外對未來十天收益率的解釋度如下圖所示:
通過上圖結果,我們可以看出:
1)驗證集上損失函數下降過程較為平滑,這説明模型訓練過程穩定;
2)模型在2023年驗證集上重構損失值為0.2475,2024年樣本外的重構損失值為0.3803,這説明模型重構能力在樣本外仍具有較好的表現效果;
3)隱藏層在樣本外的R-square平均值為20.73%(同期Barra模型的R-square為20.38%),這意味着隱藏層所挖掘的特徵在樣本外對個股未來收益有較高的解釋能力,因此該方法可作為挖掘風險因子的一個新的手段。
二
各模型單因子分析
2.1 回測説明
本文的回測結果中,回測區間為20171229~20250430,若不做特殊説明,各項指標計算方法如下所示:
1. RankIC均值是當天因子與隔日未來十日收益率(T+1~T+11收盤)序列進行計算的,並且每隔十個交易日計算一次,最終將這個RankIC序列取平均得到的。
2. ICIR則是根據上述RankIC序列均值除以序列標準差計算得到的。
3. 分組測試結果中,計算top組的年化超額收益,中證全指股票池上我們是將股票池分成20組,基準則是成分股等權,周度調倉,次日收盤價成交併且不考慮交易成本計算得到的。
4. 多頭組周均單邊換手率是根據多頭組持倉計算得到,而最大回撤和年化波動率則是根據top組超額收益淨值計算得到的。
5. 各個股票池均剔除了北交所股票以及上市天數較短的股票。
並且本文將對比以下模型的績效表現,來説明新模型對原模型的增量作用:
1. Baseline:報告《ABCM:基於神經網絡的alpha和beta因子協同挖掘模型》中的模型生成因子。
2. Model1:Neural ODE模型生成因子截面標準化后與Baseline因子截面標準化后等權。
3. Model2:Neural SDE模型生成因子截面標準化后與Baseline因子截面標準化后等權。
4. Model3:Model1因子剝離掉相關短期風險因子后的殘差。
2.2 因子中證全指績效分析
首先,本節我們將展示上述模型生成的因子在中證全指股票池上的選股匯總效果、分年度的超額收益表現以及超額收益的淨值走勢(其中匯總表現分成2018年至2023年和2024年以及2025年三段進行展示)
1. Model1,Model2相較於Baseline模型的多頭超額有較大幅度提升,其中Model1的Top組和Grp1組超額相較於Baseline模型分別提升了1.91%和3.07%,説明新模型相對於Baseline能大幅改善多頭的表現。
2. 在2024年較為極端的市場環境下,Model3因子多頭超額相較於另外三個模型有大幅度提升,最大回撤也有明顯下降,説明通過剝離掉一些短期風險信息以后,得到的Model3抗風險能力相對更強。
3. 在各個回測區間,Model1因子的多頭組合換手率相較於Baseline均有一定程度的下降。這意味着實盤可能有更高的交易成本優勢。
4. Baseline模型和Model1模型多頭超額淨值走勢趨同度較高,各年度的最大回撤區間基本上重合,説明各類模型從相同量價特徵中提取的alpha信息一致性相對較高。
2.3 各模型因子相關係數分析
本節我們分析了所生成因子與各個風險因子的平均相關性結果,可以看出雖然Model3因子是在Model1因子的基礎上剝離掉了短期風險,但整體來看,Model3因子在一些風格上的暴露更高比如Beta、Volatility、Liquidity、Value和Certainty等。
三
周頻行業輪動績效分析
本章將展示新模型因子應用於行業輪動策略的績效表現,回測結果有如下説明:
行業因子合成方法:將選股因子按照行業進行聚合形成行業的得分,聚合時權重設置為個股的流通市值。
備選行業池:所有30箇中信一級行業。
組合構建方式:取行業因子排名Top5的行業等權構建組合,基準為30個行業收益率等權,調倉頻率為周頻,每周五以收盤價格進行買賣交易。
以下是各個模型對應的回測結果:
通過上述圖表結果,我們可以看出:
1.各模型均具有較強的行業輪動能力,這説明各類模型學到的alpha信息中均有一定比例來源於行業信息。
2.相較於Baseline模型,Model1模型對應的行業因子RankIC、ICIR、Top組超額等各項指標均有進一步的提升,説明通過模型VAE層對原始數據重構以后,模型能夠更充分有效的提取數據的信息,因而行業輪動的表現能夠進一步提升。
3.Model3因子雖然在選股問題上有較好且較穩定的表現,但在行業輪動問題上較另外三個模型來看,超額顯著下滑而Top行業組合業績的穩定性沒有改善,説明所剝離的風險信息可能在選股上不具有顯著alpha,但在行業上有較強且較穩定的alpha效應。
四
Top與指數增強組合表現
4.1 組合構建説明
本章將展示了新模型生成因子構建Top30組合以及在滬深300、中證500和中證1000指數增強的應用效果,關於指數增強組合有如下説明:
1)回測期20180101~20250430,組合周頻調倉,假設根據每周五個股得分在次日(即下周一)以vwap 價格進行交易,股票池為中證全指剔除北交所股票和上市天數較短的股票。
2)風險因子庫dfrisk2020(參見《東方A股因子風險模型(DFQ-2020)》)的所有風格因子相對暴露不超過0.5,所有行業因子相對暴露不超過2%,中證500 增強跟蹤誤差約束不超過5%,滬深300 增強跟蹤誤差約束不超過4%。個股權重偏離設置為±1%。
3)指增策略組合構建時,限制指數成分股佔比,成分股佔比約束為80%,周單邊換手率限制記為20%。
4)組合業績測算時假設買入成本千分之一、賣出成本千分之二,停牌和漲停不能買入、停牌和跌停不能賣出。
4.2 Top組合業績
本節將展示新模型生成因子構建top30組合的業績表現,組合周頻調倉不做換手約束,每周一進行買賣交易,成本為買入成本千分之一、賣出成本千分之二,組合的成分股以及對應權重通過求解以下二次優化問題得到。
其中r為股票預期收益率即因子取值,矩陣 Sigma 表示barra風險模型估計的股票協方差矩陣,lambda為風險厭惡係數(取值為0.5),w為待求解的個股權重向量。
各模型構建的Top組合各年度絕對收益均為正,且Model1和Model2因子構建的組合絕對收益、夏普比率和最大回撤相較於Baseline因子均有明顯提升,説明相較於基準模型,新模型能夠獲取更強更穩定的頭部收益。Model1和Model2因子絕對淨值最大回撤區間發生在時點2024年2月,最大回撤達到-40.31%;第二大回撤區間發生在時點2022年4月,最大回撤達到-30.11%。其余時間最大回撤均小於20%。可見組合的絕對收益較為穩定。
4.3 滬深300指數增強
本節將展示新模型生成因子所構建的滬深300指數增強組合業績表現
上述圖表結果可以看出,在相應約束條件下,因子所構建的滬深300指增組合表現良好,Model1、Model2的年化超額超過16%,信息比率分別為3.14和3.15,組合各項指標均顯著超過Baseline因子構建組合,除2019年每年超額均在7%以上。今年面臨年初的科技股暴漲的極端行情,組合依然有較為穩健的表現,截至20250430,組合累積超額達到4.37%和4.66%。
4.4 中證500指數增強
本節將展示各個模型生成因子在中證500指數增強策略應用,首先我們展示各年度超額收益以及匯總的業績表現以及新模型因子的超額淨值走勢:
上述圖表結果可以看出,在相應約束條件下,因子所構建的中證500指增組合表現較好,Model1和Model2的年化超額超過21%,組合各項指標均顯著超過Baseline因子構建組合,信息比率可達3.21,、3.23。2024年以前組合超額均超過10%,但近兩年超額有所下滑,且今年各組合業績表現較為一般,截至20250430,組合累積超額均不到3%。
4.4 中證1000指數增強
本節將展示各個模型生成因子在中證1000指數增強策略應用,首先我們展示各年度超額收益以及匯總的業績表現以及新模型因子的超額淨值走勢:
上述圖表結果可以看出,在相應約束條件下,因子所構建的中證1000指增組合表現優異,其中Model1和Model2年化超額均超過31%,信息比率分別4.37和4.35,組合各項指標均顯著超過Baseline因子構建組合,2023年以前組合超額均在20%以上,但近年來組合超額表現有所下滑。今年組合業績表現也較為不俗,截至20250430,組合累積超額高達5.20和6.08%。
五
結論
前期報告中,我們基於基本面(fund)、周度(week)、日度(day)、分鍾線(ms)和Level-2(l2)五個數據集,利用帶圖結構的RNN、ResNet和決策樹模型搭建了AI量價模型框架,並將該框架生成的最終打分應用於選股策略,回測結果顯示這套框架下生成的因子有着較強的選股能力。
金融數據常因停牌、財報發佈和突發事件等因素存在缺失、噪聲及異常等問題,這些問題通常會影響模型穩定性以及樣本外的泛化能力。本文提出一種RNN+Neural ODE+MLP融合模型,將時序數據建模為微分動力系統,通過RNN和Neural ODE模型構建變分自編碼層(VAE層),利用RNN進行時序數據的壓縮和降維,再將神經微分方程(Neural ODE)學習時序數據隱含的時序演化規律,將數據進行重構,最后我們將重構去噪后的數據輸入MLP模型進行alpha信息的捕捉和挖掘,從而提升模型樣本外的選股魯棒性。
通過將Baseline模型和新模型因子多頭績效的對比,我們得到以下結論:
1.相較於Baseline模型,除2020年和今年,其余各年份Model1因子的多頭超額均能大幅跑贏。而分組超額來看,Model1的Top組和Grp1組超額相較於Baseline模型分別提升了1.91%和3.07%,説明新模型相對於Baseline能大幅改善多頭的表現。
2.在2024年出現較為極端的市場環境下,Model1因子多頭超額相較於Baseline模型提升了6.63%,最大回撤也有所下降,説明Model1抗風險能力相對更強。
3.在各個回測區間,Model1因子的多頭組合換手率相較於Baseline均有一定程度的下降。這意味着實盤可能有更高的交易成本優勢。
4.Baseline模型和Model1模型多頭超額淨值走勢趨同度較高,各年度的最大回撤區間基本上重合,説明各類模型從相同量價特徵中提取的alpha信息一致性相對較高。
新模型2018年以來在中證全指上十日RankIC均值為16.33%,top組年化超額分別為54.54%。相較於基準,新模型選股效果均有明顯提升。行業輪動方面,2018年以來,新模型RankIC可達12.55%,Top組年化超額可達25.27%,各項指標表現也顯著戰勝基準。
本文生成因子也可以直接應用於指數增強策略,在各寬基指數上均能獲得顯著的超額收益,在成分股不低於80%限制、周單邊換手率約束為20%約束下,在滬深300、中證500和中證1000增強策略上2018年以來新模型年化超額收益率分別為16.67%,21.37%和32.41%,信息比率分別為3.14、3.21、4.27。
量化模型基於歷史數據分析,未來存在失效風險,建議投資者緊密跟蹤模型表現。
極端市場環境可能對模型效果造成劇烈衝擊,導致收益虧損。
説明:
證券研究報告:《ADWM:基於門控機制的自適應動態因子加權模型——因子選股系列研究之一一二》
發佈日期:2025年2月24日
分析師:楊怡玲 執業證書編號:S0860523040002
聯繫人:陶文啟
重要提示(向上滑動瀏覽):
本訂閲號為東方證券股份有限公司(以下稱「東方證券」)研究所金融工程研究團隊運營的唯一訂閲號,並非東方證券研究報告的發佈平臺, 本訂閲號僅轉發東方證券已發佈研究報告的部分內容或對報告進行的跟蹤與解讀。通過本訂閲號發佈的資料僅供東方證券研究所指定客户參考。因本訂閲號無法設置訪問限制,若您並非東方證券研究所指定客户,為控制投資風險,請您請取消關注,請勿訂閲、接收或使用本訂閲號中的任何信息。東方證券不因任何單純訂閲本公眾號的行為而將訂閲人視為客户。