简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

中金 | 大模型系列(4):LLM动态模型配置

2025-09-23 07:58

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

中金研究

随着量化投资的发展和因子挖掘技术的升级,Alpha因子的数量已呈现出指数级的增长。如何有效、动态地组合日益增多的Alpha模型,已取代单纯的因子挖掘成为决定投资收益的核心。我们发现各个合成模型在不同的市场阶段往往会出现表现上的明显差异,很难找到某个单一模型可以始终适应所有的市场环境。这时模型配置或者说策略配置就成为一个新的课题。

然而现有的模型配置方法面临着一些挑战:一方面,以均值-方差模型为代表的经典优化方法,其对协方差矩阵等输入参数的高度敏感性,使其表现稳定性欠佳。另一方面,机器学习集成方法虽在训练集上表现优异,但其“黑箱”属性使得部分基金经理难以在关键时刻对其决策建立信任。

本报告中我们提出一种基于大模型的动态策略配置方法:“研判-推理框架”。我们认为模型配置或策略配置的本质可能不仅仅是一个追求最优解的数值问题,而可以由数据结合推理成为一个追求逻辑合理性的推理任务。我们尝试构建了一个“训练-分析-决策”的三层框架:

(1)训练层(基础模型库):并行运行一组经过挑选的、具有策略逻辑差异性的Alpha模型(例如IC加权、弹性网络回归、XGBoost树模型等等),作为多元化的底层策略库或模型库。

(2)分析层(自动化绩效分析):扮演量化分析师的角色,对各基础模型在滚动窗口内的回测数据进行深度、多维度的绩效分析,并结合精细化的市场状态(如趋势、波动、成交活跃度等)识别,自动生成一份结构化的“绩效分析简报”。

(3)决策层(LLM配置决策):引入大语言模型(LLM)作为决策核心。我们通过精巧的Prompt设计,引导LLM扮演一位经验丰富的投资组合经理,对“分析简报”中的信息进行全面的上下文学习和推理。我们引导LLM基于基础模型的历史表现、风险特征及其在当前市场状态下的适应性,进行逻辑推理与多目标权衡,最终输出一个包含精确权重分配和简洁决策理由的、可解释的配置方案。

本文核心在于探讨大模型策略配置框架的实施价值与效果。受限于计算资源,我们在沪深300指数内进行了训练和回测。回测结果显示,LLM配置决策在一些关键时间点可以给出比较准确的策略切换判断。且相较于等权配置、最优单一模型等基准,基于LLM的动态策略配置框架的沪深300内选股年化平均超额可达7.21%,平均表现在信息比等指标上取得了一定程度的提升,并且最大回撤有所下降。

风险提示:LLM是一种生成式模型,其生成的结果具有一定的随机性,基于LLM构建的模型所得到的结果的可复现性相对较差。我们建议应用该类模型时,可以多次生成结果,取其平均值作为最终参考。

从因子挖掘到模型配置

过去的十几年间,量化投资在A股市场经历了从萌芽到繁荣的跨越式发展。其核心驱动力在于通过数学和统计方法,寻找能够持续预测股票未来收益的“Alpha因子”。从最初的经典价值、动量、质量等因子,到利用另类数据、机器学习算法挖掘出的海量新型因子,A股市场的因子库经历了指数级的增长。

然而,因子库的指数级增长并不能直接带来收益的提升。首先是Alpha的快速衰减。随着越来越多的机构投入到因子挖掘的“军备竞赛”中,任何一个有效因子的半衰期都在急剧缩短。一个曾经的“金矿”因子,可能在短短几个月内就因过度拥挤而失效。其次是因子的同质化。不同机构挖掘出的因子,尽管算法各异,但其底层的收益来源和风险暴露可能出现重合,导致在某些市场风格下,不同的量化产品表现出一致性亏损。

在这一背景下,量化投资的核心矛盾已经悄然转移。单纯比拼谁能挖到更多、更新的因子,其边际效用正在递减。如何从数以百计的因子和模型中,进行有效的筛选、提纯与组合,形成一个能够适应多变市场环境的、稳健的策略集合,成为了量化基金经理的共同难题。

各因子合成模型的表现:阶段性差异明显

总体上来看因子合成的方法大致可以分为2个类别:

►      线性模型:这类是最经典也是最常用的方法。

(1)基于历史因子IC(信息系数)的IC加权或IC_IR加权,通过赋予近期表现更好的因子更高权重,实现简单的动态调整。它基于一个简单但有效的假设:近期表现更好的因子在未来仍可能保持优势。

(2)线性回归(包括Lasso/Ridge回归等)则更进一步,是在尝试控制因子间共线性的前提下,求解线性组合权重的方法。这类方法优点是简单、直观、可解释性强,但其线性假设在面对复杂的非线性市场关系时常常显得力不从心。

►      非线性模型:对因子之间的交互效应捕捉能力较强,

(1)以梯度提升树(如XGBoost, LightGBM)为代表的树模型,凭借其强大的非线性拟合能力,在各类竞赛和量化实践中表现出色。它们能够捕捉因子之间复杂的交互关系,并在一定程度上处理缺失值和异常值的影响。

(2)深度学习模型,特别是能够处理时序信息的LSTM、GRU等,理论上具有最强的拟合能力。我们在近期的机器学习系列报告《机器学习系列(4):一种结合自注意力机制的GRU模型》中也对GRU模型进行了一些方法上的改进创新。

我们对上述不同类型的合成模型在A股市场进行了回测。一个非常明确的结论是:没有任何一种因子合成模型可以一劳永逸。

图表1:沪深300内不同因子合成模型回测净值表现

资料来源:Wind,中金公司研究部

资料来源:Wind,中金公司研究部

通过对2015-2025年沪深300成分股内的不同因子合成模型的回测,我们发现:

(1)不同模型的优势期存在明显的周期性。线性模型往往在趋势明确、市场逻辑清晰的阶段表现更好;而非线性模型则在市场结构发生变化、传统逻辑失效时展现优势。

(2)模型表现与市场环境高度相关。在2021年”抱团瓦解”期间,简单的IC加权模型表现显著差于XGB模型。

(3)在整个回测期间,没有任何一个单一模型能够在所有时期都保持最优表现。

图表2:沪深300内IC加权模型阶段性显著跑输XGB模型

资料来源:Wind,中金公司研究部

资料来源:Wind,中金公司研究部

综上,可以验证我们的观点,不同的合成模型在不同的市场阶段也往往会出现表现上的明显差异。很难找到某一个因子合成模型可以始终适应所有的市场环境。这时,模型配置或者说策略配置就成为一个新的课题。

传统模型/策略配置方法的局限性

在面对多个策略或模型进行配置时,传统的量化工具主要提供两类解决方案,但它们各自都存在难以克服的局限性,陷入“收益-可解释性-稳定性”的“不可能三角”。

经典均值-方差模型:理想化假设

以Markowitz的均值-方差(Mean-Variance, MVO)模型为代表。其理论基础是寻找在给定预期收益下风险最小(或给定风险下收益最大)的配置权重。然而这个方法在实践中却存在稳定性较弱的问题。

其核心问题在于模型对输入参数(预期收益和协方差矩阵)十分敏感。历史数据的微小扰动,可能导致输出权重的较大变化。更重要的是,金融市场的非平稳性决定了基于历史统计的最优参数在预测未来时并非一定是最优的,导致理论上的最优配置在现实中表现一般,甚至更差。

DeMiguel,Garlappi,和Uppal(2009)的研究发现,在考虑现实交易成本后,简单的1/N等权策略反而表现优于均值-方差优化方法,表明均值方差优化模型在面对参数不确定性时稳定性较差。

机器学习集成:“黑箱”问题

以GBDT、神经网络为代表的机器学习模型被广泛应用于因子合成。Gu,Kelly,和Xiu(2020)证明了这类非线性集成方法在预测能力上的显著优势。然而,这种强大预测能力的获得,往往伴随着较大的“可解释性”代价。

当一个基于机器学习模型的策略出现大幅回撤时,如果基金经理的回答是“因为我的神经网络模型就是这么告诉我的”,这在风险管理和投资者沟通等任何一个环节都是很难被接受的。

面对这一困境,我们亟需一种新的方法,它既要能够动态适应市场,追求卓越的配置效果,又要保证决策过程的透明、符合逻辑,并且在面对市场的不确定性时足够稳健。这正是我们提出“研判-推理框架”(LLM策略配置)的初衷。

基于LLM的研判推理框架

我们认为,上述常见模型配置方法的根本性问题在于,他们试图将一个复杂的、动态的、充满博弈的决策问题,简化为一个静态的、基于历史数据的数学优化问题。金融市场是一个典型的复杂适应性系统,其运行规律并非一成不变的物理定律。在这种环境下,追求一个基于历史统计的“数学最优解”,往往难度是非常大的。

相比之下,一位优秀的投资经理是如何做决策的?他往往不会去求解一个复杂的协方差矩阵,而是从下面几个点入手:

►      观察:分析手中各个策略近期的表现、回撤、风险暴露。

►      分析:结合当前的市场环境(是牛市还是熊市?风格如何?是放量上涨还是缩量震荡?),分析各个策略表现好坏的深层原因。

►      推理与决策:基于自己的投研框架和经验,判断哪些策略在未来的市场环境下可能更具适应性,哪些策略可能面临风险。并基于上述推理,做出增配或减配的决策。

这个过程追求的不是一个“最优解”,而是一个逻辑上合理的决策。那么我们能否构建一个系统来模拟这种推理过程呢?

大模型的出现为这个设想提供了可能性。因为LLM强大的上下文理解、多维信息整合、逻辑推理以及生成结构化文本的能力,天然适合扮演类似的角色。因此我们提出了一个框架,将模型配置问题从一个计算问题定义为一个研判推理任务。

架构总览:训练-分析-决策的自适应框架

我们尝试构建了一个由三层架构构成的模型/策略配置框架:

图表3:LLM策略配置框架示意图

资料来源:中金公司研究部

资料来源:中金公司研究部

►       训练层:负责执行具体的选股预测任务,是框架的“执行单元”。我们在此构建一个由IC加权、线性回归、XGBoost等构成的模型库。

►      分析层:负责处理原始回测数据,将其转化为结构化的决策情报,是框架的“情报分析中心”。

►      决策层:负责进行高级推理与权衡,并发出新的模型权重指令,是框架的“决策大脑”。

这个循环在每个调仓周期滚动进行,使得整个系统能够不断地根据最新信息反馈循环并动态调整,实现自适应的学习。

训练层:多模型、多策略

训练层的目标是为后续的决策提供高质量的“备选策略”。因此在选择基础模型时,需要重视模型的低相关性和异构性。

在本报告中,我们选取了三类具有代表性的因子合成模型作为基础模型:

►      IC加权模型:最为简单的线性模型。它代表了量化投资中的“因子动量策略”,在趋势明显的市场中表现良好。

►      线性回归:以OLS线性回归为代表,包括Lasso/Ridge、弹性网络回归(Elastic Net Regression)等常用模型,是捕捉因子与收益之间线性关系的经典工具,在市场逻辑清晰时表现稳健。相比IC加权,它能更全面地考虑因子间的相互作用和冗余信息,寻求一个在样本内最优的线性组合。它代表了更经典的统计学建模思路。

►      树模型(XGBoost):以梯度提升决策树为代表,擅长从高维数据中挖掘非线性关系,与线性模型形成有效互补。例如,某个因子可能只在“小市值”且“高波动”的股票中有效,这种逻辑能被树模型很好地捕捉。树模型擅长在市场结构发生变化时发现新的关系,但也可能面临更高的过拟合风险。

分析层:自动化的策略绩效分析

分析层是连接原始数据和LLM决策的关键桥梁。它的核心任务是模仿一位经验丰富的分析师,将训练层产出的回测数据处理成一份信息高度浓缩且结构化的“分析简报”。这份简报是LLM进行决策的唯一信息来源,其设计的精细度直接决定了最终决策的质量。

为了让LLM能够进行深度推理,我们设计的“分析简报”包含两大核心模块:市场状态刻画与多维度绩效评估。

市场状态刻画

之所以将市场状态的识别与划分放在核心位置,是因为我们认为这正是发挥大模型(LLM)优势的关键所在。LLM的核心能力恰恰在于其强大的上下文理解和逻辑推理能力。通过将市场状态(如趋势、波动、成交活跃度等)等等多维度的外部环境信息结构化地提供给LLM,我们将配置任务从一个纯粹的数值优化问题,升维成一个需要结合环境进行研判的推理决策问题。

这样LLM能够更动态的调整配置的方案,例如:“在‘缩量下跌’的环境下,在模型配置上给与防御性更高的权重。” 这正是LLM策略配置框架设计的优势所在。

图表4:市场状态划分逻辑示意图(基于MACD和成交量)

资料来源:中金公司研究部

资料来源:中金公司研究部

在划分完市场状态后,分析层会计算出每个模型在历史上每种市场状态下的平均收益、夏普比率等表现。这为LLM判断模型在“当前”市场状态下的适应性提供了至关重要的依据。

多维度绩效分析

分析层会进而对每个基础模型进行全面的绩效分析,生成一系列量化指标。

图表5:分析层使用的核心绩效指标

资料来源:中金公司研究部

资料来源:中金公司研究部

决策层:LLM驱动的推理决策

这是整个框架的“大脑”, 我们通过精心设计的Prompt,引导LLM扮演一位资深的投资组合经理。LLM接收分析层生成的“决策简报”,并会按照顺序执行以下的任务:

信息整合

LLM首先阅读并理解简报中的全部信息,对每个模型的特性形成一个全面的认知。例如,它会理解到“模型C(XGBoost)虽然长期夏普最高,但回撤大,且在熊市缩量行情中表现比较差”。

逻辑推理

通过思维链技术,我们要求LLM在给出最终权重前,先进行一步一步的分析。这个推理过程中我们会要求LLM重点关注各个基础模型的市场适应性、风险收益特征、相关性等等维度的信息:

图表6:LLM推理过程的关注重点

资料来源:中金公司研究部

资料来源:中金公司研究部

决策输出

在完成推理后,我们会要求LLM输出一个严格遵循预定格式的结果。

这个输出包含了可直接读取的权重和可解释的决策理由(reasoning)。这个理由对于我们的投研团队是至关重要的,它使得人机之间的信任得以建立。基金经理可以快速了解LLM的逻辑,如果认同,就执行;如果不认同,也可以基于这份清晰的逻辑进行调整。

我们引导和约束LLM像一个真正的投资经理一样思考。这确保了决策过程的透明性、逻辑性和可重复性,是LLM策略配置框架区别于其他相对黑箱的机器学习模型的核心所在。

实证研究:沪深300选股回测

回测流程:短窗口训练+长窗口决策

为了避免“后视偏差”(Look-ahead Bias),我们采用比较标准的滚动回测方法。我们可以将整个因子选股策略配置的流程拆解为下述几个步骤:

图表7:LLM策略配置的流程拆解

资料来源:中金公司研究部

资料来源:中金公司研究部

1) 决策点T:调仓周期为12周(约一个季度)。假设当前是一个决策点T。

2) 确定数据窗口与模型训练:在决策点T,我们进行两层不同周期的回看操作

l   基础模型训练窗口(36周):对于“训练层”的三个基础模型(IC模型、LR模型、XGBoost模型),我们使用决策点T之前的36周数据进行模型的训练。选择一个相对较短的36周窗口,是为了让基础模型能更快速地适应近期的市场风格和因子有效性变化,捕捉中短期市场动态,匹配周度调仓的换仓频率。

l   LLM决策分析窗口(104周):在三个基础模型训练完毕后,我们需要评估它们的历史表现。“分析层”会回看决策点T之前的104周(约两年)数据,生成包含长期夏普比率、最大回撤、以及在不同市场状态下表现的“决策简报”。

3) 生成权重:在T时刻,LLM策略配置框架基于对过去104周绩效的“研判”和对基础模型(基于过去36周数据训练)的理解,输出一套配置权重。这套权重将被固定下来,并应用于从T时刻开始,直至下一个决策点T+12周的整个投资组合构建中。

注:具体的模型训练窗口时长等参数是经由参数敏感性测试后选定的结果,参数敏感性测试的具体过程在这里就不做完整的展示。

通过这样的流程设计,在决策点T,整个LLM策略配置框架所能使用的全部数据,都严格限定在T时刻之前。对于T时刻之后的所有市场行情、因子表现等信息,模型是不会提前获知的。

图表8:LLM策略配置框架给出的模型权重建议

资料来源:中金公司研究部

资料来源:中金公司研究部

图表9:对应的基础策略净值表现对比

资料来源:Wind,中金公司研究部

资料来源:Wind,中金公司研究部

例如我们看到在2021年9月,LLM认为市场转为高位缩量震荡下跌的状态,此时应该以风险控制作为配置决策的关键判断依据。LLM判断近期此种环境下XGB模型的风险端表现最好,下行波动小,稳健性高,因此高配XGB模型。而IC加权模型所代表的“因子动量策略”在这种环境下可能失效。且IC模型与XGB模型有较高的相关性,因此决定进一步低配IC模型。

这一决策也使得组合整体有效的部分规避了2021年9月的市场风格切换带来的超额回撤。

图表10:部分时点LLM给出的决策理由示例(精简)

资料来源:中金公司研究部

资料来源:中金公司研究部

选股表现:回撤控制较好

我们进一步测试了LLM策略配置框架在沪深300成分内的选股策略表现。具体的回测参数设置如下。(考虑到大模型存在一定随机性,我们选取LLM模型配置三次回测的平均结果做最终的选股测试)。

回测区间:2015年1月1日至2025年8月31日

因子数据:使用中金量化因子手册中涵盖基本面和价量的约200个底层因子

选股域:沪深300成分股

选股数量:30只

调仓周期:周度

调仓成本:双边0.3%

加权方式:市值加权

为了客观评估LLM策略配置框架的增量价值,我们选取了2类基准作为对比:

等权基准:三个基础模型的等权组合。

2.  单一模型:单一基础模型(IC模型、LR模型、XGBoost模型)。

图表11:回测表现对比

资料来源:Wind,中金公司研究部

资料来源:Wind,中金公司研究部

图表12:LLM策略配置选股模型回测净值表现

资料来源:中金公司研究部

资料来源:中金公司研究部

从回测结果中可以看出,LLM动态组合的平均表现体现出了一定的优势:

LLM动态组合的最大回撤为-9.47%,低于所有基准模型,也优于等权基准(-10.50%)。例如,在2021年9月的市场风格切换中,LLM通过高配稳健的XGB模型、低配动量效应可能失效的IC模型,一定程度规避了组合的大幅回撤。

尽管LLM策略的年化收益略低于表现最好的单一IC模型,但其信息比率达到了0.68。从权重分配图和决策理由示例中可以看到,LLM的决策并非随机或静态的。它能根据市场状态的变化(如2019年1月市场反转)动态地调整对不同模型的侧重,其决策理由也比较清晰地反映了对市场环境的判断和对模型特性的理解。

实证结果表明,我们提出的基于LLM的模型配置框架是一种比较有效的动态策略配置方法。通过模拟投资经理的逻辑推理过程,在提升风险调整后收益和控制回撤方面体现出一定的价值。这种“白盒”的LLM应用方式,也解决了传统机器学习模型在金融领域应用中的可解释性难题。

我们认为后续框架仍有进一步优化的空间:

(1)扩展基础模型库:加入更多低相关的策略,如深度学习模型、另类策略等。

(2)丰富市场状态维度:在现有的市场趋势、成交量等基础上,融入宏观数据、情绪指标等另类数据,对市场状态进行更精确的刻画。

风险提示

LLM是一种生成式模型,其生成的结果具有一定的随机性,基于LLM构建的模型所得到的结果的可复现性相对较差。我们建议应用该类模型时,可以多次生成结果,取其平均值作为最终参考。

本文摘自:2025年9月22日已经发布的《大模型系列(4):LLM动态模型配》

周萧潇  分析员 SAC 执证编号:S0080521010006 SFC CE Ref:BRA090

古翔  分析员 SAC 执证编号:S0080521010010 SFC CE Ref:BRE496

郑文才  分析员 SAC 执证编号:S0080523110003 SFC CE Ref:BTF578

刘均伟  分析员 SAC 执证编号:S0080520120002 SFC CE Ref:BQR365

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。