← 返回知识库
基础投资理论

多因子模型从入门到精髓

多因子模型不是一个神秘黑盒,而是一条完整的认知路径:先理解因子是什么,再处理数据、构建评分模型、控制风险,最后学会把策略当成动态系统来管理。

阅读导引 这篇文章适合刚进入量化选股的人。它不是直接给你一个“最优模型”,而是把多因子模型拆成 5 层能力,从理解概念一直走到策略生命周期管理。

第一层:建立认知

所谓“因子”,就是衡量股票好坏的量化标准。你可以把它理解为筛选股票的不同筛孔:估值、成长、质量、规模、波动率,本质上都在回答“这只股票凭什么被留下”。

估值因子
便宜

例如 PE、PB,本质是用更低价格买同等价值资产。

成长因子
未来可期

例如营收增速、净利润增速,关注企业扩张能力。

质量因子
公司健康

例如 ROE、毛利率,强调盈利能力和财务稳健。

这一层最重要的认知是:不存在永远有效的“圣杯因子”。市场风格会轮动,单一因子会阶段性失灵。多因子模型的意义,不是找到唯一真理,而是通过组合多个因子,分散单因子失效风险。

第二层:数据处理

多因子模型的上限,往往由数据质量决定。原始数据不是现成答案,而是一堆混杂噪音的原料。

必须掌握的三个基础动作

  • 异常值处理:极端 PE、极端增长率等数据,会严重扭曲结果,通常要做缩尾或截尾。
  • 缺失值处理:要明确到底是剔除样本,还是用行业均值等方式填充。
  • 标准化处理:把不同量纲的因子放到同一坐标系,例如使用排名或 Z-Score。

这一层也是“垃圾进,垃圾出”最直接的体现。很多初学者忽略数据清洗,直接拿原始数据回测,结果看起来完美,实盘却极易崩溃。

第三层:模型构建

多因子模型最常见的骨架,就是“单因子打分 + 因子加权 + 综合排序 + 形成组合”。

单因子打分

先让每只股票在每个因子上都得到一个可比的分数。例如市盈率越低分越高、成长越快分越高、ROE 越强分越高。

因子加权

然后再把多个因子按权重加总,形成综合得分。加权方式本身,体现的就是你的投资哲学:

  • 等权加权:简单稳健,适合作为起点。
  • IC 加权:按因子历史预测能力分配权重。
  • 因子收益率加权:根据历史表现强弱调整权重。

形成组合

最后,按照综合得分选出前 50 或前 100 只股票,按等权或市值权重建仓,并按固定周期再平衡。

这一层最常见的误区,是过度追求“历史最优权重”。一个在历史数据上拟合得极其完美的模型,往往在未来很脆弱。

第四层:深入优化与风控

如果说前面三层是把模型做出来,那么这一层是把它从“回测作品”变成“有实战可能的策略”。

避免回测幻象

  • 样本外测试:不能用全部历史同时决定选什么因子、怎么加权,再拿同一段历史证明自己。
  • 滚动回测:尽量模拟“当时只能看到当时信息”的真实决策过程。

控制风险暴露

简单多因子组合,往往会无意中集中在某些行业、大小盘或风格上。因此常见的实战处理包括:

  • 行业中性化:避免把收益全押在某个行业风格上。
  • 市值中性化:控制组合偏向大盘或小盘的程度。
  • 交易成本纳入:佣金、印花税、冲击成本会吞噬高换手策略的收益。

这一步常常决定策略能不能活下来。很多看起来很漂亮的回测,一旦把现实中的换手、滑点和流动性考虑进去,就会变得完全不一样。

第五层:动态视角与策略哲学

真正的多因子实战,不是把模型写完就结束,而是把它当成一个需要持续监控、维护和迭代的动态系统。

因子会失效,也会轮动

任何因子都可能在一段时间里表现很好,也可能在另一段时间里长期失灵。因此需要持续跟踪当期 IC、因子收益和背后的宏观环境,而不是迷信“某个因子永远好用”。

真正的竞争力来自新因子与策略组合

当市场上越来越多人都在使用同样的公开因子时,边际优势会被压缩。真正的 Alpha 更可能来自你对商业模式、行业变化和企业行为的深入理解,比如研发投入占比、管理层持股变化等更有逻辑支撑的新因子。

此外,成熟的量化投资者通常不会只运行一个模型,而是管理多个细分策略,再把它们当成“策略组合”来配置,从而进一步分散风险。

最后的底线:保持敬畏

多因子模型本质上是对历史规律的总结,不是预测未来的水晶球。市场结构会变,极端行情会来,模型会暂时失灵。最终保护你的,不只是模型本身,而是资金管理、风控纪律和对策略边界的清醒认识。

从入门到精髓,真正升级的是什么

多因子模型最核心的升级,不是“从简单到复杂”,而是“从会算分到会管理系统”。

  • 入门者关注的是因子和打分。
  • 进阶者关注的是数据质量、回测方法和组合约束。
  • 成熟者关注的是因子轮动、策略拥挤度和整个系统的生命周期。

所以,多因子模型的精髓从来不是某个固定公式,而是你能不能在量化框架下,把认知、数据、模型、风控和迭代整合成一套长期可用的方法。