您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案 - 发现报告

因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案

2024-05-14杨怡玲、刘静涵东方证券x***
因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案

报告发布日期 DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案 ——因子选股系列之一〇三 杨怡玲yangyiling@orientsec.com.cn执业证书编号:S0860523040002刘静涵021-63325888*3211liujinghan@orientsec.com.cn执业证书编号:S0860520080003香港证监会牌照:BSX840 研究结论 FactorVAE模型架构 ⚫FactorVAE模型,来自国际人工智能会议AAAI 2022。原论文中提出了一种新的基于变分自编码器的概率动态因子模型,以弥合噪声数据与有效因子之间的差距。本文在原论文基础上进行修改优化,所得选股因子在沪深300指数增强组合中表现优异。 ⚫FactorVAE模型融合了变分自编码器与概率动态因子模型的思想,建立股票收益率预测模型,学习输入特征和标签之间的关系:(1)采用变分自编码器的编码器-解码器架构,有助于模型学习到数据分布的结构,并且可以在潜在空间中生成新样本;(2)采用概率动态因子模型的思想,将因子作为VAE模型中的潜在变量,提取动态公共因子的分布,从而起到降维降噪的作用。(3)采用一种“前验-后验”的学习方法,将预测股票收益率的问题转化成预测有效因子,使用标签收益率指导模型提取有效因子。 基本面因子的重构:——因子选股系列之一〇二2024-03-21自适应时空图网络周频alpha模型:——因子选股系列之一〇一2024-02-28DFQ-HIST:添加图信息的选股因子挖掘系统:——因子选股系列之一百2024-02-07基 于 异 构 图 神 经 网 络 的 股 票 关 联 因 子 挖掘:——因子选股系列之九十九2024-01-02DFQ-TRA: 多 交 易 模 式 学 习 因 子 挖 掘 系统:——因子选股系列之九十七2023-11-14DFQ强化学习因子组合挖掘系统:——因子选股系列之九十五2023-08-17DFQ遗传规划价量因子挖掘系统:——因子选股系列之九十2023-05-28 DFQ-FactorVAE模型优势 ⚫DFQ-FactorVAE模型所得因子的稳定性、在沪深300股票池中的多头表现突出: (1)在中证全指股票池中,DFQ-FactorVAE模型所得到因子的稳定性明显最强,ICIR、RANKICIR、 多 头 日 超 额 收 益 夏 普 比 均 为 最 高 。测 试 集 (2020.01.01-2024.03.31)上rankic达到15%,rankicir达到1.38,20分组多头日度超额年化收益率达到31.75%,多头日超额收益夏普比3.52,多头日度超额收益最大回撤8.28%,多头月度胜率88%,月均单边换手79%。分组单调性好。 (2)在沪深300股票池中,DFQ-FactorVAE模型所得到因子的多头表现明显最强。测试集上rankic达到10.6%,rankicir达到0.6,5分组多头日度超额年化收益率达到14.47%,多头日超额收益夏普比1.72,多头日度超额收益最大回撤6.74%,月均单边换手54%。分组单调性好。分年表现上未出现明显衰减。 ⚫DFQ-FactorVAE模型所得因子稳定性突出,与模型的VAE架构和概率框架有关。VAE架构有助于模型学习到数据分布的结构,样本外泛化能力更强。概率框架考虑到了风险建模,更适合含有噪声的股票收益率预测。 ⚫DFQ-FactorVAE模型所得因子在沪深300股票池中的多头表现突出,与模型的因子模型架构有关。先验因子对沪深300股票的解释度最高,平均能达到36.5%,其次为中证500成分股的27.95%,中证1000成分股的25.45%,全市场解释度最低,为20.78%。 DFQ-FactorVAE模型在沪深300指增组合中的表现 ⚫DFQ-FactorVAE模型所得到的合成因子在沪深300指增组合中表现十分突出: (1)整体表现:2020年以来年化信息比达到2.55,年化对冲收益13.53%,年化跟踪误差5.03%,超额收益最大回撤仅为5.35%,单边年换手7.67倍。 (2)分年表现:2020-2023每年取得10%以上的正超额,2023年超额收益达16%。2024年前三个月超额收益为-0.36%。 (3)风格暴露:相对基准沪深300指数,组合在市值、信息确定性、成长维度具有明显的负向暴露,但在BETA、流动性、波动率、估值等维度都没有明显暴露。 (4)成分股约束:设置100%成分内选股增强,可以明显提高组合业绩表现稳定性。跟踪误差可以降低到4.37%,超额收益最大回撤降低到3.31%,最大回撤恢复仅需30天,并且仍然可以获得超过10%的年化超额。 风险提示 1.量化模型失效风险。2.极端市场环境对模型的影响。 目录 一、模型概述.................................................................................................5 1.1自编码器(Auto Encoder, AE)...................................................................................51.2变分自编码器(Variational Auto-Encoder, VAE)........................................................51.3因子模型(Factor Model)..........................................................................................61.4概率动态因子模型(Probabilistic Dynamic Factor Model).........................................61.5 FactorVAE....................................................................................................................6 二、模型架构.................................................................................................7 2.1模型训练和预测过程.....................................................................................................72.2特征提取器...................................................................................................................82.3因子编码器...................................................................................................................92.4因子解码器.................................................................................................................102.5因子预测器.................................................................................................................11 三、模型说明...............................................................................................12 3.1数据说明....................................................................................................................123.2模型输入....................................................................................................................123.3模型参数....................................................................................................................13 四、模型结果...............................................................................................14 4.1运算用时....................................................................................................................144.2因子绩效表现.............................................................................................................144.3随机种子的影响..........................................................................................................214.4与其他量价模型相关性...............................................................................................214.5中性化因子表现..........................................................................................................23 五、沪深300指数增强组合.........................................................................24 5.1指数增强组合构建说明...............................................................................................245.2指数增强组合的业绩表现...........................................................................................245.3指数增强组合的风格暴露...........................................................................................255.4组合优化约束对组合业绩的影响.....