您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案

2024-05-14杨怡玲、刘静涵东方证券x***
因子选股系列之一〇三:DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 金融工程 | 专题报告 研究结论 FactorVAE模型架构 ⚫ FactorVAE模型,来自国际人工智能会议AAAI 2022。原论文中提出了一种新的基于变分自编码器的概率动态因子模型,以弥合噪声数据与有效因子之间的差距。本文在原论文基础上进行修改优化,所得选股因子在沪深300指数增强组合中表现优异。 ⚫ FactorVAE模型融合了变分自编码器与概率动态因子模型的思想,建立股票收益率预测模型,学习输入特征和标签之间的关系:(1)采用变分自编码器的编码器-解码器架构,有助于模型学习到数据分布的结构,并且可以在潜在空间中生成新样本;(2)采用概率动态因子模型的思想,将因子作为VAE模型中的潜在变量,提取动态公共因子的分布,从而起到降维降噪的作用。(3)采用一种“前验-后验”的学习方法,将预测股票收益率的问题转化成预测有效因子,使用标签收益率指导模型提取有效因子。 DFQ-FactorVAE模型优势 ⚫ DFQ-FactorVAE模型所得因子的稳定性、在沪深300股票池中的多头表现突出: (1)在中证全指股票池中, DFQ-FactorVAE模型所得到因子的稳定性明显最强,ICIR、RANKICIR、多头日超额收益夏普比均为最高。测试集(2020.01.01-2024.03.31)上rankic达到15%,rankicir达到1.38,20分组多头日度超额年化收益率达到31.75%,多头日超额收益夏普比3.52,多头日度超额收益最大回撤8.28%,多头月度胜率88%,月均单边换手79%。分组单调性好。 (2)在沪深300股票池中, DFQ-FactorVAE模型所得到因子的多头表现明显最强。测试集上rankic达到10.6%,rankicir达到0.6,5分组多头日度超额年化收益率达到14.47%,多头日超额收益夏普比1.72,多头日度超额收益最大回撤6.74%,月均单边换手54%。分组单调性好。分年表现上未出现明显衰减。 ⚫ DFQ-FactorVAE模型所得因子稳定性突出,与模型的VAE架构和概率框架有关。VAE架构有助于模型学习到数据分布的结构,样本外泛化能力更强。概率框架考虑到了风险建模,更适合含有噪声的股票收益率预测。 ⚫ DFQ-FactorVAE模型所得因子在沪深300股票池中的多头表现突出,与模型的因子模型架构有关。先验因子对沪深300股票的解释度最高,平均能达到36.5%,其次为中证500成分股的27.95%,中证1000成分股的25.45%,全市场解释度最低,为20.78%。 DFQ-FactorVAE模型在沪深300指增组合中的表现 ⚫ DFQ-FactorVAE模型所得到的合成因子在沪深300指增组合中表现十分突出: (1)整体表现:2020年以来年化信息比达到2.55,年化对冲收益13.53%,年化跟踪误差5.03%,超额收益最大回撤仅为5.35%,单边年换手7.67倍。 (2)分年表现:2020-2023每年取得10%以上的正超额,2023年超额收益达16%。2024年前三个月超额收益为-0.36%。 (3) 风格暴露:相对基准沪深300指数,组合在市值、信息确定性、成长维度具有明显的负向暴露,但在BETA、流动性、波动率、估值等维度都没有明显暴露。 (4)成分股约束:设置100%成分内选股增强,可以明显提高组合业绩表现稳定性。跟踪误差可以降低到4.37%,超额收益最大回撤降低到3.31%,最大回撤恢复仅需30天,并且仍然可以获得超过10%的年化超额。 风险提示 1. 量化模型失效风险。 2. 极端市场环境对模型的影响。 报告发布日期 2024年05月14日 杨怡玲 yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 刘静涵 021-63325888*3211 liujinghan@orientsec.com.cn 执业证书编号:S0860520080003 香港证监会牌照:BSX840 基本面因子的重构:——因子选股系列之一〇二 2024-03-21 自适应时空图网络周频alpha模型:——因子选股系列之一〇一 2024-02-28 DFQ-HIST:添加图信息的选股因子挖掘系统:——因子选股系列之一百 2024-02-07 基于异构图神经网络的股票关联因子挖掘:——因子选股系列之九十九 2024-01-02 DFQ-TRA:多交易模式学习因子挖掘系统:——因子选股系列之九十七 2023-11-14 DFQ强化学习因子组合挖掘系统:——因子选股系列之九十五 2023-08-17 DFQ遗传规划价量因子挖掘系统:——因子选股系列之九十 2023-05-28 DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案 ——因子选股系列之一〇三 金融工程 | 专题报告 —— DFQ-FactorVAE:融合变分自编码器和概率动态因子模型的alpha预测方案 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、模型概述 ................................................................................................. 5 1.1 自编码器(Auto Encoder, AE) ................................................................................... 5 1.2 变分自编码器(Variational Auto-Encoder, VAE) ........................................................ 5 1.3 因子模型(Factor Model) .......................................................................................... 6 1.4 概率动态因子模型(Probabilistic Dynamic Factor Model) ......................................... 6 1.5 FactorVAE .................................................................................................................... 6 二、模型架构 ................................................................................................. 7 2.1 模型训练和预测过程 ..................................................................................................... 7 2.2 特征提取器 ................................................................................................................... 8 2.3 因子编码器 ................................................................................................................... 9 2.4 因子解码器 ................................................................................................................. 10 2.5 因子预测器 ................................................................................................................. 11 三、模型说明 ............................................................................................... 12 3.1 数据说明 .................................................................................................................... 12 3.2 模型输入 .................................................................................................................... 12 3.3 模型参数 .................................................................................................................... 13 四、模型结果 ............................................................................................... 14 4.1 运算用时 .................................................................................................................... 14 4.2 因子绩效表现 ............................................................................................................. 14 4.3 随机种子的影响 .......................................................................................................... 21 4.4 与其他量价模型相关性 ............................................................................................... 21 4.5 中性化因子表现 .......................................................................................................... 23 五、沪深300指数增强组合 ......................................................................... 24 5.1 指数增强组合构建说明 .....................................