您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:德邦金工机器学习专题之四:动态因子筛选 - 发现报告
当前位置:首页/其他报告/报告详情/

德邦金工机器学习专题之四:动态因子筛选

2022-03-09肖承志、王成煜德邦证券能***
德邦金工机器学习专题之四:动态因子筛选

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 金融工程专题 深度报告 金融工程专题 2022年3月9日 金融工程专题 证券分析师 肖承志 资格编号:S0120521080003 邮箱:xiaocz@tebon.com.cn 研究助理 王成煜 邮箱:wangcy3@tebon.com.cn 相关研究 1. 《机器学习因子:在线性因子模型中捕获非线性—德邦金工文献精译第一期》 2021.9.17 2. 《利用机器学习捕捉因子的非线性效应—德邦金工机器学习专题之一》 2021.10.18 3. 《机器学习残差因子表现归因—德邦金工机器学习专题之二》 2021.11.24 4. 《基于财务与风格因子的机器学习选股—德邦金工机器学习专题之三》 2022.01.25 动态因子筛选 ——德邦金工机器学习专题之四 [Table_Summary] 投资要点:  本文构建了一个在多个股票池中均有效的选股因子。本文构建的策略在沪深300、中证500、中证1000和全市场范围内均有良好的表现。  每个时期筛选不同的财务因子。不同财务因子在同一时期的表现不同,同一个财务因子在不同时期的表现也不同,这是在每一期筛选不同财务因子的原因。  客观的因子筛选减少了数据窥探偏误。根据一套客观的方法论来动态筛选因子,而不是主观地选择一批历史上有效的因子,可以更好地防止数据窥探的发生。  财务因子可以分为信号因子与噪音因子。在任意一个时期,部分财务因子与当期的股票收益率有相关性,这类因子为信号因子;部分财务因子与当期股票收益率无相关性,这类因子为噪音因子。  寻找规律稳定的因子并利用其动量。根据历史数据,寻找规律稳定的因子,并利用这一规律进行选股,这本质上是在利用因子的动量。  每年度进行三次因子筛选。我们选择一季度报、中报和三季度报披露的截止日期进行因子筛选。这样可以兼顾数据的及时性和同步性。  分四个步骤对因子进行预处理。我们依次按以下四个步骤处理因子:无量纲化处理、舍弃空值比例大的项目、中位数去极值和填空值。  用边际筛选因子的方法逐步扩大因子池。以十个CNE5风格因子起点,在边际上逐个筛选信息增益最大的因子,重复这个边际筛选因子的操作直到获得足够多的因子。  使用机器学习模型评价因子池的有效性。以机器学习模型在验证集的表现作为因子池评价的依据。验证集的结果表明,前几个入选的财务因子的边际贡献显著,后入选的财务因子作用很有限。  构建一个各个因子等权的线性多因子模型。根据最近一个季度的各个因子的信息系数的符号来确定因子暴露方向,用线性组合的方法等权地将各个因子合成一个单因子,把该模型作为对照组模型。  用各种机器学习模型构建一个集成模型。我们使用包括随机森林、GBDT、XGBoost、LGBM、AdaBoost、神经网络、支持向量机等各类机器学习模型,构建了一个集成模型,该模型运用被筛选的因子进行训练、预测和选股。机器学习模型的表现远超线性多因子模型。  运用验证集评价、筛选机器学习模型以及确定权重。每一期,根据验证集的结果,集成模型中选用不同的机器学习模型种类、输入因子数量和权重。通过这种机制,尽可能避免数据窥探和筛选优质的机器学习模型。  风险提示:市场风格变化风险,模型失效风险,数据可用性风险 金融工程专题 2 / 24 请务必阅读正文之后的信息披露和法律声明 内容目录 1. 前言 ................................................................................................................................ 4 2. 方法 ................................................................................................................................ 4 2.1. 筛选因子的逻辑 .................................................................................................... 4 2.1.1. 噪音与信号 ................................................................................................. 4 2.1.2. 因子动量 .................................................................................................... 4 2.2. 因子库以及筛选方法 ............................................................................................ 5 2.2.1. 因子库和预处理 ......................................................................................... 5 2.2.2. 筛选因子时间点 ......................................................................................... 5 2.2.3. 边际筛选 .................................................................................................... 6 2.2.4. 因子评价 .................................................................................................... 6 2.2.5. 典型情况样例 ............................................................................................. 7 2.3. 预测模型 ............................................................................................................... 8 2.3.1. 线性多因子模型 ......................................................................................... 8 2.3.2. 机器学习模型列表 ...................................................................................... 9 2.3.3. 模型动态筛选与加权 .................................................................................. 9 2.4. 投资组合构造方法 .............................................................................................. 11 3. 结果 .............................................................................................................................. 11 3.1. 筛选因子 ............................................................................................................. 11 3.2. 分组回测 ............................................................................................................. 13 3.2.1. 线性多因子模型 ....................................................................................... 13 3.2.2. 沪深300指数增强 ................................................................................... 14 3.2.3. 中证500指数增强 ................................................................................... 16 3.2.4. 中证1000指数增强 ................................................................................. 18 3.2.5. 全市场选股 ............................................................................................... 19 4. 结论 .............................................................................................................................. 21 5. 附录:财务数据列表 ..................................................................................................... 22 6. 风险提示 ....................................................................................................................... 23 信息披露 ............................................................................................................................ 24 金融工程专题