您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:德邦金工机器学习专题之二:机器学习残差因子表现归因 - 发现报告
当前位置:首页/其他报告/报告详情/

德邦金工机器学习专题之二:机器学习残差因子表现归因

2021-11-24肖承志德邦证券学***
德邦金工机器学习专题之二:机器学习残差因子表现归因

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 金融工程专题 深度报告 金融工程专题 2021年11月24日 金融工程专题 证券分析师 肖承志 姓名 资格编号:S0120521080003 邮箱:xiaocz@tebon.com.cn 资格编号:S11305XXXXXX 港股执业证号:非必填 邮箱:xxxxx@tebon.com.cn 研究助理 相关研究 1. 《机器学习因子:在线性因子模型中捕获非线性—德邦金工文献精译第一期》 2021.9.17 2. 《利用机器学习捕捉因子的非线性效应—德邦金工机器学习专题之一》 2021.10.18 机器学习残差因子表现归因 ——德邦金工机器学习专题之二 [Table_Summary] 投资要点:  线性回归的残差收益率可以分解。残差收益率可以由自变量的非线性函数、自变量不蕴含的信息和其他因素解释。  用机器学习模型可以拟合自变量的非线性函数。用机器学习模型拟合残差收益率,可以对自变量的非线性函数进行建模。  构造机器学习残差因子。机器学习模型的预测值为机器学习因子,该因子对风格因子做正交化处理,获得机器学习残差因子。  使用机器学习残差因子选股的投资组合没有明显的风格。机器学习残差因子与风格因子线性不相关,因而根据该因子选股基本没有风格偏好。  全市场选股的超额收益归因。机器学习残差因子的选股能力大部分不能被风格、行业主动暴露解释。大部分超额收益来源于特质选股能力,并且该部分超额收益很稳定。  全市场选股的指数成分归因。全市场选股构造的投资组合在沪深300指数、中证500指数成分股以及两指数成分股以外股票这三个股票池中均有选股,其中最后一类小市值的股票最多,且小市值股票带来最多的收益。  全市场选股的策略容量较大。基于每日交易个股10%交易额的假设,在超百亿规模情况下投资组合也有可观的超额收益。  计算调仓完成度。我们定义和计算了调仓完成度,该指标反映持仓和策略相符合的程度。  机器学习残差因子在不同的股票池的选股能力严重分化。机器学习残差因子在全市场的选股效果较好,但在大、中市值股票内选股的效果一般,这与大、中市值股票定价的有效性相关。  通过双因子选股法将机器学习残差因子与风格因子组合。机器学习残差因子不筛选风格,我们用该因子做第一次分组,再用各个风格因子做第二次分组,测试了双因子选股方法的效果。许多风格因子在高机器学习残差因子暴露的股票池内体现出很强的选股能力。  风险提示:海外市场波动风险,宏观数据、政策变化风险,模型失效风险 金融工程专题 2 / 16 请务必阅读正文之后的信息披露和法律声明 内容目录 1. 前言 ...................................................................................................................... 4 2. 介绍 ...................................................................................................................... 4 3. 方法 ...................................................................................................................... 5 3.1. 模型训练和选股方法 ..................................................................................... 5 3.2. 风格、行业、成分归因方法 ........................................................................... 5 3.3. 容量测试方法 ............................................................................................... 6 3.4. 双因子分组方法 ............................................................................................ 6 4. 结果 ...................................................................................................................... 6 4.1. 全市场选股分组回测 ..................................................................................... 7 4.2. 全市场选股归因 ............................................................................................ 7 4.3. 全市场选股策略容量测试 ............................................................................ 10 4.4. 指数成分股选股 .......................................................................................... 12 4.5. 双因子分组 ................................................................................................ 14 5. 结论 .................................................................................................................... 14 6. 风险提示 ............................................................................................................. 15 信息披露 .................................................................................................................. 16 金融工程专题 3 / 16 请务必阅读正文之后的信息披露和法律声明 图表目录 图1:全市场选股分组回测...........................................................................................7 图2:全市场选股组10回报的行业和风格归因 ..............................................................8 图3:全市场选股组10回报的指数成分归因 .................................................................9 图4:全市场选股容量测试,各组净值曲线 ................................................................. 10 图5:全市场选股容量测试,各组超额收益曲线 .......................................................... 11 图6:调仓完成度与资金量的关系............................................................................... 12 图7:沪深300指数成分股选股的回测结果................................................................. 12 图8:中证500指数成分股选股的回测结果................................................................. 13 图9:沪深300指数、中证500指数成分股以外选股的回测结果 .................................. 13 图10:双因子分组回测结果 ....................................................................................... 14 表1:行业平均主动暴露及年化超额收益率贡献 ............................................................7 表2:因子平均主动暴露及年化超额收益率贡献 ............................................................8 金融工程专题 4 / 16 请务必阅读正文之后的信息披露和法律声明 1. 前言 我们在上一篇报告《利用机器学习捕捉因子的非线性效应》中构造了一个机器学习残差因子,并用该因子在全A股市场中进行了分组回测。回测的结果表明,因子具有较强的选股能力,因子暴露最高的组具有比较稳健的超额收益。在这篇报告中,我们首先对因子的选股能力进行归因,然后对投资组合的容量进行测试,再测试因子在不同的股票池中的选股能力。最后,我们尝试将机器学习残差因子与风格因子进行结合。 2. 介绍 多元线性回归被广泛应用于多因子选股的研究和实践当中。它关注的是本期因子暴露与下一期股票回报之间的线性关系。 푅푇=푋푇−Δ푇∙푓푇+ 휀푇, (1) 其中,푅푇为下一期的股票回报向量,푋푇−Δ