您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华安证券]:“学海拾珠”系列之一百六十八:机器学习与基金特征如何选择正Alpha基金? - 发现报告

“学海拾珠”系列之一百六十八:机器学习与基金特征如何选择正Alpha基金?

2023-11-29严佳炜、钱静闲华安证券记***
“学海拾珠”系列之一百六十八:机器学习与基金特征如何选择正Alpha基金?

主要观点: 联系人:钱静闲执业证书号:S0010522090002邮箱:qianjx@hazq.com ⚫传统线性方法与文献研究方法 传统研究中,某些基金特征可以用来预测基金的业绩(Jones和Mo,2020)。通常会每月或每季度对基金基于特征进行排名,然后将资金分成五组或十组,评估这些基金组合的多空业绩。然而只有少部分特征在扣除全部费用后能选择出正Alpha的多头基金组合。 文献使用17个基金特征,采用三种机器学习方法:弹性网络(elastic net,)、梯度提升(gradient boosting)和随机森林(randomforests)来预测基金alpha,并将预测值前10%的基金构建成组合。同时对比普通最小二乘法(OLS)以及两个朴素策略:基金等权组合和资产加权组合。 ⚫机器学习方法能够显著优化基金多头策略 梯度提升和随机森林下基金多头组合的费后净Alpha为每年2.36%和2.69%(FF5因子+动量模型评估)。相比之下,基于线性方法(弹性网络和OLS)的组合净alpha为每年1.09%和1.21%,统计不显著,等权和资产加权组合分别实现了每年-0.22%和-0.44%的负的净Alpha。 1.《企业季度投资激增与股票横截面收益——“学海拾珠”系列之一百六十七》 2.《基金波动率来源与基金业绩——“学海拾珠”系列之一百六十六》 因此,美国主动基金在扣除成本后平均业绩不及被动基金(平均净Alpha为负),线性模型可以帮助投资者避免业绩不佳的基金(正向不显著的Alpha),只有通过非线性和相互作用的机器学习方法才能通过主动管理获益(正的显著的Alpha)。 3.《均衡配置宏观经济因子:分散效果如何?——“学海拾珠”系列之一百六十五》 4.《MemSum:基于多步情景马尔可夫 决 策 过 程 的 长 文 档 摘 要 提 取——“学海拾珠”系列之一百六十四》 ⚫基金特征与未来业绩之间的非线性关系 5.《奇异值分解熵对股市的动态预测能力——“学海拾珠”系列之一百六十三》 拆解结果后发现,value added、Alpha的t-统计值、市场Beta t-统计值和R²是梯度提升和随机森林方法中最重要的特征。基金主动程度与未来业绩之间存在高度的非线性关系,对于主动度更高的基金来说,过去的业绩是一个特别强大的预测因子。 6.《基金超额能力、规模报酬递减与价值创造——“学海拾珠”系列之一百六十二》 线性方法下,发现排名前10%的基金“太小”,机器学习有助于选择基金不仅因为它可以识别有Alpha的管理者,且可以识别Alpha不完全被规模报酬递减抵消的管理者。 7.《因子间相关性与横截面资产回报——“学海拾珠”系列之一百六十一》 8.《交易量对波动率的非对称效应——“学海拾珠”系列之一百六十》 ⚫风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。 正文目录 1简介..........................................................................................................................................................................................42数据..........................................................................................................................................................................................62.1CRSP样本数据.......................................................................................................................................................................62.2共同基金特征.........................................................................................................................................................................62.3目标与预测变量.....................................................................................................................................................................83机器学习方法.........................................................................................................................................................................93.1弹性网络(ELASTIC NET)...................................................................................................................................................103.2随机森林(RANDOM FORESTS).........................................................................................................................................103.3梯度提升(GRADIENT BOOSTING).....................................................................................................................................113.4超参数的交叉验证...............................................................................................................................................................114机器学习组合的业绩...........................................................................................................................................................114.1业绩评估方法.......................................................................................................................................................................114.2样本外费后业绩...................................................................................................................................................................125哪些特征和相互作用比较重要?......................................................................................................................................146结论........................................................................................................................................................................................19风险提示:.............................................................................................................................................................................................19 图表目录 图表1文章框架...........................................................................................................................................................................................................4图表2基金特征及其定义.........................................................................................................................................................................................8图表3基金特征:描述性统计................................................................................................................................................................................8图表4目标变量与基金特征的关系矩阵.............................................................................................................................................................9图表5基金组合的样本外ALPHA......................................................................................................................................................................