您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[格林大华期货]:Barra模型专题报告(四):规模、流动性因子 - 发现报告
当前位置:首页/其他报告/报告详情/

Barra模型专题报告(四):规模、流动性因子

2022-03-24-格林大华期货十***
Barra模型专题报告(四):规模、流动性因子

摘要2018年8月MSCI明晟公司发布了针对中国市场的模型BarraChinaEquityModel(CNE6),包括9个一级因子、21个二级因子、46个三级因子。本文介绍了因子计算方法,以沪深300样本股为范围,回溯了2018-01-01至2022-02-28的因子表现,并对回测结果给出了现实意义的解释。本期分析的六个因子中,两个规模因子表现优异,因子设计希望选出市值相对小、成长空间大的股票,加之沪深300样本股市值普遍较大,样本股中“小而美”的股票,在全市场中实际上是大而美,可见规模因子与其他因素叠加的巨大潜力,值得继续关注。三个等权流动性因子表现弱于指数,经过指数加权改造后表现反超指数,说明指数加权对近期数据赋予更大权重,并配合半衰期调节权重大小,这种Barra模型常用的加权方法不仅符合人类记忆特征,在实证中同样切实有效。专题报告2022年3月24日格林大华量化研究联系电话:0371-56518942Barra模型专题报告(四):规模、流动性因子 一.Size规模1.Logofmarketcapitalization市值的自然对数当前企业市值的自然对数,即该因子当前的数值。市值,即市场对企业的估值。一方面,市值等于股价乘以股本,在股本变动极少的情况下,市值与股价是完全相关关系,与股价等比例变动,具有一定的波动性。另一方面,市值是一种存量型数据,与企业净资产、营收规模等正相关,会随着企业壮大、预期发展向好而增加,随着经营管理不善、行业夕阳西下而减小,具有一定的稳定性。图1:流通市值分区间图2:流通市值分市场如图1所示,对A股全市场截止2021年12月31日的流通市值分区间统计股票数,20亿到60亿的有1917只股票,占比42%;60亿到300亿的有1850只股票,占比40%,是分布较多的两个区间。如图2所示,对A股全市场截止2021年12月31日的流通市值分市场计算平均值,上证主板和深证主板的平均市值均超过了200亿,而科创板的平均市值并不低于中小板和创业板。国内外的实证研究中发现,市值较小的股票有着略高的收益率,即股市中的规模效应,且规模效应是非线性的,即对于市值最小的企业最为显著。而经济中的规模效应是指增加企业规模会减少外部交易成本,提高整体经济效益,这与股市中的规模效应并不相同。 cUdVhY7UoPmN7NaOaQnPrRoMpNeRoOoNfQpNtO9PmMuNNZrNmMwMqMyR股市中,投资者倾向寻找“小而美”的企业,“小”意味着企业处于发展初期,未来成长空间巨大。“美”意味着企业走在经营正规,未来能够兑现预期。小可以用成立时间和股票市值来直接衡量,而美需要对行业的熟悉和企业的判断,往往难以界定。因此市值小的企业固然成长性很好,同时风险性不低,而且透明度和关注度相对较小。从这个角度,小市值股票的高收益率可以看做是一种风险补偿。小市值的股票可以通过较少的资金撬动股价,也许是对其长期价值的看好,也许是对其短期走势的炒作,当股价有一小波拉升,吸引到投资者关注的目光时,风险爱好型投资者可能会追涨,股价有望延续上升。从这个角度,小市值股票的高收益率可以看做是羊群效应和动量效应的结果。2.Cubeofsizeexposure市值立方的暴露将市值的立方与市值的自然对数通过回归权重正交化,最后再截尾化和标准化,即可得到因子数值。正交分解是指将一个变量投影到两个互不相关的坐标轴上。例如,一个物体在斜面上滑动,可以将重力分解为垂直于斜面的摩擦力和平行于斜面的滑动力,这样重力所产生的两个效果经过分解就一目了然,且两个效果作用方向相互垂直,作用结果互不干扰。图3:立方函数和对数函数将市值的立方正交化,是将其首先剔除与市值的自然对数完全相关的部分,剩余的 部分与市值的自然对数无关,称为对市值的暴露。如图3所示,在市值10亿-1000亿的范围内,立方函数极巨膨胀,起初平缓,随后陡峭,相比之下对数函数已近似退化为X轴,立方函数与X轴的夹角随着曲线陡峭而逐渐增大,对X轴的投影逐渐减小,对Y轴的投影逐渐增大,因此市值的暴露也逐渐增大。可见该因子的数值仍然会随着市值的增大而增大。缩尾化是指以均值加减三倍标准差为边界,截断边界以外的部分,保留边界以内的部分,即将异常值用边界值替代。标准化通常将原序列减去均值再除以标准差,使新序列的均值为0且标准差为1。这样不同因子间就排除了异常、统一了量纲,可以在同一水平下进行比较。3.因子回测结果因子名称ICIRRankICRankIC_IR因子收益率LNCAP2.46%17.5%-0.75%-4.71%0.058%MIDCAP2.34%16.6%-0.75%-4.71%0.055%表3:Size因子回测结果图4:Size因子累计收益率 如图4所示,从因子收益曲线来看,两个规模因子走势十分相似。不管指数是探底还是拉升,规模因子走出了一条平稳增长的曲线,回撤也很小,绝大部分时间跑赢指数,整体收益十分可观。图5:沪深300样本股流通市值分布如图5所示,截止2021年12月31日,沪深300样本股的流通市值分布,对比全市场的流通市值分布,结果严重右偏,样本股中流通市值最少的个股有也300亿之多,这个数值在全市场中已经可以排名前13%。买多沪深300样本股的小市值个股,并不等于买多全市场中的小市值个股。规模因子之所以在沪深300样本股中收益优秀,是因为入选样本股已经市场对公司经营现状的认可,市值相对较小的个股在300只样本股的范围内是小而美,而放眼全市场的范围内则是大而美。可见规模因子与其他因素共同作用的结果是值得期待的。二.Liquidity,流动性1.MonthlyShareTurnover,月度换手率最近一个月参与交易的股本占比的对数,也就是每日换手率之和的对数,即因子数值。换手率即成交量除以股本,即有多少股经过买卖双方易手。换手率越高,说明个股 的关注度越高、流动性越好,同时也说明市场对于个股未来走势的分歧越大。换手率可以看做多空博弈的过程,是对双方参与力量激烈规模的度量;波动率可以看做多空博弈的结果,是对双方主导地位频繁变换的度量。另外,换手率偏重微观视角,是当日日内交易过程的描述;波动率偏重短期视角,是一段时间交易结果的描述。例如,高换手率低波动率说明多空双方虽然激烈交锋,但是一方始终能够压制住另一方,局势少有反转。图6:振幅和换手率如图6所示,将每日的最高价减去最低价再除以昨收价,从振幅的角度描述日内波动率。将振幅分区间计算平均换手率,总体来看,振幅与换手率呈现高度正相关,振幅越大,换手率越高。当然,有些个股的股本或者市值比较大时,成交量可能会被股本稀释,导致换手率偏低。如果单看成交量,又会因为股本较大,导致成交量偏高。这里体现了指标设计结果的非线性,因此有些投资者会使用量比来衡量成交量。量比即当日的成交量与最近5日平均成交量的比值,用自身与自身比较,可以剔除股本大小的影响。2.QuarterlyShareTurnover,季度换手率最近三个月参与交易的股本占比的对数,也就是每日换手率之和的对数,即因子数 值。国内外的实证研究中发现,换手率较高的股票,对应着正的风险溢价,虽然该结论在某些市场中还存在争议,但是我们不妨分析一下其中的合理性。一种角度是换手率反映了投资者的非理性情绪。燥热的乐观情绪会推高股价的上涨,忽视其中的风险;冷清的悲观情绪会导致踩踏式卖出,打穿价值的基础。因此,脱离了价值体系的高换手率在盲目乐观和过度自信下可以获得超额收益率。股市中不仅有冷冰冰的架构公式、理性分析,还有一个个鲜活的生命个体,以及他们非理性的参与方式。别人的错误并不一定会导致他们的损失,而忽略别人的错误,才是自己真正的犯错误。另一种角度是换手率反映了投资者的关注度和意见分歧。换手率越高,说明关注度越高,意见分歧越大,那么股票的收益率势必会受到相左意见的压制。而当趋势越来越明朗时,反对意见的力量逐渐退散,收益率会得到释放,以此回馈投资者的真知灼见。3.AnnualShareTurnover,年度换手率最近十二个月参与交易的股本占比的对数,也就是每日换手率之和的对数,即因子数值。换手率除了与成交量、量比等联合使用,还可以用于近似计算成本价。在我们没有每笔交易这样细颗粒度的数据,仅有每日行情这样粗颗粒度的数据时,可以从当前时刻向过去推算,最近若干天内换手率累计超过100%,即累计成交量超过流通股本时,用累计成交额除以累计成交量得到平均交易价格,可以近似估计成本价。用布林带的支撑位代表成本价,是从价格走势标准差的角度,而换手率是一种更贴近成本价实际含义的算法。4.AnnualTradedValueRatio,年度换手率加权和 将最近252天的每日换手率,指数加权求和,即可得到因子数值。指数加权平均或者求和,是Barra因子中常用的计算方式,参照人类记忆的特点,对近期的数值赋予更高的权重。半衰期为63天,是窗口期252天的四分之一,可知前126天的权重之和为78%,因此该因子主要使用了最近半年的每日换手率图7:指数加权每日权重图8:指数加权累计权重5.因子回测结果图9:Liquidity因子累计收益率 因子名称ICIRRankICRankIC_IR因子收益率STOM0.29%1.48%-1.12%-5.20%0.006%STOQ0.15%0.76%-0.87%-4.04%0.002%STOA0.13%0.71%-0.45%-2.16%0.002%ATVR1.08%5.88%-0.12%-0.58%0.023%表2:Liquidity因子回测结果如图9所示,从因子收益曲线来看,月度、季度、年度换手率之和的三个因子走势相近,与指数对比回撤较小、涨幅较低,最终收于零线附近,总体表现弱于指数。经过指数加权的年度换手率因子ATVR表现优于其他三个因子,在指数下跌时能够维持在零位附近震荡,在指数上攻时能够同步取得扩大战果,总体表现也略强于指数。由此可见,等权重的换手率之和,经过指数加权后,对近期换手率调高权重,对远期换手率降低权重,再加总后的换手率之和可以改善收益。从实证角度证明了Barra因子常用的指数加权和半衰期方法,确实有其妙处。 附录1Barra因子结构Barra模型是MSCI明晟公司研发的金融风控模型,把个股收益分解为市场(国家)因素、行业因素、风格因素,其中风格因素即描述个股特征的风险因子,主要应用于多因子选股分析和结构化风险因子分析。第一个为美国市场设计的多因子模型于1975年发布,称为BarraUSEquityModel1(USE1),USE2于1985年发布,USE3于1997年发布,USE4于2011年发布。Barra模型经受了众多金融机构的实证检验,经久不衰,生机蓬勃。2012年7月明晟公司终于发布了针对中国市场的模型BarraChinaEquityModel(CNE5),包括10个大类因子、21个小类因子。2018年8月发布的CNE6,将因子进一步细分和扩充,包括9个一级因子、21个二级因子、46个三级因子,9个一级因子分别是波动率(Volatility)、动量(Momentum)、价值(Value)、规模(Size)、流动性(Liquidity)、质量(Quality)、成长(Growth)、分红(DividendYield)、情绪(Sentiment)。图10:CNE6因子结构 附录2因子评价指标一.IC(InformationCoefficient,信息系数)IC值是指对于一揽子股票和某一个因子,当期的因子值序列与下期的收益率序列之间的Pearson线性相关系数,正相关性越高,说明该因子的数值对于股票收益率的预测能力越好,因子的有效性越强。当然,如果呈负相关性,绝对值越大越好,即该因子是反向因子,对股票收益率同样具有良好的预测能力。日度更新因子在历史上的每一天都有一个IC值,在回测区间的若干天内对若干个IC值取平均数,可以得到因子的IC均值,用来描述该因子在回测区间内的有效性,通常认为IC均值大于3%或者小于-3%时因子比较有效。由于IC值直接使用数值计算相关系数,就难免受到异常值和量纲的影响