您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:特征分布建模择时系列之二:物极必反,巧妙做空,特征成交量,模型终完备 - 发现报告

特征分布建模择时系列之二:物极必反,巧妙做空,特征成交量,模型终完备

2022-08-04王小川华创证券从***
特征分布建模择时系列之二:物极必反,巧妙做空,特征成交量,模型终完备

摘要 成交量指的是一个时间单位内对某项交易成交的数量。当供不应求时,人潮汹涌,都要买进,成交量自然放大;反之,供过于求,市场冷清无人,买盘稀少,成交量势必萎缩。而将人潮加以数值化,便是成交量。A股宽基指数有着明显的放量上涨,缩量下跌规律。但华创金工在过去的量化择时系列研报中,仅有与成交量放量上涨相关建模的历史报告。基于成交量的做空模型过去从未被市场与华创金工所提及,成交量的做空规律似乎在某个藏有宝物的盒子里面被锁着,因此华创金工试图探索成交量的做空规律,最终在A股的宽基指数进行实践,得到较为不错的回溯结果。 由于量能指标的期望收益分布呈现出明显的右偏V型形状,本文采用了一类巧妙的建模方法,将成交量建模趋于完善,最终在万得全A指数的特征成交量模型择时回溯结果为:年化收益28.19%,最大回撤40.54%,夏普比率1.018,胜率55.1%,盈亏比1.5。在上证指数的择时回溯结果为,年化收益25.79%,最大回撤32.83%,夏普比率1.019,胜率56.2%,盈亏比1.43。特征成交量择时模型的历史回溯表现优异。 风险提示: 策略基于历史数据的回测,不保证策略未来的有效性。 投资主题 报告亮点 本文试图寻找一把打开成交量的潘多拉魔盒的钥匙,去开创性地挖掘成交量模型的缩量做空与地量反弹,因此从成交量的特征分布进行切入,将市场划分为放量上涨区域,高位震荡区域,缩量下跌区域,地量反弹区域。并构建相应的择时策略,在放量上涨区域做多,在缩量下跌区域做空,在地量反弹区域中做多,在回溯中获得了远超宽基指数的择时收益。 投资逻辑 量能指标的期望收益特征分布呈现出明显的右偏V型形状。因此在量能指标大于1.15时候做多,该区域为放量上涨区域,放量上涨做多区域。当量能指标小于1.15且大于1的时候,这个区域可能刚刚经历了最活跃的大幅上涨放量,此时可能依旧有踏空资金保持着一定的做多力量,但是后续的做多跟进力量明显不足,因此刚经历了放量上涨后的市场可能还会有一小段脉冲,我们称之为高位震荡区域。当量能指标小于1,市场进入到了缩量区域,市场从高位震荡过渡到了下跌,量能指标的期望收益开始为负,该部分我们称之为缩量下跌区域,或缩量下跌做空区域。当量能指标极低的时候,该部分为地量反弹区域,或地量反弹做多区域。做多放量上涨区域和地量反弹区域,做空缩量下跌区域,是本文构建择时模型最重要的逻辑。 一、前言 众所周知,成交量指的是一个时间单位内对某项交易成交的数量。当供不应求时,人潮汹涌,都要买进,成交量自然放大;反之,供过于求,市场冷清无人,买盘稀少,成交量势必萎缩。而将人潮加以数值化,便是成交量。华创金工量化择时的开篇之作《成交量的奥秘:另类价量共振指标的择时》,将成交量与价格相结合,利用了低滞后的一类均线,得到价量共振指标,并最终在A股的宽基指数,诸如上证指数、全A指数、沪深300指数、中证500指数获得了较为稳定的收益(如图1),该模型我们称之为成交量V1模型。在《牛市让利,熊市得益,价量共振择时之二:如何规避放量下跌?》一文,围绕着市场牛熊划分和放量下跌情形,构造了成交量V2和V3模型。 A股宽基指数有着明显的放量上涨,缩量下跌规律。但是成交量V1V2和V3模型,都是围绕着做多建模,甚至是放量做多而展开的建模,那么成交量模型的缩量做空模型迄今尚未面世。基于成交量模型的做空过去从未被提及,成交量的做空规律从来都只是在某个藏有宝物的盒子里面被锁着,而本文试图去寻找一把打开潘多拉魔盒的钥匙,最终在A股的宽基指数进行实践,得到较为不错的回溯结果。 在华创金工的上一篇量化择时报告《特征分布建模择时系列之一:物极必反,龙虎榜机构模型》中,提及我们希望为现有的择时模型库继续带来增量信息,从其他影响因素不断挖掘。但是过去常用针对择时因子或择时指标探索的方式,大多都是分析因子是否与指数未来期望收益的正负相关性,并观测是否显著;虽然这种方法能够简洁了当的表明一个择时因子或择时指标与宽基指数的线性关系,比如择时指标值或因子值越大,市场的未来潜在收益率越高,那么择时因子与指数未来收益率呈现出显著的正相关关系,反之则是负相关关系。我们可能仅仅只是发现了其中的线性关系及其相关性,那么计算因子值与未来收益的相关性这种方式,可能就会忽略掉其中的非线性关系。因此该文在探索择时指标的方式,与以往的探索方式不同,会更加注重展示择时指标的内在结构,这样就能得到可能存在的非线性关系,基于非线性关系进而做出择时分析。 该文从行为金融有限注意力理论的角度对这部分数据进行切入,以龙虎榜中全部机构席位信息总和作为原料进行加工,透过不同机构席位释放的干扰信号,探究机构席位资金出现极端行为时,宽基指数所呈现的规律,并构建相应的择时策略。该文指出,龙虎榜机构资金净流入强度指标的期望收益分布图呈现出明显的非线性V字型,正收益来自两端,负收益来自中间。因此择时模型的构造逻辑为做多两边做空中间,于是采用了一类巧妙的建模方法,构建了沪深300指数相应的龙虎榜机构多空择时模型,年化收益率21.06%,最大回撤20.93%,年平均交易次数18.7次,夏普比率0.938,胜率61.4%,盈亏比1.45,择时模型的历史回溯表现较为优异。 而本文试图借鉴《特征分布建模择时系列之一:物极必反,龙虎榜机构模型》一文中的分析逻辑,得到特定成交量指标的期望收益分布图,去挖掘成交量模型的其余规律,所以本文不仅要打开成交量做空的那一盏神秘之灯,甚至发现成交量模型的其他奥秘。 图表1价量共振模型在A股宽基指数的历史回溯 二、成交量模型指标的剖析 在《成交量的奥秘:另类价量共振指标的择时》一文,提及价量共振指标的择时系统构建:成交量使用的移动平均线为AMA,而价格使用的移动平均线为BMA(移动平均线长度为L)。量能指标=AMA5/AMA100,即5日的AMA除以100日的AMA。价能指标=BMA(Today)/BMA(Today-3),当日的BMA除以前3个交易日的BMA。价量共振指标=价能×量能,价能乘以量能,当价量共振指标大于1.15则做多,否则平仓。由于价能指标的量纲相比量能指标显得微不足道,因此我们将建模的重点放在成交量指标,即量能指标,成交量的5日AMA均线/成交量的100日AMA均线,量能指标类似《特征分布建模择时系列之一:物极必反,龙虎榜机构模型》龙虎榜机构资金净流入强度指标,让不同交易日之间的成交量指标变得具有可比性,在成交量模型V1中,量能指标如果大于1.15我们认为市场放量,则发出做多信号。 类似龙虎榜机构资金的净流入强度指标,我们计算了万得全A指数成交量的5日AMA均线除以万得全A指数成交量的100日AMA均线,得到了万得全A指数的量能指标,由于成交量模型是短期择时模型,平均多头持有期为一周,因此我们绘制了量能指标5个交易日的期望收益分布图,如图2(纵坐标为期望收益,横坐标为量能指标值)。 图表2万得全A指数量能指标5个交易日的期望收益分布图 从万得全A的量能指标5日的期望收益分布图可以看出,与龙虎榜机构资金净流入强度指标的V型分布不同在于,量能指标的期望收益分布图呈现出明显的右偏V型形状,类似√型,那么我们该如何去解读呢? 在成交量V1模型里面,当量能指标大于1.15时候做多,否则平仓,如图2,我们将量能介于1.125至1.15的位置标记成了黑色的虚线,黑色虚线右边区域,强烈看多的期望收益密集分布,很好的印证了为什么当量能指标大于1.15时候做多,择时收益能够获取较高的回测收益与较低的最大回撤 。我们将量能指标大于1.15, 或AMA5/AMA100>1.15的右侧区域称之为放量上涨区域,或放量上涨做多区域。 注意到,绿色的虚线对应着量能指标为1的位置,当量能指标开始回落至1.15以下但是大于1(成交量的5日AMA均线大于100日AMA均线)。中间有个区域,即位于绿线和黑线之间的区域,这个区域可能刚刚经历了最活跃的大幅上涨放量,此时可能依旧有踏空资金保持着一定的做多力量,但是后续的做多跟进力量明显不足,因此刚经历了放量上涨后的市场可能还会有一段放量上涨后的脉冲,我们称之为高位震荡区域,该区域有可能在高位继续向上,但是上涨幅度已经大为受限(期望收益相比放量上涨区域大幅下降),有可能已经掉头开始向下(区域内部分指标值的期望收益为负)。在高位震荡区域,无论是做多亦或是做空,无论是盈亏比亦或是胜率,从区域内期望收益分布来看,应该是性价比不高的。 当成交量5日AMA均线开始小于100日AMA均线的时候,市场开始进入到了缩量区域,此时量能指标小于1,市场从高位震荡过渡到了下跌,量能指标的期望收益开始为负,因此市场下跌的部分位于绿色虚线和青色虚线之间,该部分我们称之为缩量下跌区域,或缩量下跌做空区域。 注意到,当量能指标极低的时候,即位于青色虚线的左侧,期望收益一反常态,和位于青色绿色虚线之间的缩量下跌区域完全相反。当市场缩量到极致的时候,后市往往会反弹,期望收益显著为正。正所谓,市场经历了大幅下跌,空头将筹码几乎抛售完毕,进入到了底部震荡,市场在底部震荡的时候,不断洗筹,成交量进一步萎缩,市场波动在降低,直到市场冷冷清清,最终市场成交量降至冰点,出现了地量情形,没有极致的绝望就不会有任何希望,生活亦是如此,A股亦是如此,物极必反和后续期待的反弹行情才会如期而至。我们称青色虚线左侧部分为地量反弹区域,或地量反弹做多区域。 综上所述,量能指标将行情划分为四个区域,放量上涨区域,高位震荡区域,缩量下跌区域,地量反弹区域。那么我们应该在放量上涨区域做多,这个是成交量模型V1已经完成的部分,接下来,我们会用量化的方式去完善缩量下跌和地量反弹的部分,那么这两个区域又应该如何去建模? 三、特征成交量,模型终完备 右偏V型或√型的期望收益分布,如图2,在放量上涨区域做多,当量能指标大于阈值Threshold=1.15,就做多全A指数,那么当量能指标小于1且大于青色虚线对应的阈值,那么做空全A指数,如果量能指标小于青色虚线对应的阈值,做多全A指数。我们并不希望直接定义这个青色虚线阈值比如0.7或者0.6,而是通过右偏V型这个收益分布的特征间接得到该阈值,该定义如下,放量上涨做多,量能指标大于threshold做多,那么从√型形态来看,地量反弹应该也与threshold相关,那么定义青色虚线阈值为threshold^,α我们称为极端参数。 (-α) (-α) 当量能指标小于threshold^,市场处于地量反弹的区域,后市做多。当量能指标小于1且大于threshold^,市场处于缩量下跌的区域,后市做空。从期望收益分布图可以观察,极端参数α是需要大于2的,因为1.15^等于0.756,位于图2的青色虚线右端,缩量下跌的区域内,但是极端参数α又不能过高,否则地量反弹区域过于窄小,我们将遍历极端参数,来获取不同极端参数下地量反弹+缩量下跌区域的择时收益,极端参数的取值范围为1.5~3.5。 (-α) (-2) 如图表3至图表5,随着极端参数从1.5遍历至3.5,缩量下跌与地量反弹的万得全A择时年化收益和夏普比率随着参数值的增加而递增,在极端参数为2.3年化与夏普达到最高,然后极端参数从2.3至3.5年化和夏普比率又逐渐降低,最终在极端参数为3.5的时候年化与夏普最低,印证了极端参数需要大于2,但是又不能过高。 图表3极端参数遍历的万得全A指数缩量下跌和地量反弹回测结果 图表4极端参数与年化收益 图表5极端参数与夏普比率 图表6特征成交量择时模型万得全A指数回测结果 图表7特征成交量择时模型万得全A指数回测结果 在极端参数的选择上,我们希望选择的极端参数大于2,并在年化收益和夏普比率上不能是最高的,否则有过拟合的嫌疑,因此本文参照《特征分布建模择时系列之一:物极必反,龙虎榜机构模型》的参数选择方法,即不能选择回溯表现最好的极端参数,也不能是回溯表现最差的极端参数,而是选择正常的极端参数,极端参数等于3。在极端参数等于3,万得全A指数缩量下跌与地量反弹模型年化收益为7.