您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华泰期货]:量化专题报告:投资者情绪因子预测股指期货收益率 - 发现报告
当前位置:首页/其他报告/报告详情/

量化专题报告:投资者情绪因子预测股指期货收益率

2018-09-03陈维嘉华泰期货球***
量化专题报告:投资者情绪因子预测股指期货收益率

华泰期货研究所 量化组 陈维嘉 量化研究员  0755-23991517  chenweijia@htfc.com 从业资格号:T236848 投资咨询号:TZ012046 相关研究 估值因子法预测股指期货收益率 2018-07-31 华泰期货|量化专题报告 2018-08-31 投资者情绪因子预测股指期货收益率 投资者情绪因子简介 股票指数的收益率是由其指数成份股构成的,指数除了会受到其成份股价格、财务等信息变化的影响外,也会受到整体市场环境的影响。投资者情绪是影响整体股票市场收益率的一个重要因素。投资者普遍具有追涨杀跌的情绪,如果能够找到恰当反映这种情绪的成份因素,就能构造出股票市场的投资者情绪因子,并利用该因子对股市未来走势进行预测。这篇报告主要参照Dashan Huang等人在2013年论文Investor Sentiment Aligned: A Powerful Predictorof Stock Returns中提出数值方法构造中国股票市场的投资者情绪因子。他们用于构造情绪因子的成份主要参考了Malcolm Baker和Jeffrey Wurgler在2006年论文Investor Sentiment and the Cross-Section of Stock Returns中提出的6个成份,但是Malcolm Baker和Jeffrey Wurgler使用的是主成分分析对这6个成份进行无监督降维,取第一主成份作为投资者情绪因子,而Dashan Huang等人则是利用偏最小二乘法进行有监督降维,他们发现使用偏最小二乘法构建的情绪因子预测效果要比主成份分析法的效果好。 这篇报告把上证50指数,沪深300指数和中证500指数作为市场整体,分别构建这三个指数的投资者情绪因子,用于预测这三个指数的收益率。由于这三个指数都已经推出了对应的股指期货,因此可以根据预测收益率的正负进行做多或做空的交易。本报告测试了按照月度和周度两个频率去截取数据,在不同数据频率上各个股指期货的收益略有不同,但是从长期看,除了中证500策略表现差于指数外,其他两个指数策略都能获得年化18%以上收益,高于指数纯多头策略。 华泰期货|量化专题 2018-08-31 2 / 13 研究背景 股指期货与相应的股票指数挂钩,通常股指期货与股票指数的相关性达到90%以上,因此如果能有效预测股票指数的收益率就能够通过股指期货进行交易赚取利润。有相关学术研究认为投资者情绪能够影响资产价格,因为当投资者情绪高涨时会过去乐观地追高价格,而处于低潮时则会过于消极,从而导致股票价格与其基本面信息出现背离。投资者情绪并非一个可以直接观测的变量,Malcolm Baker和Jeffrey Wurgler在2006年论文Investor Sentiment and the Cross-Section of Stock Returns中利用主成份分析(Principle Component Analysis, PCA),通过6个可观测变量构建了投资者情绪因子,他们发现这个情绪因子对个股收益率具有强大的预测作用。Dashan Huang等人在其2013年论文Investor Sentiment Aligned: A Powerful Predictorof Stock Returns进一步研究发现如果利用偏最小二乘法构建投资者情绪因子,在预测整体市场收益率上同样具有显著作用。 在Malcolm Baker和Jeffrey Wurgler的研究中,他们利用PCA中的第一主成份作为投资者情绪因子的代表。从数值方法原理上讲,PCA的第一主成份是能够最大解释6个可观测变量的方差。但是Dashan Huang等人认为这6个可观测变量中都包含了对不可观测的投资者情绪因子的逼近误差,而这部分误差是其方差的组成部分,所以第一主成份中可能包含了与待预测收益率无关的逼近误差。偏最小二乘法(Partial Least Square, PLS)就是为了构建对待预测变量最具预测效果的主成份而提出的一种数值方法。Dashan Huang等人利用这种方法构建的投资者情绪指标与Malcolm Baker和Jeffrey Wurgler的方法相比,预测效果有了大幅提升。这篇报告就是把Dashan Huang等人的方法应用到中国三大股票指数的预测上,并通过股指期货构建交易策略。 投资者情绪因子构造方法 目前学术界提议过一系列的指标成份用于构建投资者情绪因子,但是但是并有确定而且没有争议情绪因子衡量工具,所以这篇报告选择了学术界认可度比较高的Malcolm Baker和Jeffrey Wurgler的2006年论文和Dashan Huang等人2013年论文提出的方法,使用6个可观测成份因素去构建投资者情绪因子。 (1) 封闭式基金贴现率(Close-end fund discount rate, CEFD): 在中国A股市场流通的封闭式基金资产净值与其市价之差的市值加权平均。国外研究认为CEFD与情绪因子呈现负相关,可以利用它预测道琼斯指数的反转。 (2) 换手率(Share turnover, TURN): 相应股票指数成份股换手率的市值加权平均。换手率可以认为是流动性的衡量,当股票市场存在卖空限制时,如果非理性投资者对未来乐观就会参与进来给市场贡献流动性,因此当市场流动性好的时候,就是市场被估值过高的时候,所以在美国市场高换手率预示着低的市场回报率。 华泰期货|量化专题 2018-08-31 3 / 13 (3) IPO数量(Number of IPOs, NIPO): 周频或月频的沪深两市新股上市数量。 (4) IPO收益率(Return of IPOs, RIPO): 新股上市一周最后一个交易日价格与其发行价相比的对数收益率上市除以上市天数,并对所有新股收益率取平均。月频成份则为该月份所有新股上市的周频收益率取平均。IPO市场通常都对投资者情绪比较敏感,高的IPO收益率意味着投资者热情高,而低的IPO收益率则被解释为市场在等待时机。 (5) 分红费用(Dividend premium, PDND): 把相应股票指数成份股根据过去一年的分红情况划分为有分红股票和无分红股票,这两者市净率的对数差异的市值加权平均。Malcolm Baker和Jeffrey Wurgler的研究认为一般来讲高分红的公司相对来讲是大公司,其成长机会相对较小。 (6) 新股发行占比(Equity share in new issues): 每周或每月A股新股发行额度占新股发行和公司债发行总和的比例。Malcolm Baker和Jeffrey Wurgler的研究认为,在美股市场上这个值高意味着低的市场收益率。 以上6个投资者情绪因子成份中,只有换手率和分红费用是要根据具体股票指数成份股计算,其他4个成份采集的都是沪深两市的整体市场数据。其中前5个成份的数据来源于天软,最后一个成份来源于万得。 这里使用푥푡=(푥1,푡,...,푥푁,푡)′其中푁=6,푡=1,...,T来表示各个时间点上的投资者情绪因子成份,假设푥푖,푡存在一个因子结构 푥푖,푡=휂푖,0+휂푖,1퐼푆푡+휂푖,2퐼푅푡+푒푖,푡 (1) 其中퐼푆푡是与预测股指收益率相关的投资者情绪因子,퐼푅푡则是与未来收益率无关的部分,而푒푖,푡则是该成份的误差。这里的关键是从6个成份中提取出퐼푆푡以及把퐼푅푡去除掉。 这里利用푅푡+1代表在푡+1时刻的股指收益率,它可以被퐼푆푡解释 푅푡+1=훼+훽퐼푆푡+휀푡+1 (2) 퐼푆푡的可以使用偏最小二乘法计算,这里参照Dashan Huang等人的方法,其中详细的数学原理可以参考Bryan Kelly和Seth Pruitt在2012年的论文The three-pass regression filter: A new approach to forecasting with many predictors。这里简单描述计算步骤: 第一步,把每个情绪因子成份푥푖,푡对未来푡+1时刻的股指收益率푅푡+1进行最小二乘回归: 푥푖,푡=휋푖,0+휋푖푅푡+1+푢푖,푡 (3) 华泰期货|量化专题 2018-08-31 4 / 13 得到每个因子成份的载荷휋푖,0和휋푖,这两个参数是用来描述每个푥푖,푡对驱动预测目标푅푡+1的隐含情绪因子퐼푆푡的敏感性。 第二步做截面回归,在每一个时刻푡上把每个成份푥푖,푡对퐼푆̂푡进行最小二乘回归得到当前时刻푡上的情绪因子퐼푆̂푡。 푥푖,푡=푐푖,푡+퐼푆̂푡휋̂푖+푣푖,푡 (4) 在这一步里,第一步得到的因子载荷휋̂푖变成了独立变量,而隐含的情绪因子퐼푆푡就成了待定系数。第一步和第二步就是为了把因子成份所包含的信息进行压缩,得到一个随时间变化的情绪因子퐼푆̂푡。由于因子载荷휋푖是未知的,第一步的回归能够对푥푖,푡如何取决于퐼푆푡进行初步的描绘。这一步回归也建立了一个从因子成份分布到情绪因子퐼푆̂푡的映射。第二步的截面回归利用了这个映射去估计每个时刻푡上的情绪因子퐼푆̂푡。 第三步则在时间序列上是把未来股指收益率푅푡+1对当前时刻푡的情绪因子퐼푆̂푡进行回归。 푅푡+1=훼̂+훽̂퐼푆̂푡 (5) 这最后一步的回归实现了股指收益率的最终预测。这个方法能够从情绪因子成份中提炼出一个具有对股指收益率预测能力的情绪因子퐼푆̂푡,同时实现了降维压缩和预测。 投资者情绪因子的效果 这篇报告研究投资者情绪因子对中国市场三大股指期货的预测效果。由于股指期货上市时间比较晚,可以回溯的历史时间不长,但为了验证投资者情绪因子对市场整体收益率预测的有效性,股指期货上市前的数据使用相应的股票指数代替。例如沪深300股指期货是在2010年4月份推出,那2010年4月份之前沪深300股指期货的数据就使用沪深300股票指数代替。上证50股指期货和中证500股指期货是在2015年4月份上市,那2010年4月份之前股指期货的数据就使用相应的股票指数代替。投资者情绪因子中有两个成份是需要根据具体的股票指数成份股制定,包括换手率(Share turnover)和分红费用(Dividend premium, PDND)。是由于股票指数编制年代较为久远,过早以前的股票指数成份股已无法获取,各股票指数的历史回测起始点均以股指成份股可查时间为起始点。各个指数的成份股都是动态调整的,大约每过半年就会调整一次,为了简化操作,这篇报告里把用于计算换手率和分红费用的股票池的调整时间定为每年1月20日和7月20日,通常这个日期是在官方成份股调整日期之后。在这个日期之后就根据更新的相应从天软下载得到。 华泰期货|量化专题 2018-08-31 5 / 13 Dashan Huang等人和Baker等人在验证投资者情绪因子在美国市场的有效性时使用的时间序列频率为月度数据,但从实际交易的角度上说,投资者总是希望能在出现政策变化等量化模型没有包含的