您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:资产趋势预测利器:使用独立贝叶斯分类整合分析师评级 - 发现报告
当前位置:首页/其他报告/报告详情/

资产趋势预测利器:使用独立贝叶斯分类整合分析师评级

2021-11-16张立宁、杨国平、丁睿雯华西证券球***
资产趋势预测利器:使用独立贝叶斯分类整合分析师评级

请仔细阅读在本报告尾部的重要法律声明 1 [Table_Title] 资产趋势预测利器:使用独立贝叶斯分类整合分析师评级 [Table_Title2] [Table_Summary] ► 独立贝叶斯分类器组合与变分贝叶斯算法结合 独立贝叶斯分类器组合(Independent Bayesian Classifier Combination,IBCC)是多个相互独立的贝叶斯分类器的组合。它是一种有监督的机器学习方法,在将其应用于整合分析师评级数据时,我们把训练集定义为历史的分析师评级数据与股票涨跌幅表现,预测结果为股价变动方向。 变分贝叶斯推断(Variational Bayes Inference,VB)能够近似不可观测变量的后验概率,同时给出观测变量的边缘似然函数的下界,可以用于IBCC模型的参数估计。 我们可以用变分贝叶斯算法拟合过去分析师评级数据和股价实际变动情况之间的关系,得出独立贝叶斯分类模型中下一个月股价变动的后验概率。 ► IBCC-分析师评级组合的构建 首先,我们根据过去三个月分析师评级数据更新股票信号,构建了直接分析师评级组合。 其次,IBCC-VB选股模型的输出结果为股价变动的后验概率(푞0,푞1,푞2),分别对应价格下跌、价格持平和价格上涨的概率。我们设定了IBCC-VB选股规则以选取价格上涨概率较大的股票。但由于每个月按照IBCC-VB规则选取出的股票数量差异较大,我们通过因子打分筛选与分析师评级信号填补的方法将选股数量控制在20个以内,再将所选股票与直接分析师评级组合取交集,得到IBCC-分析师评级组合。 ► 中证500 IBCC-分析师评级组合2019、2020、2021年前10个月分别上涨61.76%、59.33%、51.46% 2015-2021/10/31,中证500 IBCC-分析师评级组合上涨525.78%,直接分析师评级组合上涨154.69%,同期中证500指数上涨31.94%。IBCC-分析师评级组合累计超额收益为474.31%,年化涨幅为30.86%,年化超额收益为26.71%。 中证500 IBCC-分析师评级2019、2020、2021年前10个月分别上涨61.76%、59.33%、51.46%。 风险提示 量化报告的结论基于历史统计规律,当历史规律发生改变时,报告中的模型和结论可能失效。 评级及分析师信息 [Table_Author] 分析师:张立宁 邮箱:zhangln@hx168.com.cn SAC NO:S1120520070006 分析师:杨国平 邮箱:yanggp@hx168.com.cn SAC NO:S1120520070002 助理分析师:丁睿雯 邮箱:dingrw@hx168.com.cn 证券研究报告|金融工程研究报告 仅供机构投资者使用 [Table_Date] 2021年11月16日 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p1证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p185343 请仔细阅读在本报告尾部的重要法律声明 2 19626187/21/20190228 16:59 证券研究报告|金融工程研究报告 正文目录 1. 独立贝叶斯分类器组合模型 ........................................................................................................................... 3 1.1. 模型简介 ................................................................................. 3 1.2. IBCC概率模型 ............................................................................. 3 2. 变分贝叶斯算法 .................................................................................. 5 3. IBCC模型与变分贝叶斯的结合 ...................................................................... 6 3.1. 先验分布的参数选择 ........................................................................ 6 3.2. 变分贝叶斯参数估计 ........................................................................ 6 4. IBCC-分析师评级选股组合回测结果.................................................................. 7 4.1. IBCC-分析师评级选股模型参数 ............................................................... 7 4.2. IBCC-VB模型在沪深300内的选股效果 ......................................................... 8 4.3. IBCC-VB模型在中证500内的选股效果 ......................................................... 9 4.4. IBCC-VB模型在中证1000内的选股效果 ....................................................... 10 5. 附录:变分贝叶斯算法 ........................................................................... 12 6. 风险提示....................................................................................... 13 图表目录 图 1 IBCC-分析师评级组合、直接分析师评级组合走势与沪深300对比 ...................................................................................8 图 2 IBCC-分析师评级组合、直接分析师评级组合对沪深300的超额收益 ...............................................................................9 图 3 IBCC-分析师评级组合、直接分析师评级组合走势与中证500对比 ...................................................................................9 图 4 IBCC-分析师评级组合、直接分析师评级组合对中证500的超额收益 ............................................................................ 10 图 5 IBCC-分析师评级组合、直接分析师评级组合走势与中证1000对比 .............................................................................. 10 图 6 IBCC-分析师评级组合、直接分析师评级组合对中证1000的超额收益.......................................................................... 11 表 1 IBCC-分析师评级组合年度收益统计 .......................................................................................................................................... 11 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p2证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p2 请仔细阅读在本报告尾部的重要法律声明 3 19626187/21/20190228 16:59 证券研究报告|金融工程研究报告 1.独立贝叶斯分类器组合模型 1.1.模型简介 独立贝叶斯分类器组合(Independent Bayesian Classifier Combination,IBCC)是多个相互独立的贝叶斯分类器的组合。它是一种有监督的机器学习方法,在将其应用于整合分析师评级数据时,我们把训练集定义为历史的分析师评级数据与股票涨跌幅表现,预测结果为股价变动方向。在实际情况中,不同分析师的观点可能存在较大差异,我们需要组合不同的观点作出判断。我们认为每个分析师作出评级的过程是独立的,并将每个分析师看作独立的分类器,每个分类器的权重由分析师历史推荐数据的长度和质量决定。 在模型中,输入和输出变量均为分类分布变量。输入变量1为分析师评级数据,我们将其简化为4类,分别是买入、增持、其他评级(包括中性、减持和卖出)和评级缺失,分别赋值为{3,2,1,0}。 输入变量2为公司股价的历史变动方向,在模型中被称为“真值”。根据股票收益率的变化情况,我们将其分为3类,分别是价格下跌、价格持平和价格上涨,分别赋值为{0,1,2},具体赋值规则如下: 푡={0,푖푓 푟∆푇≤−10%×푅푉표푙∆푇,2,푖푓 푟∆푇≥ 10%×푅푉표푙∆푇,1,표푡ℎ푒푟푤푖푠푒 其中,푟∆푇表示分析师评级研报发表之后∆푇时间内股票的收益,푅푉표푙∆푇表示基准指数在这期间的波动率,푅푉표푙(푠,∆푇)=√∆푇×푉표푙(푠,∆푇)。 模型的输出变量为在已知本期分析师评级情况下的预期股价变动方向,也就是如上真值(价格下跌、持平、上涨)在下一期出现的后验概率。 需要指出的是,IBCC模型并不对分析师评级和股价变动情况这两个类别标签进行排序,因此以上标签并没有大小关系,而是类别变量,两两之间地位相等。 1.2.IBCC概率模型 首先,我们先给出贝叶斯公式: Pr(휃|푦)=Pr(휃)Pr (푦|휃)Pr (푦)∝Pr(휃)Pr(푦|휃), 由于Pr(푦)只受数据集影响,我们可以把它作为常数忽略,因此贝叶斯推断认为: 后验概率푃푟(휃|푦)∝先验概率푃푟(휃)×似然函数푃푟(푦|휃)。 证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p3证券研究报告发送给东方财富信息股份有限公司。版权归华西证券所有,请勿转发。 p3 请仔细阅读在本报告尾部的重要法律声明 4 19626187/21/20190228 16:59 证券研究报告|金融工程研究报告 我们假设共有n只股票,k个不同的分析师,每个分析师对每只股票给出评级,则会形成一个푛×푘的矩阵。我们假设股价变动情况可以用上节所述的真值 푇表示,在固定时间区间内、股价变动情况 푇 有如下概率分布: Pr(푇=푡|휅)=휅푡 푓표푟 푡∈{0,1,2}, 其中,参数휅为真值 푇 的取值概率向量,휅=(휅0,휅1,휅2)且휅0+휅1+휅2=1,这里我们认为휅是已知的。 接下来我们假设对于股票푗,在给定股价变动概率分布푇푗时,分