您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:资产趋势预测利器:使用独立贝叶斯分类整合分析师评级 - 发现报告
当前位置:首页/行业研究/报告详情/

资产趋势预测利器:使用独立贝叶斯分类整合分析师评级

金融2021-11-19华西证券在***
资产趋势预测利器:使用独立贝叶斯分类整合分析师评级

资产趋势预测利器:使用独立贝叶斯分类整合分析师评级请仔细阅读在本报告尾部的重要法律声明仅供机构投资者使用证券研究报告|金融工程专题报告2021年11月19日金融工程首席分析师:杨国平SAC NO:S1120520070002金融工程高级分析师:张立宁SAC NO:S1120520070006金融工程助理分析师:丁睿雯 105970 2(一)独立贝叶斯分类器组合模型(二)变分贝叶斯算法(三)IBCC模型与变分贝叶斯的结合(四)IBCC-分析师评级选股组合回测结果(五)风险提示目录 qRpRtRmRtNuMtQuMvMmRoP9PaOaQsQnNoMnMjMrQmNiNsQoP8OrQsMuOpPvMxNrMqO1.独立贝叶斯分类器组合模型独立贝叶斯分类器组合(Independent Bayesian Classifier Combination):多个相互独立的贝叶斯分类器的组合输入变量1:分析师的投资建议:买入、增持、其他评级(包括中性、减持和卖出)和评级缺失,分别赋值为{3,2,1,0}输入变量2:股价历史变动方向(“真值”):价格下跌、价格持平和价格上涨,分别赋值为{0,1,2},具体赋值规则如下:t=൞0,푖푓푟∆푇≤−10%×푅푉표푙∆푇,2,푖푓푟∆푇≥10%×푅푉표푙∆푇,1,표푡ℎ푒푟푤푖푠푒其中,푟∆푇表示分析师建议发表之后∆푇时间内股票的收益,푅푉표푙∆푇表示基准指数在这期间的波动率,푅푉표푙푠,∆푇=∆푇×푉표푙(푠,∆푇)。输出变量(预测结果):已知本期分析师评级情况下的预期股价变动方向,也就是如上真值在下一期出现的后验概率。*IBCC模型并不对分析师建议和股价变动情况这两个类别标签进行排序,因此以上标签并没有大小关系,而是类别变量,两两之间地位相等3 1.独立贝叶斯分类器组合模型贝叶斯公式:Pr휃푦=Pr휃Pr(푦|휃)Pr(푦)∝Pr휃Pr푦휃由于Pr푦只受数据集影响,我们可以把它作为常数忽略,因此贝叶斯推断认为:后验概率퐏퐫훉퐲∝先验概率퐏퐫훉×似然函数퐏퐫퐲훉设共有n只股票,k个不同的分析师,我们假设股价变动情况为真值푇,且对于股票푗,在给定股价变动概率分布푇푗时,分析师푘的投资建议为퐵푘,则:퐓的概率分布:Pr푇=푡휅=휅푡푓표푟푡∈0,1,2,휅=(휅0,휅1,휅2)且휅0+휅1+휅2=1퐁퐤的概率分布:Pr퐵푘=푏푘푗푇푗=푡,휋푡푘=휋푡푏푘푗(푘)푓표푟푏푘푗∈0,1,2,3,휋푡푘=휋푡0푘,휋푡1푘,휋푡2푘,휋푡3푘,且휋푡0푘+휋푡1푘+휋푡2푘+휋푡3(푘)=1。贝叶斯似然函数:Pr풕,풃ퟏ,풃ퟐ,⋯풃푵=ς푗=1푛휅푡푗ς푙=1푁휋푡푗푏푙푗푙贝叶斯先验概率:真实概率훋=(휅0,휅1,휅2):三维狄利克雷分布횷=[휋푡0푘,휋푡1푘,휋푡2푘,휋푡3푘:푡=0,1,2;푘=1,⋯,푁]:四维狄利克雷分布4分析师对于不同股票的评级互不影响(1)先验-后验分布为共轭分布(2)似然函数为一个多项式分布(3)多项式分布作为似然函数的共轭先验分布为狄利克雷分布 1.独立贝叶斯分类器组合模型:输入5过去三个月分析师评级类别数据本月个股涨跌幅类别数据资料来源:朝阳永续数据库、华西证券研究所 1.独立贝叶斯分类器组合模型:输出6下一期个股价格变动的后验概率资料来源:朝阳永续数据库、华西证券研究所 7(一)独立贝叶斯分类器组合模型(二)变分贝叶斯算法(三)IBCC模型与变分贝叶斯的结合(四)IBCC-分析师评级选股组合回测结果(五)风险提示目录 2.变分贝叶斯算法变分贝叶斯推断(Variational Bayes Inference,VB)的基本思想是通过迭代更新一系列简单的分布来对一个复杂的多元分布做出最优估计。设X表示一组观测到的数据,Z表示潜在参数和变量的组合,在我们的IBCC模型中,Z代表着我们想要去估计的下一阶段的股票涨跌幅变化情况。p(∙)表示变量的概率分布。我们的目标是通过最大化似然函数logp(X)来找到后验分布p(Z|X)中的最优概率估计q(Z)。由于概率分布q(Z)积分为1,我们得到似然函数:푙표푔푝푋=∫푞푍푙표푔푝푋푑푍=∫푞푍푙표푔푝푋,푍푝푍푋푑푍=∫푞푍푙표푔푝푋,푍푞푍×푞푍푝푍푋푑푍=∫푞푍푙표푔푝푋,푍푞푍푑푍+∫푞푍푙표푔푞푍푝푍푋푑푍=퐿푞+퐾퐿(푞,푝)퐾퐿푞,푝表示푞푍和푝(푍|푋)的KL散度,当且仅当푞푍=푝(푍|푋)时,퐾퐿푞,푝=0。因此퐿푞是푙표푔푝푋的下界,也就是我们的新目标函数。我们需要通过最大化퐿푞来最大化似然函数。变分贝叶斯原理将풁分解成m组变量,并假定풒풁=ς풊=ퟏ풎풒풊(풁풊)对于所有푖≠푗,我们令푙표푔푞푗 ∗푍푗=퐸푖≠푗푙표푔푝푋,푍+푐푳풒为풒풁和풑(푿,풁)的KL散度的相反数 9(一)独立贝叶斯分类器组合模型(二)变分贝叶斯算法(三)IBCC模型与变分贝叶斯的结合(四)IBCC-分析师评级选股组合回测结果(五)风险提示目录 3.1.先验分布的参数选择根据多元狄利克雷分布的性质,设푖∈{1,⋯,푛푟}表示训练数据的各行,我们可以得出以下结论:1. 휿的后验概率是参数为흂∗=(휈0∗,휈1∗,휈2∗)的狄利克雷分布,其中휈푗∗=휈0푗+푁푗,푁푗表示训练集中事件푗发生的次数,푗∈{0,1,2}。2. 흅푡(푙)的后验概率是参数为(훼푡0푙∗,훼푡1푙∗,훼푡2푙∗,훼푡3푙∗)的狄利克雷分布,其中훼푡푏푙∗=푁푡푏푙+훼0,푡푏푙,푁푡푏푙表示训练数据中,对于每个真值푡∈{0,1,2},分析师푙给出的建议푏的次数,푙∈{1,⋯,푁},푏∈{0,1,2,3}。10흅휿휶흂푻=풕i푩풌=풃풌풋分析师k∈1,...,N时间i∈1,...,n资料来源:华西证券研究所 步骤ퟏ初始化푞∗푡=퐸휿,횷푙표푔푝푡,휿,횷+푐표푛푠푡푎푛푡:휿和흅푡(푙)的后验分布可以通过参数为흂∗和푨∗的狄利克雷分布得到:퐸휿푙표푔휅푡=Ψ휈푡∗−ΨΣ푗=02휈푗∗,퐸흅푡(푙)푙표푔흅푡푏푙(푙)=Ψ훼푡푏푙(푙∗)−Ψ(Σ푠=03훼푡푠푙∗),whereΨ푧=푑푑풁푙표푔Γz设푙표푔휌푡=퐸휿푙표푔휅푡+σ푙=1푁퐸흅푡푙푙표푔흅푡푏푙푙=Ψ휈푡∗−ΨΣ푗=02휈푗∗+σ푙=1푁[Ψ훼푡푏푙푙∗−Ψ(Σ푠=03훼푡푠푙∗)],则푞∗푡=휌푡/(휌0+휌1+휌2)。该式即为Pr(푇=푡|퐵1=푏1,퐵2=푏2,⋯,퐵푁=푏푁)的初始估计。步骤ퟐ通过计算最新的풒∗풕的期望得到풒∗(휿)和풒∗(횷):푙표푔푞∗휿=෍푗=02푞(푡=푗)푙표푔휅푗+෍푗=02(휈푗∗−1)푙표푔휅푗+푐표푛푠푡푎푛푡푙표푔푞∗흅푗(푙)=෍푗=02푞(푡=푗)෍푙=1푁푙표푔휋푡푏푙(푙)+෍푠=03(훼푗푠푙∗−1)푙표푔휋푗푠(푙)+푐표푛푠푡푎푛푡上式表明,푞∗휿为狄利克雷分布,参数为휈푗=휈푗∗+푞푡=푗,푗∈{0,1,2};푞∗흅푗(푙)为狄利克雷分布,参数为훼푗푏푙=푞푡=푗퐼푏=푏푙+훼푗푏푙∗,푏∈0,1,2,3,푙∈{1,⋯,푁}。得到푞∗(휿)和푞∗(횷)后我们再次迭代更新푞∗푡,直到模型收敛。最终得到的真值分布是Pr(푇=푡|퐵1=푏1,퐵2=푏2,⋯,퐵푁=푏푁)的变分贝叶斯估计。通过以上步骤我们得到股价变动的后验概率(푞0,푞1,푞2),分别对应价格下跌、价格持平和价格上涨。113.2.变分贝叶斯参数估计 12(一)独立贝叶斯分类器组合模型(二)变分贝叶斯算法(三)IBCC模型与变分贝叶斯的结合(四)IBCC-分析师评级选股组合回测结果(五)风险提示目录 4.1.IBCC-分析师评级选股模型参数选股范围:沪深300、中证500、中证1000指数成分股;回测区间:2015年-2021年10月。直接分析师评级组合:我们对于过去三个月分析师评级数据中的每一个“买入”评级,针对这只股票更新一个“+1”信号,对于“其他评级”(包括中性、减持和卖出),针对这只股票更新一个“-1”信号,在选股日我们将所有信号相加,删去负数信号的股票,并将信号强度上限定为10,最后将信号作为权重进行标准化,得出直接分析师评级组合。IBCC-VB选股规则:当푞2>40%(也就是股票上涨的后验概率大于40%)且푞2>1.5×max(푞0,푞1)(也就是股票上涨的后验概率大于股票持平与下跌后验概率中较大那一项的1.5倍)时,我们将这只股票纳入选股组合。IBCC-分析师评级组合:(1)当符合IBCC-VB选股规则的股票数量大于20只时,我们在策略中加入三个因子,对于每只股票根据最近1年最高价距离、15日超额动量、分析师目标营收增幅(分析师预测股票未来年度营业收入与上年已实现营业收入的差异幅度)这三个因子进行等权打分,选取得分最高的20只股票并设置为等权,再将这个权重向量与标准化后的直接分析师组合向量相乘(取交集),得出我们最后的组合权重,构成IBCC-分析师评级组合。(2)如果符合IBCC-VB选股规则小于20只时,设IBCC-VB模型所选股票数量为n,我们根据过去三个月的分析师评级数据为我们的投资组合添加股票。我们用和前文同样的方法根据分析师评级信息对股票更新信号,在选股日我们将所有信号相加并选取除去IBCC-VB所选股票后信号最强的20-n只股票,这20-n只股票与IBCC-VB所选出来的n只股票将构成一个集合,我们同样将它设置为一个等权向量,并与直接分析师组合取交集,构成我们的IBCC-分析师评级组合。13 2015-2021/10/31,IBCC-分析师评级组合上涨了282.66%,直接分析师评级组合上涨126.87%,同期沪深300指数上涨38.91%。沪深300 IBCC-分析师评级组合累计超额收益为275.47%,年化涨幅为21.75%,年化超额收益为16.81%。IBCC-分析师评级组合走势结果优于基准指数,也优于直接分析师评级组合。。14 ,注:将沪深300指数2014年末值调整为1图IBCC-分析师评级组合、直接分析师评级组合走势与沪深300对比 图IBCC-分析师评级组合、直接分析师评级组合对沪深300的超额收益4.2.IBCC-VB模型在沪深300内的选股效果 对于中证500,IBCC-分析师评级组合上涨525.78%,直接分析师评级组合上涨154.69%,同期中证500指数上涨31.94%。中证500 IBCC-分析师评级组合累计超额收益为474.31%,年化涨幅为30.86%,年化超额收益为26.71%。中证500 IBCC-分析师评级组合最近3年表现优异,2019、2020、2021年前10个月分别上涨61.76%、59.33%、51.46%。15 ,注:将中证500指数2014年末值调整为1图IBCC-分析师评级组合、直接分析师评级组合走势与中证500对比 图IBCC-分析师评级组合、直接分析师评级组合对中证500的超额收益4.3.IBCC-VB模型在中证500内的选股效果 对于中证1000,IBCC-分析师评级组合上涨了323.52%,直接分析师评级组合上涨148.10%,同期中证1000指数上涨22.53%。中证1000 IBCC-分析师评级组合累计超额收益为345.66%,年化涨幅为23.57%,年化超额收益为20.55%。IBCC-分析师评级组合走势结果优于基准指数,也优于直接分析师评级组合。16 ,注:将中证1000指数2014年末值调整为1图IBCC-分析师评级组合、直接分析师评级组合走势与中证1000对比 图IBCC-分析师评级组合、直接分析师评级组合对中证1000的超额收益4.4.IBCC-VB模型在中证1000内的选股效果 17(一)独立贝叶斯分类器组合模型(二)变分贝叶斯算法(三)IBCC模型与变分贝叶斯的结合(四)IBCC-分析师评级选股组合回测结果(五)风险提示目录 5.风险提示量化报告的结论基于历史统计规律,当历史规律发生改变时,报告中的模型和结论可能失效。18 19华西证券