您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:行业量化投资系列之一:煤炭行业的核心驱动因素与量化投资方法 - 发现报告

行业量化投资系列之一:煤炭行业的核心驱动因素与量化投资方法

2023-09-05 国泰君安证券 Man💗
报告封面

煤价是煤炭行业的业绩锚。煤炭指数成分股的主营业务为煤炭开采,其业绩取决于煤价。煤炭指数超额收益与未来一两个月的煤价变动相关性为30%左右。 从行业各方面选取指标,通过低参数滤波等方法对其定价规律进行探讨,结论为:需求端的下游产量指标对煤价预期的影响减弱,但高频的港口吞吐量指标的定价能力仍强。产量指标的定价方向并不稳定,需要结合需求指标使用。判断库存高低比库存上下关键 ,判断所处库存周期位置又比库存高低更关键。运价和国内煤价的高低比上下更重要,其反映供需的紧张程度,在供需紧张的环境下 ,人们更容易抬高对煤价的预期。进口上行总是引起市场对于进口挤占国内供给的担忧,并且这个逻辑在2019年供给侧改革取得较大进展之后得到强化;2021年及之后国内供给短缺的环境下,进口的下行加剧了市场对供需缺口扩大的预期。由于中国缺乏国际能源( 煤炭和原油)的定价权,国际煤价和国际油价对国内煤价预期具有较强的传导作用。 综合变量间相互作用的逻辑,我们分别构造了国内需产库价策略和国外冲击策略。需产库价策略的买入条件是[(需求上行)and(产量上or低库存)]or[国内煤价上行且运价上行],策略的月均超额收益为1.4%,择时胜率为66%;国外冲击策略的买入条件是进口下行and(国际煤价上行or国际油价上行)],策略的月均超额收益为1.0%,择时胜率为63%。 构建量化模型判断不同时段煤炭指数的核心驱动因素,其结果与主观复盘较为接近。国内外来看,当前核心驱动因素为国外冲击;单变量来看,当前核心驱动因素为进口。 量化投资模型当前给出中性建议。当前需求下行、产量下行、库存高位下行(或为主动去库存状态)、运价和国内煤价低位,国内需产库价模型给出中性建议;进口高位下行、国际煤价和国际油价处于中低位,国外冲击模型给出中性建议。 风险提示:本篇报告所述相关文章结论以及实证结论完全由量化模型和历史数据得到,请注意样本外存在失效的可能性。 1.行业量化投资的理念 对于某一具体行业,市场主流的做法是主观研究,主动研究员依赖于深层次的调研与长时间的沉淀来对行业指数走势作出研判。近年来,量化投资在A股异军突起,使用数学和统计方法进行定量化研究得到的结论具备严谨性与明确性,但其用于行业研究往往存在数据不足 、反应迟滞等缺陷。此外,纯量化模型的拟合往往因缺乏直观的金融原理而备受争议。那么,量化能否适用于行业层面的投资呢? 本文将以煤炭行业为例,探索行业量化投资的基本理念与方法。作为开篇第一章,本章主要介绍我们对行业量化投资的一些理解。从投资的本质,到行业量化投资的理念,再到量化投资相对于主动投资的优劣,本章将逐层进行介绍。 1.1.投资的本质:捕捉市场预期的变动 投资的本质是捕捉市场预期的变动。在我们看来,无论是主观投资还是量化投资,其思想本质是一样的,即捕捉市场预期的变动 。而捕捉的结果,又可以从胜率与赔率进行观察。 预期的形成过程可以分为三个阶段,对应三个分析框架。为了更好地捕捉市场预期的变动,我们需要拆分预期的形成过程。对于投资者来说,从新的信息到来到最终预期形成,可以分为三个阶段, 分别为信息解读阶段、未来推断阶段和业绩预期形成阶段。框架指的是人们在处理信息时使用的模型或方式,那么上述三个阶段分别对应人们使用的信息解读框架、未来推断框架和行业分析框架。 信息解读框架是对新信息或新逻辑的理解方式。比如一个政策出台,让A和B两个人解读,A可能认为这是一个强力的限产政策,B可能认为这是一个中性政策,这是因为他们对政策的理解方式不同 ,即信息解读的框架不同。 未来推断框架是基于现有信息对未来的推断方式。现实中人们往往采取线性外推的方式,比如当期需求上升,人们往往会认为形势较好,即认为下一期需求仍然会上升。但在某些环境下,线性外推的方式可能不被采纳,比如当经济不确定性较大时,即使当期煤炭需求上升,人们也会对其持续性存疑。 行业研究框架是根据众多行业变量估计业绩的方式。业绩是多个行业变量综合作用的结果,但综合作用的方式较为复杂。人们往往会使用自己的简化的分析框架,根据众多行业变量对行业业绩进行评估 。最简单的方式例如简单地认为当前煤价高则煤企利润好,当前港口库存低则煤企利润好。 定义了这三个框架,我们就可以分析股价变动的过程。以行业投资为例,在当前的行业变量环境下,人们通过未来推断框架来预测未来的各个行业变量,再通过行业研究框架整合成对未来业绩的预期, 这一预期已经反映在股价之中。当新的信息到来,人们首先通过信息解读框架对这个信息进行理解,并据此得到新的行业变量环境, 然后依次通过未来推断框架、行业研究框架形成新的预期。新预期与原预期的差距导致交易行为,最终造成了股价的变动。在实际投资中 ,往往会有某个变量超预期的说法,从另一个角度来说,“某个变量超预期”其实与“该变量的最新值使人们上调了对业绩的预期”的意思是一致的,因为如果该变量与业绩毫无关系,那它是否符合预期与投资并无关系。 图1:投资三框架与股价变动的过程 市场预期与个人预期不同,市场认可的三框架也与某个人认可的三框架不同。需要注意的是,影响股价的是市场的预期变动而非个人的预期变动,两者的区别在于市场的预期是由千千万万个投资者的个人预期博弈、交易产生,这就导致市场预期与某个人或某部分人的预期存在差异,从而市场认可的三框架也与某个人认可的三框架不同。 例如有部分人认为产量上升意味着行业景气上行(逻辑1),另一部分认为产量上升意味着供大于求的风险加大(逻辑2)。而市场最终认可并体现于股价之中的,可能是两种逻辑的其中之一,也可能有时是逻辑1而有时是逻辑2。 投资能力的进阶过程是让自己的框架不断接近市场的框架的过程,即舍离我的心而观众人的心。投资的损失往往是由于自身的认知框架与市场存在差距造成的,差距大则可能损失大,差距小则能够获得较大的收益。因此,我们需要采取一些手段,不断地修正自身的框架(即上述的三框架),使其越来越接近于市场。 1.2.行业量化投资的理念:简化目标,逐步修正 个人的框架是相对容易理解的,而市场的框架是没有人准确知道的,因此个人框架的投资胜率难以达到100%。投资体系的核心是上述三个框架,个人的框架是相对通俗易懂的,至少本人是可以理解和解释的; 市场的框架则是博弈产生的,没有人准确知道的。由于个人框架与市场框架存在差异,个人投资胜率难以达到100%。投资者的学习过程,就是在不断地迭代自己的框架,以追求更高的胜率和赔率。 主观投资者有较为明确的框架,从而能够形成具体的预期。对于一个主观投资者来说,他的三框架是从自身的学习、自己的经验以及与别人的交流中得出,并且是他自己可以理解和执行的。因此当新的信息到来时,主观投资者可以通过自身的框架形成具体的预期,根据新的预期进行投资。 主观投资框架往往是复杂的,难以准确地量化刻画。最为典型的就是供需平衡表的构建,以煤炭为例,首先,主观投资者需要对未来的经济情况(房地产等)、进口政策的变化情况、行业的产能情况、 行业的库存水平和国际能源价格等诸多变量进行预测,从而形成供需平衡表的假设条件。这一步本身就十分复杂,对未来的经济和国际地缘冲突情况的假设可能是与宏观分析师交流得到,行业产能情况的假设可能是实地调研得到,进口政策和库存的假设可能是基于自身的经验得到。 其次,根据众多假设条件得到最终供需缺口的模型也是复杂的, 各个变量与供需缺口之间并不是简单的线性关系,每个主观投资者所使用的模型也各不相同。 量化投资应将目标简化为判断预期的变动方向和大概幅度,而非预期的具体值。主观投资框架是复杂的,量化的方法往往难以对其准确刻画,这意味着量化投资者难以像主动投资者那样计算出具体的业绩预期。因此,量化投资应该追求一个相对模糊化的目标,只需尽可能地判断预期变动方向和大概幅度,即跳过主观投资类似于构建具体的供需平衡表的操作。换而言之,量化投资只需要判断在最新的信息或状态下,市场上(下)调预期的概率和幅度,从而形成最终的投资策略。 对应的研究问题是,该新信息如何影响着人们的预期。 量化投资应先从简单的投资框架入手,基于市场反馈不断地进行修正和完善,并注重与金融逻辑相结合,逐步接近市场认可的框架,提高策略的胜率与赔率。由于目标得以简化,我们可以从简单的、可量化的投资框架入手,构建量化投资策略。但过于简单的投资框架往往与市场差距甚大,我们还需要基于市场反馈不断地进行修正,并注重与金融逻辑相结合,逐步逼近市场的认知,最终达到较高的胜率和赔率。 图2:主动投资与被动投资的理念差异 1.3.主观投资与量化投资的优劣 主观投资者的做法是通过调研、交流和公开渠道获取信息,通过学习、自身经验和交流结果得到逻辑;量化投资者的信息来源往往只有公开渠道,也是通过学习、自身经验和交流结果得到逻辑。 主观投资者获得的信息更加全面和及时,量化投资者所使用的数据则相对不全和迟滞。相对于量化投资者,主观投资者能够通过实地调研、交流等手段拿到更多的、第一手的数据或信息;而量化投资者往往更多地使用固定渠道获取的偏结构化的信息。此外,主观投资者可以通过与他人交流获得其内心的预期,这也是十分重要的一类数据 。因此,主观投资者往往可以利用更全面的数据、更快地作出判断和反应。 主观投资者的研究更加深入,量化投资者的研究深度则相对较小。行业研究员往往深耕该行业,对行业的方方面面较为熟悉,且针对单行业和单公司的主观研究可以十分深入,从而洞察到针对特例的复杂逻辑。量化投资者则没有在固定行业的积淀,由于技术的限制和数据的缺乏,对复杂的逻辑往往无法量化刻画;且量化投资往往需要对逻辑进行统计检验,针对单个行业或公司的逻辑即使量化出来也没有足够的数据用于检验其正确性。 几乎所有行业都可以进行主观投资,部分行业并不适用量化投资。由于数据的获取困难、投资逻辑过于复杂或逻辑无法量化,部分行业并不适合量化投资。例如部分创新药赛道可能更需要关注药物研发的进展以及研发成功后的市场空间,其中药物研发进展往往没有标准化的数据可以跟踪,市场空间则更依赖于研究员的主观经验进行判断 ,两者皆难以量化。 量化投资具有明确性且易于执行,而主观投资则相对模糊。量化模型一旦通过金融逻辑与统计两方面的检验就已经固定下来,除非后续需要迭代修改,否则就可以给出定量化的结论,且结论的产生路径可以追溯到底层数据。而主观投资往往是定性的结论,往往基于主观经验。 例如,主观投资者会说“这个行业当前太拥挤了”,那么问题来了,多拥挤才算拥挤呢?换而言之,拥挤到什么程度才应该卖呢? 主观投资者可能难以回答,而量化投资者可以通过设计拥挤度指标并通过历史回测得到定量的答案。这个答案不一定十分准确,但更加明确。 量化投资更容易兼顾多变量从而实现更多标的的追踪与覆盖,主观投资在面临多变量时可能难以抉择。投资本质上是研究多个变量如何影响资产价格,但变量之间的关系错综复杂,变量对资产价格的影响方向和影响大小也各不相同。那么当多个变量的信息一起到来时,最终资产价格会走向何方,就十分考验主观投资者的核心因素判断能力和权衡能力。而对于提前训练好的量化模型来说,由于其具有明确性,输入多变量并输出明确的结果是轻而易举的,这也就减小了量化投资者持续跟踪投资的成本,从而更容易实现更多标的的追踪与覆盖。 量化投资的方法论保证投资逻辑至少在历史上通过了市场的检验。每个主观投资者心中都有自己的一套投资逻辑,它们源自投资者自身的知识与经历,因此可能各不相同。个人的逻辑中有一些是想当然的,也有一些是看似正确但市场并不认可的,但只要没有明显的逻辑错误,人们往往难以区分。量化通过历史回测对逻辑进行检验,相当于使用市场本身作为benchmark,从而保证投资逻辑至少在统计上、在历史上是符合市场规律的。历史不会简单重演,但历史是相似的( 因为人性与一些客观规律是不变的),因此,通过历史的检验可以提高投资逻辑的胜率或赔率。严格来说,主观投资者的逻辑同样是基于历史的数据与经验形成,因为人们永远只能知道已经发生的事情。 量化投资的方法论帮助人们发现不常见的投资逻辑,但