您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:因子与指数投资揭秘系列十七:螺纹钢基本面量化及数据分析的研究框架 - 发现报告

因子与指数投资揭秘系列十七:螺纹钢基本面量化及数据分析的研究框架

2024-04-09 虞堪 国泰君安证券
报告封面

期货研究 二〇二四年度 国泰君安期货研究所 2024年4月8日 因子与指数投资揭秘系列十七:螺纹钢基本面量化及数据分析的研究框架 虞堪投资咨询从业资格号:Z0002804yukan010359@gtjas.com 高宇飞(联系人)从业资格号:F03124155gaoyufei028920@gtjas.com 报告导读: 在之前的系列专题报告中,我们阐述了基本面量化数据选取的一些一般性的标准,并以铁矿石这个品种为例,阐述了其基本面量化和数据分析的研究框架(参见《因子与指数投资揭秘系列十六:铁矿石基本面量化及数据分析的研究框架》)。我们在文中提出,铁矿石的下游较为单一,其主要应用是冶炼钢材。 因此,本文将进一步研究黑色系产业链的另一个重要品种:螺纹钢。螺纹钢期货自2009年在上期所上市交易以来,历经十余载时间,历史数据相对充足。它向上承接铁矿石、焦煤、焦炭等原材料,向下承接房屋建设、桥梁、道路建设等重点产业。在国民经济发展和宏观分析中,我们也经常能看到螺纹钢的身影。分析螺纹钢的手段相对较多,量化数据和指标也较为丰富。在上游端,可以从原材料的占比和成本测算。中游端,可以考虑不同型号和规格的螺纹钢现货价格,提取基差、价差等指标。钢厂一些指标,例如钢厂铁水产量、钢厂开工率、螺纹钢长短流程的产能利用率等,亦可对后市期货价格的预测提供参考。下游端则可以提取螺纹钢消费量、全国钢材贸易量、房屋新开工面积、房屋销售数据等指标。 本文将首先按照类别,对螺纹钢各相关指标进行梳理和介绍。然后,选择表现较好的指标并对其回测绩效进行结果展示,最后再结合结果以及近期螺纹钢的行情进行相关的总结。 特别感谢实习生李泽豪对于本文撰写、数据搜集的贡献。 风险提示:近期螺纹钢行情波动较大,注意关注政策面和情绪面的影响。 (正文) 1.螺纹钢产业链的介绍 现代工业中,钢材是使用最为广泛的金属材料之一。螺纹钢是一种带肋钢筋,是横断面为圆形并且带肋的混凝土结构用钢材。而我国则是全球最大的钢材生产和消费国,且随着经济发展,对钢材数量和质量上的需求也与日俱增。绝大多数生产的螺纹钢都在国内被消费掉,因而进出口占比相对较少。 螺纹钢的上游是铁矿石、焦煤和焦炭这些原料,铁矿石的占比约一半以上。在我们之前的报告中提到,铁矿对于进口的依存度很高,主要从澳洲和巴西的四大矿山进口。因此铁矿的进口情况对于螺纹钢的成本有一定影响。螺纹钢下游最大的应用是建筑建材行业,房屋新开工面积、商品房销售量等对上游的螺纹钢需求有一定的影响。 生产螺纹钢主要有以下两种流程,一种是以废钢为原材料的电炉生产(短流程),占比约13%;另一种是使用铁矿石作为主要原料的高炉生产(长流程),约占87%。不过,因为电炉生产没有煤炭的烧结环节,较为环保,在政策的鼓励下,未来可能会扩大产能。 螺纹钢的生产主要集中在华东和华北地区,这两个区域的钢产量合计超过我国全国产量的一半。螺纹钢是主流钢材中占比最高的品种,超过了三分之一,其他常见的钢材包括线材、热轧卷、冷轧卷、中厚板等。而主要消费地则集中在基建和地产较为集中的华东、华南地区。 2015年,钢材价格持续大幅度下降,全行业几乎都在亏损,产能严重过剩,市场预期恶化,面临一系列挑战。在中央经济工作会议上,确定要对于钢铁和煤炭行业进行供给侧改革,因为这两个行业结构矛盾较为突出。在解决产能过剩问题的同时,又要对生产质量严格把控。因此从2016年开始,螺纹钢价格稳步提升,在后续的数据选取和因子测试中,我们将把重点放在供给侧改革之后。 图1:螺纹钢生产原材料构成图2:螺纹钢电炉生产成本构成 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图3:螺纹钢产业链流程 资料来源:国泰君安期货研究 2.螺纹钢基本面数据举例 接下来,我们将分类别列举一些基本面数据。依照《因子与指数投资揭秘系列十五:探究量化基本面因子品种和数据的选取方法》文中提到的基本面数据选择标准,所选取数据应尽可能具有较长的历史长度,较频繁的更新频率(日度或周度),以及有较强的代表性。 2.1螺纹钢基差 本数据选自“商品基差-主流现货基差-螺纹钢-rb”,数据源为国泰君安期货数据库,更新频率为日度。主要选择期货贴水较大时择时做多,因为基差走扩,期货价格往往被低估,下一步可能反转走强;反之当期货价格升水较大时择时做空,由于商品交割机制的存在,基差往往会在临近交割时收敛。 图4:螺纹钢价格和基差走势 资料来源:国泰君安期货研究 可以看出,螺纹钢期货在2020年前常贴水于现货,基差大于零。从2016年到2020年若不择时,长期 做多螺纹钢也可以带来可观的收益。在2021年之后,基差则时常在0上下波动,螺纹钢价格处于震荡下跌的趋势中。 2.2螺纹钢现货价格 我们可以参考一些主流地的常见螺纹钢型号的现货价格,例如上海地区HRB400系列20mm螺纹钢的价 格: 图5:螺纹钢常见现货价格 资料来源:国泰君安期货研究 黑海独联体地区与中国是螺纹钢出口价格最低的两个地区,当黑海地区价格过低时,会导致客户偏向于采购黑海地区螺纹钢,此消彼长,国内螺纹钢的需求会被抑制。反之若黑海地区价格过高,国内以及海外的客户则更偏向于我国的螺纹钢消费,从而需求增加。因此我们可以构建内外现货价差因子,例如黑海地区螺纹钢FOB出口价格减去中国FOB出口价格: 图6:海内外螺纹钢现货价格对比图7:螺纹钢内外价差 资料来源:国泰君安期货研究、钢联资料来源:国泰君安期货研究、钢联 2.3加工利润 不同于铁矿石,由于螺纹钢更多地是自产自销,较少依赖进口。我们更关注钢厂的生产和加工利润。不过需要注意,加工利润的影响可能相对负责。一方面,当加工利润较高时,钢厂更倾向于多开工制造成材,从而会使螺纹钢供给增大;而另一方面,当钢厂利润较高时,往往也是价格较高,成交较为活跃的时段,通常需求也不会太差。下图也可以较为直观的反映这种关系,在某些年份或时段,加工利润和螺纹钢价格正相关性较强,而在另外一些年份或时段,则负相关性较强。在钢联中,此指标对应的相关的数据为“螺纹钢:高炉:利润:中国(日)”。 图8:加工利润 资料来源:国泰君安期货研究 2.4供给类指标 在2015年供给侧改革之后,螺纹钢在全国的产能因调控而趋于固定,随时间没有太多波动。因此我们可以转而关注产能利用率,它是衡量企业生产能力的重要指标,它反映了企业在一定时期内的生产能力的利用程度,是衡量企业生产经营效率的重要指标,它的定义是实际产量与理论产量的比值。一般来说,产能利用率越高,企业的生产效率就越高,企业的经营效益也就越好。 一般来说,当螺纹钢价格有上涨趋势时,钢厂会逐步提高产能利用率。而产能利用率的提升,则会增大螺纹钢的供给,从而使得价格上涨趋势减缓甚至趋于稳定。由于钢材消费有季节性的规律,加之钢厂也有定期检修停产等,产能利用率呈现一定的季节性规律,特别在短流程上面更加明显。 图9:螺纹钢长短流程产能利用率 资料来源:国泰君安期货研究、钢联 图10:全国产能利用率与期货价格 资料来源:国泰君安期货研究、钢联 除了研究全国性的指标,我们还可以分析在主要产区钢厂的生产情况。唐山是华北重要的工业城市和钢材生产基地,因此唐山钢厂的产能边际变化情况对螺纹钢价格也有一定参考价值。从2021年初至2023年下半年,唐山钢厂的产能利用率在逐渐提升,总产能也在扩大,而相应地,螺纹钢价格在趋跌。 图11:唐山钢厂产能利用率、产能与期货价格 资料来源:国泰君安期货研究、钢联 其他供应类型的指标包括钢厂高炉的开工率,螺纹钢实际周产量,从原料端还可以参考铁水产量等。 图12:钢厂开工率与期货价格 资料来源:国泰君安期货研究、钢联 图13:螺纹钢周产量和期货价格图14:铁水产量与期货价格 资料来源:国泰君安期货研究、钢联资料来源:国泰君安期货研究、钢联 2.5螺纹钢库存、仓单指标 库存和仓单是商品的重要基本面特征。我们可以选取以下库存指标进行参考:仓单数量:螺纹钢(交易所每日盘后公布) rb_社会库存 Mysteel全国建材钢厂螺纹钢库存(周)中国螺纹钢库存:35城市:合计(周) 社会库存上升反映现货供应过剩,对于螺纹钢价格会有压制。呈反向变动关系。钢厂库存,出现累库时对价格有压力。仓单是商品交割时的提货凭证,类似交易所库存。此外,我们还可以研究主要城市的螺纹钢库存。从下面几张图的分析中,可以看出库存指标和产能利用率类似,随着钢材消费的淡旺季转换,有较强的季节性变化规律。 图15:仓单数量和期货价格图16:社会库存与期货价格 资料来源:国泰君安期货研究、同花顺资料来源:国泰君安期货研究 图17:钢厂库存和期货价格图18:主要城市库存与期货价格 资料来源:国泰君安期货研究、钢联资料来源:国泰君安期货研究、钢联 2.6螺纹钢下游需求端指标 如前文所述,我们大致可以选取如下的一些螺纹钢需求端指标:房屋新开工施工面积:累计同比(月) 中国:商品房:待售面积合计累计同比(月)螺纹钢:消费量:中国(周) 全国钢材成交量:主流贸易商:合计(日) 图19:房地产新开工施工面积:累计同比图20:商品房待售面积:累计同比 资料来源:国泰君安期货研究、同花顺资料来源:国泰君安期货研究、万得 图21:螺纹钢消费量与期货价格图22:全国钢材成交量:主流贸易商:合计 资料来源:国泰君安期货研究、钢联资料来源:国泰君安期货研究、钢联 需要注意,房地产相关的数据和一些宏观数据类似,通常频率为月度,且经常滞后天数较长。因此此类指标在实际构建量化因子时难度较大,且由于样本点数目偏少,不易抓住短周期的行情波动变化。而螺纹钢总体消费量、建筑钢材成交量等需求指标,与产能利用率类似,随着淡旺季的切换,有较强的季节性。 3.因子的构造与模型回测 3.1数据的处理和因子构造方法 我们提取单条时间序列数据,周度的数据向后填充到交易日中,例如某数据周五更新,则在更新之前均使用上周五的数据作为最新值。同时对于有缺失值的数据,也向后填充补足。我们对于得到的时间序列将进行一系列处理,最终将其映射为1(做多)、0(不持有合约,进行现金管理)、-1(做空)。当信号由0 变为1或者-1时,则选择开仓,从1或-1变为0时,则平当前仓位。由1变成-1或由-1变成1时,则先平当前仓位,再进行反向开仓。 对于基本面因子的处理方法通常有以下几种:1.取N周期的同环比,以此来衡量数据的增减变化情况。2.取N周期的差值,通常用在库存、开工率等数值常为正的情况。3.取N周期的移动平均,通常适用与数据变化剧烈或不够光滑的情况。4.设定阈值,例如当数据偏离N个标准差时触发信号,反之则不触发交易信号。5.构造特定规则,例如分别求较短的移动均线和较长移动均线,当短均线突破长均线触发信号,长均线突破短均线触发相反的信号。 3.2因子回测绩效展示 下面选取一些回测相对较好的因子进行展示,手续费设为双边万三。 图23:黑海-国内价差,夏普比率1.29,卡玛0.57,其图24:螺纹钢高炉利润,夏普比率1.88,卡玛0.93,2021 中2021年后夏普1.79,卡玛2.69年后夏普0.19,卡玛0.14 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图25:短流程产能利用率,夏普1.65,卡玛1.26,2021图26:消费量指标,夏普1.17,卡玛0.6,2021年后夏 年后夏普1.75,卡玛1.9普0.7,卡玛0.52 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 图27:螺纹钢厂库存,夏普1.07,卡玛0.59,2021年后夏普0.06,卡玛0.04 图28:螺纹钢仓单,夏普0.96,卡玛0.62,2021年后夏普0.74,卡玛0.66 资料来源:国泰君安期货研究资料来源:国泰君安期货研究 3.3因子组合 下面我们将简单叙述一些因子组合的方法。我们首先研究较为简单的两因子组合情形。例如我们考虑库存和基差的两因子组合。我们设定库存阈值为X,若当期指标小于(大于)阈值X,我们则在下一