您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:股指策略系列二:股指期货成交持仓因子的构建与解析 - 发现报告

股指策略系列二:股指期货成交持仓因子的构建与解析

2024-09-06 国泰君安证券 Angie
报告封面

期货研究 二〇 二2024年09月05日 四年度 股指策略系列二:股指期货成交持仓因子 的构建与解析 宋哲君投资咨询从业资格号:Z0014960songzhejun022131@gtjas.com 国 泰李浩投资咨询从业资格号:Z0020121lihao024471@gtjas.com 君宋子钰(联系人)从业资格证号:F03136034songziyu029981@gtjas.com 安 期张剑锴(联系人)从业资格证号:F03114607zhangjiankai027874@gtjas.com 货 研报告导读: 究本篇报告以四大股指期货为标的,对交易所每日盘后公布的成交持仓表中所包含的信息进行了挖掘和 所处理,基于会员的多空持仓变化信息以及成交量信息构造了对应的持仓日间择时因子,并对因子的表现效 果在回测中进行了验证。 本报告在正文部分展示了通过成交持仓表中的信息所构建的持仓因子的计算表达式,将择时策略分为了直接择时和条件择时两类方法,在不同时间参数以及不同席位上的持仓因子的回测效果。从整体结果上看,成交持仓数据中的信息,确实蕴含了有效的日间择时信息。此外,我们发现,对于不同的股指期货标的,持仓因子的择时效果,在不同的参数和计算方式下,也存在一定的差异性。此外,本报告还探索了使用遗传算法来优化持仓因子的方法,虽然这种方法在提高策略夏普比率和稳定性方面显示出潜力,但也存在过拟合和解释困难的风险。 具体到回测结果来看,在使用基于经验逻辑的持仓因子进行策略构建时,持仓因子在上证50股指期货标的中的实际表现效果并不理想,但是对于其他三类股指期货标的,净多头持仓变化率、净多头持仓占比变化、多头持仓占比变化、多空持仓变动强度以及多空情绪强度等持仓因子表现较好。而使用遗传算法进行持仓因子构建时,对于四个股指期货标的,均能够一定程度上挖掘出具有较好表现的持仓因子。但是,需要注意的是,对于遗传算法等复杂方法的应用,应谨慎评估其长期稳定性和可解释性,确保策略的实用性和可靠性。 目录 1.成交持仓数据的选取和处理方式3 1.1数据选取3 1.2数据处理3 2.日间择时策略的构建逻辑3 3.持仓因子的构建4 3.1净多头持仓变化率4 3.2净多头持仓占比变化4 3.3多头持仓量变化率4 3.4多头持仓占比变化5 3.5空头持仓量变化率5 3.6多空持仓变化方向5 3.7多空持仓变动强度6 3.8多空情绪强度6 4.持仓因子日间直接择时策略检验6 4.1上证50股指期货:直接择时策略检验7 4.2沪深300股指期货:直接择时策略检验10 4.3中证500股指期货:直接择时策略检验20 4.4中证1000股指期货:直接择时策略检验27 5.持仓因子条件择时策略检验37 5.1持仓因子条件择时策略检验:条件收益37 5.2持仓因子条件择时策略检验:条件成交量44 6.基于遗传算法的持仓因子构建46 6.1遗传算法流程和思路47 6.2持仓因子的构建流程47 6.3基于遗传算法的持仓因子回测47 7.结论60 (正文) 1.成交持仓数据的选取和处理方式 1.1数据选取 在本篇报告中,我们选择的四个股指期货标的分别为上证50,沪深300,中证500和中证1000股指期货,对于每个股指期货标的,我们通过交易所在每日结算后公布的成交持仓排名表,来获取到对应的持仓信息。该表披露了结算会员的成交量、多头持仓量和空头持仓量数据。其中,对于持仓量和成交量,我们使用排名前20名的会员的持仓和成交信息用于构建持仓择时因子。 1.2数据处理 在对数据进行汇总整理,以及构建因子的过程中,由于数据源的原因,可能会出现成交持仓数据的缺失问题。用于成交持仓数据相较于其他的基本面数据,变化频率较高,且变动程度较大,因此对于存在缺失值的日期,我们不对缺失值进行处理,在数据缺失日,我们会发出空仓信号。 2.日间择时策略的构建逻辑 在构建因子和测试因子效果的过程中,我们遵循传统股票单因子择时中的基本逻辑,并进行了一系列的设置,本报告中有关因子构建和测试的具体细节如下: (1)确认目标变量:本篇目的为构建股指的日间择时策略,因此在目标变量的选择上,所选的核心的四个标的分别为上证50,沪深300,中证500和中证1000股指期货,预测目标为其对应的收益率。在实际的交易过程中,我们希望能够使用收盘后的数据构建因子,第二天的开盘进行交易,因此使用closetoclose的收益率作为预测目标,以未来1日的收益率作为预测目标,构建日频的预测信号。 (2)因子构建:本篇报告基于成交持仓表中的信息,分别使用不同的表达式对持仓因子进行构建,同时考虑同一表达式的回溯期参数和席位参数的设定,针对每个标的构建了48个持仓因子。 (3)回测时间区间:对于上证50、沪深300、中证500股指期货,回测的时间区间为2015年04月 16日至2024年08月29日。对于沪深300股指期货,回测的时间区间为2014年01月02日至2024年 08月29日。对于中证1000股指期货,回测的时间区间为2022年07月22日至2024年08月29日。 (4)调仓频率:日频调仓,若择时信号一直为多(空),则一直持有多单(空单)不平仓。 (5)保证金100%,1倍杠杆 (6)暂不考虑手续费及滑点直接择时 在计算出特定指标之后,我们考虑使用直接择时的方法利用这些指标来进行市场时机的选择。具体来说,我们可以设定一个阈值X,如果当前期的指标值超过了(或低于)这个阈值X,我们就会在下一期选择买入(或卖出)相关的期货合约。我们通常会将初始阈值设定为0,然后进一步研究调整阈值是否能够显著提升择时的效果。需要注意的是,阈值的选择可能会引入过拟合的风险,因此在选择阈值时,建议从经济意义的角度出发,而不是单纯追求样本内单因子的最佳表现。 条件(conditional)择时 依据计算出的指标值进行择时方法虽然直接,但可能存在的问题是该指标的择时方向并不一定始终如一,例如在当日收益为正时,指标是正向指标,而在当日收益为负时,指标是负向指标,或者失效,此时的择时效果可能并不稳定。因此,我们在进行了直接择时策略回测后,同样从多角度进行了有条件的择时策略回测。 3.持仓因子的构建 本节中,我们将会展示不同持仓因子的构建方式以及其对应的表达式。 3.1净多头持仓变化率 该指标计算方法如下所示: 由于净多头持仓可能为负数,所以我们在计算变化率时分母需要取绝对值。从经济和现实逻辑上考虑,该持仓指标为正向指标,即净多头持仓增加表明对于后市更为看好,标的上涨的可能性较大。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.2净多头持仓占比变化 该指标计算方法如下所示: 从逻辑上看,该指标应为正向指标,即净多头持仓占总持仓量比例增加说明对于后市更加看好,标的上涨可能性更大。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.3多头持仓量变化率 该指标计算方法如下所示: 从逻辑上看,该指标应为正向指标,即多头持仓量增加说明对于后市更加看好,标的上涨可能性更大。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.4多头持仓占比变化 该指标计算方法如下所示: 从逻辑上看,该指标应为正向指标,即净多头持仓占总持仓量比例增加说明对于后市更加看好,标的上涨可能性更大。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.5空头持仓量变化率 该指标计算方法如下所示: 从逻辑上看,该指标应为反向指标,即空头持仓量增加说明对于后市更不看好,标的下跌可能性更大。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.6多空持仓变化方向 该指标计算方法如下所示: 从逻辑上看,该指标应为正向指标,其要求在判断市场动向时,多头持仓量的变化必须与空头持仓量的变化形成特定的对应关系,即多头持仓量增加(或减少)必须伴随着空头持仓量的减少(或增加),才能触发买入(或卖出)的信号。这种设计使得该指标在评估市场趋势时显得更为严谨,因为它不仅关注单一方向的持仓变化,而是强调两者之间的动态平衡。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和以及前20名的持仓和。 3.7多空持仓变动强度 该指标计算方法如下所示: 其中, 从逻辑上看,该指标应为正向指标,衡量了会员对于后市多空看法的强烈程度,若该会员在某一段回溯期内增持多单同时减持空单,那么可以认为该会员看多意愿较为强烈,此时该指标值为1;反之则认为该会员看空意愿较为强烈,此时该指标值为-1。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10 名的持仓和以及前20名的持仓和。 3.8多空情绪强度 该指标计算方法如下所示: 其中, 从逻辑上看,该指标应为为正向指标,其功能在于评估特定时间段内市场参与者(如会员)的多空情绪的强烈程度。如果该会员的持仓变动相对于交易量的比例较大,这表明该会员的多空立场较为坚定且情绪强烈,他们并未频繁地进行交易调整持仓。相反,如果持仓变动的比例较小,则可能反映出该会员在多空方向上的犹豫不决,情绪不够强烈。在参数的选择上,对于该持仓因子,回溯期参数R依据过往经验,可选择10、20、30、60、120和240天,多空头持仓量可选择参数为前5名的持仓和、前10名的持仓和 以及前20名的持仓和。 4.持仓因子日间直接择时策略检验 在本节,本报告给出了针对四个股指期货标的,8个持仓因子,在不同的回溯期和席位参数下,构建单因子直接择时策略的回测结果。对于每个股指期货标的,我们选择了在直接择时策略中,年化收益大于15%的因子,展示了其净值的变动情况。 4.1上证50股指期货:直接择时策略检验 表1:净多头持仓变化率 年化收益 年化波动 夏普比率 卡玛比率 胜率 盈亏比 最大回撤 前5(R=10) 1.13% 22.74% 0.05 0.01 50.13% 1.01 -94.79% 前10(R=10) 6.00% 22.74% 0.26 0.06 50.93% 1.05 -95.31% 前20(R=10) 6.34% 22.74% 0.28 0.07 50.73% 1.05 -95.97% 前5(R=20) 7.45% 22.67% 0.33 0.11 51.11% 1.06 -68.51% 前10(R=20) -10.95% 22.67% -0.48 -0.07 49.73% 0.91 -157.75% 前20(R=20) -0.32% 22.68% -0.01 0.00 50.93% 1.00 -66.52% 前5(R=30) -2.59% 22.37% -0.12 -0.03 50.31% 0.98 -95.50% 前10(R=30) -1.63% 22.37% -0.07 -0.02 50.33% 0.99 -102.80% 前20(R=30) 2.24% 22.36% 0.10 0.03 50.42% 1.02 -66.42% 前5(R=60) -