
研究院 量化组 摘要 研究员 本篇报告在《华泰期货量化策略专题报告 20240712:转融通暂停影响简述》基础上展开对股指期货年化基差率相关因子的量化分析。首先用 Pearson 相关系数以及Distance 相关系数来衡量因子的线性与非线性关系,探讨因子在不同预测周期下的表现,并对因子进行筛选;其次构建了基于线性回归模型 OLS+Ridge 以及非线性的机器学习模型 Random Forest 和 Xgboost 的年化基差率预测模型,展示了模型在不同预测周期下的预测效果。在预测周度年化基差率时,Xgboost 对目标变量的预测精度表现较好,MSE 平均 0.044%,涨跌准确率平均 57.70%,最高达 62.13%。 高天越0755-23887993gaotianyue@htfc.com从业资格号:F3055799投资咨询号:Z0016156 联系人 李光庭0755-23887993liguangting@htfc.com从业资格号:F03108562 核心观点 1)公募指增超额和指数正负波动率类因子对年化基差率影响较大。 李逸资0755-23887993liyizi@htfc.com从业资格号:F03105861 2)公募指增超额类因子随预测周期变长相关性下降幅度较大,管理人的超额能力对短期内的基差水平影响较大。指数相关因子则无明显下降趋势,现货市场的波动对未来基差走势影响的延续性较强。 3)预测周度年化基差率时,Xgboost 对目标变量的预测精度方面表现较好。 黄煦然0755-23887993huangxuran@htfc.com从业资格号:F03130959 麦锐聪0755-23887993mairuicong@htfc.com从业资格号:F03130381 投资咨询业务资格:证监许可【2011】1289 号 目录 摘要.......................................................................................................................................................................................................1核心观点...............................................................................................................................................................................................1基于多因子体系的基差预测模型.......................................................................................................................................................4■股指期货基差...............................................................................................................................................................................................4■因子相关性...................................................................................................................................................................................................4■多因子模型构建...........................................................................................................................................................................................9■模型预测效果展示..................................................................................................................................................................................... 11■总结.............................................................................................................................................................................................................15■风险提示.....................................................................................................................................................................................................15 图表 图1 : IF因子有效性与预测周期|单位:无....................................................................................................................................7图2 : IH因子有效性与预测周期|单位:无...................................................................................................................................7图3 : IC因子有效性与预测周期|单位:无................................................................................................................................... 7图4 : IM因子有效性与预测周期|单位:无.................................................................................................................................. 7图5 :每个预测日T的训练集与测试集示意图|单位:无............................................................................................................9图6 :模型建立与预测流程图|单位:无......................................................................................................................................10图7 :不同预测周期的准确性—OLS+RIDGE|单位:无.............................................................................................................. 11图8 :不同预测周期的准确性—RANDOMFOREST|单位:无...................................................................................................... 11图9 :不同预测周期的准确性—XGBOOST|单位:无...................................................................................................................11 表1 :不同预测周期下因子线性相关统计|单位:无.......................................................................................................................5表2 :不同预测周期下因子非线性相关统计|单位:无...................................................................................................................8表3 :模型训练及预测效果..............................................................................................................................................................12表4 :T+5年化基差率模型训练及预测效果|单位:无...............................................................................................................12表5 :T+5年化基差率涨跌方向预测效果—XGBOOST|单位:无................................................................................................13表6 :T+5年化基差率入选因子前10—XGBOOST|单位:无.......................................................................................................14 基于多因子体系的基差预测模型 ■股指期货基差 基差是股指期货研究中重点关注的指标之一,是许多对冲、套利策略的构建基础。因此,对基差的预测与判断具有重要的意义。构建一个基差预测模型首先需要结合主观的逻辑,找出与基差相关的因素并用合适的因子去量化这个影响因素,并利用数学模型作为工具,从数据的层面验证它们的相关性,再将有效的因子通过不同方式组合成为预测模型,最后选择适合的标度去衡量模型预测的准确性。在《华泰期货量化策略专题报告 2024071