您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华通证券国际]:基于非马尔可夫过程的原油期货价格模型分析 - 发现报告

基于非马尔可夫过程的原油期货价格模型分析

2025-07-22华通证券国际研究所华通证券国际嗯***
AI智能总结
查看更多
基于非马尔可夫过程的原油期货价格模型分析

请务必阅读正文之后的法律声明及风险提示项下所有内容2⚫一、油价波动的非马尔可夫性特征1.市场行为的“路径依赖”性在经典金融理论中,期货价格通常被认为是马尔可夫过程。马尔可夫过程的核心特征是“无记忆性”,即未来状态的概率分布仅依赖于当前状态,而与过去路径无关。其数学表达式为:这一特性是许多经典金融模型(如布朗运动、GBM、Black-Scholes模型)建模的基础。然而,在实际金融市场中,这种假设往往过于理想化。金融资产价格并非完全随机游走,投资者的博弈行为、趋势跟随策略、历史经验、情绪惯性等因素使得价格变动呈现出“路径依赖”与“记忆性”,即价格走势不仅由当前状态决定,历史轨迹对未来演化也有深远影响。在原油市场中,这种路径依赖性尤为明显。例如,2022年俄乌冲突爆发后,尽管市场供需未立即失衡,但由于历史经验与地缘预期,油价短期内剧烈上行,随后又在OPEC减产和美元紧缩背景下经历高位震荡。这种“由历史轨迹影响未来反应”的特征打破了马尔可夫假设的核心前提。因此,建立一套动态、含外生变量且具有时间依赖性的建模体系,是理解石油市场波动的关键。2.非马尔可夫性建模的必要性在非马尔可夫建模框架下,我们不仅关注当前价格状态,更将历史路径、宏观变量滞后项、政策扰动与情绪指标纳入建模视角。前文提到的传统金融模型在此情形下预测力极为有限,而ARIMAX、GARCH-X、滚动OLS等工具则具备更强的时间适应性与可解释性。近年来大量研究对金融市场中“非马尔可夫性”展开讨论,例如Bouchaud等(2009)基于微观结构市场建模指出,价格变化存在长记忆性[1],Lo & MacKinlay(1988)也通过经验数据展示了市场收益率的可预测性,从而质疑了马氏随机性假设的普适性[2]。这些结果推动了路径依赖建模在金融经济学中的重新兴起。尤其是在原油期货市场中,事件驱动往往表现为时间上持续影响,反映在价格走势上则体现为“短期冲击+惯性回调”结构。这种价格行为显著偏离马尔可夫路径,更强调历史状态(如OPEC动作、油价大幅波动)对于当下市场定价的影响。因此,构建非马尔可夫的含时因子建模框架,是理解并预测油价动态机制的一个重要路径。这一思路亦得到近年多项文献支持,例如Bildirici & Ersin (2012)在原油波动率建模中采用了Smooth TransitionGARCH搭配神经网络增强结构,通过构建平滑转换机制对潜在波动状态进行动态调节,实现对市场在高低波动区间之间的连续过渡。与显式马尔可夫状态跳跃不同,此非马尔可夫模型在捕捉行为路径依赖与情绪影响方面表现突出,尤其在地缘冲击或重大事件集中时,更能反映市场波动的持续性与结构变异。[3]。⚫二、数据选取与变量构造1.数据来源本研究使用的数据来自Wind、FRED,OPEC官网与美国劳工局BLS,时间跨度自2020年1月至2025年6月,涵盖新冠疫情冲击、俄乌战争爆发、美联储加息周期、OPEC多轮减产等关键阶段,为模型提供了充足的“事件异质性”。2.变量体系说明变量名B.IPEUSDX.FX美元指数,反映货币强弱VIX市场恐慌指数,反映情绪波动DGS10美国10年期国债利率,反映长期资金成本CPI(Oil)基于美国原油价格的消费者价格指数,作为通胀代理OPEC_cutOPEC减产事件虚拟变量(1/0)GC.CMX黄金价格(部分模型中使用)OPEC P(Xt+1|Xt,Xt−1,...,X0)=P(Xt+1|Xt)含义数据来源布伦特原油结算价(日频)WindWindFREDFREDBLSOPEC官网Press ReleaseWindOPEC石油产量Wind 请务必阅读正文之后的法律声明及风险提示项下所有内容3为确保模型具备足够的解释力与实际可操作性,我们在变量选择上兼顾经济学理论支撑、市场实践逻辑以及数据可得性,具体说明如下:⚫B.IPE:布伦特原油主力合约结算价(日频),取自ICE(洲际交易所)挂牌的布伦特原油期货合约,以美元/桶计价,是全球最重要的原油基准价格之一。作为本研究的预测目标变量,后续构建log_ret与对数价格序列均基于该变量进行计算。⚫log_ret与log_ret_lag:原油对数收益率反映了短期价格变化强度,同时引入滞后项(log_ret_lag)可帮助模型识别短期动量或均值回归结构,为滚动预测提供基本动态信息支撑。⚫美元指数(USDX.FX):原油以美元计价,美元强弱直接影响油价的相对价格。美元走强时,非美货币购买力下降,往往对油价构成压制。我们选择了日频美元指数作为代表指标,并构造一阶滞后,以避免未来信息泄露。⚫恐慌指数(VIX):市场情绪的代表。我们主要用于检验市场情绪指标与原油波动率之间的联动关系,尤其在波动率建模中用于验证其对条件异方差的解释力。⚫10年期国债收益率(DGS10):代表长期利率水平与资金成本。油价在较长时间维度内与利率水平互动显著,尤其在美联储加息周期中,DGS10的变动往往提前反映资金流向与原油估值切换。⚫CPI(Oil):我们直接选取了以石油消费为主的细分CPI子项作为变量输入,用于反映原油价格变化对终端通胀压力的反馈关系。该项指标更具针对性,能够捕捉油价变动对通胀结构的影响,从而增强模型对宏观驱动的响应能力.⚫OPEC减产事件(OPEC_cut):地缘供给侧变量的核心代表。我们人工标注了样本期内所有公开的OPEC减产声明,将其作为0/1虚拟变量纳入模型,捕捉政策冲击对油价的阶段性影响。⚫黄金价格(GC.CMX):避险资产的替代指标。当市场风险上升,资金往往从原油转向黄金,二者在特定时期呈现反向关系。我们采用了COMEX黄金现货价格的日度数据,并加入一阶滞后。⚫OPEC:全球原油供给的重要结构性变量。石油输出国组织(OPEC)是全球原油供应的主导力量,其成员国的联合产量变动往往对油价形成直接影响。尤其在减产政策出台期间,OPEC通过人为控制供应来稳定市场预期。同时,为统一频率与格式,我们采用Python脚本对原始数据进行了如下处理:1.时间对齐:统一为工作日频率(剔除节假日),对非交易日使用前向填充法(ffill)补全2.缺失值处理:部分宏观指标存在缺失,采用合理插值或剔除方式处理3.变量构造:计算价格的对数收益率:log_ret_BIPE = log(P_t)-log(P_{t-1});对部分变量构造滞后项,如VIX_lag1, DXY_lag1等;构造虚拟变量,如OPEC减产事件的cut;4.标准化:为使不同量纲的变量具有可比性,对所有外生变量进行归一化或标准化处理5.合并数据表:将各变量按日期进行整合,形成统一分析框架所有处理后的数据已保存在统一格式的csv文件中,便于模型读取与分析。⚫三、模型框架与结果分析1.收益率预测:ARIMAX模型效果有限我们首先尝试使用ARIMAX(带外生变量的自回归滑动平均)模型对布伦特原油的对数收益率进行建模,所引入的外生变量包括美元指数(USDX.FX)、VIX(恐慌指数)、黄金价格(GC.CMX)、供给与需求指标(如BDI)等。ARIMAX模型是一种线性时间序列建模方法,形式如下:𝑦𝑡=𝜇+∑𝛼𝑖𝑦𝑡−𝑖+∑𝜃𝑗𝜀𝑡−𝑗+∑𝛽𝑘𝑥𝑘,𝑡−𝑙𝑎𝑔+𝜀𝑡𝐾𝑘=1𝑞𝑗=1𝑝𝑖=1其中:⚫𝑦𝑡:第t天的目标变量(本研究中为布伦特原油的对数收益率)⚫μ:常数项⚫𝛼𝑖:自回归(AR)系数,描述收益率的自身滞后影响⚫𝜃𝑗:滑动平均(MA)系数,建模前期误差的累积影响⚫𝑥𝑘,𝑡−𝑙𝑎𝑔:第k个外生变量在t-lag天的值(如美元指数等)⚫𝛽𝑘:外生变量的回归系数⚫𝜀𝑡:第t天的白噪声,error term。基本来说,ARIMAX尝试将外部经济指标纳入原油收益率的预测框架,但前提是这些变量与油价波动存在线性、 请务必阅读正文之后的法律声明及风险提示项下所有内容4稳定的关系。但从本质上来说,ARIMAX其实就是复杂一点的,可以手动调整参数(AR,MA)的线性回归模型。尽管理论上ARIMAX可处理非平稳性并引入外部信息,但由于部分因子与油价波动相关性较弱,模型效果并不理想。在滚动窗口测试中,多次出现预测结果严重偏离真实值,部分时期的R²甚至为负,表明其预测性能不如简单均值模型。进一步分析其预测能力有限的原因,主要包括以下几点:第一,从建模结构上看,ARIMAX属于线性时间序列模型,假设目标变量对所有外生变量影响是线性、稳定、可加的。而原油收益率数据呈现出明显的非线性跳跃特征与异方差结构,尤其在重大事件驱动期间,单一线性响应无法有效刻画价格的突变与波动集聚行为。此外,该模型未能对不同市场阶段下变量作用权重的变化做出响应,导致参数稳定性不足。第二,从宏观变量机制来看,部分变量如美元指数、黄金价格等虽然与油价存在一定关系,但其波动频率或影响路径并非与原油短期收益率完全一致。例如美元走强可能压制油价,但这种作用存在滞后性和阶段性;而黄金价格波动亦可能受到独立的避险情绪驱动,与油价偶尔呈现同步性但相关性不稳定。第三,从市场行为视角出发,石油市场受地缘政治、供需预期、机构博弈等行为性因素主导,常常呈现路径依赖与状态跃迁特征。ARIMAX模型假设市场变化为平稳可控、结构不变,但现实中油价波动往往伴随跳变结构与非对称反应并带有一些周期性,例如对减产消息或战争预期的反应具有非线性幅度放大特征,这类机制在ARIMAX框架下难以捕捉。综上,ARIMAX模型虽然在理论上适合引入外生信息,但在面对具有高频扰动、跳跃行为与复杂机制的油价序列时,其线性结构和参数静态性限制了模型的灵活性与泛化能力。2.波动率建模:GARCH vs GARCH-X在收益率预测效果有限的背景下,我们转向对数收益率的波动率建模,分别采用标准GARCH(1,1)与引入外生变量的GARCH-X结构。GARCH(1,1)的公式为:𝑦𝑡=𝜇+∑𝛼𝑖𝑦𝑡−𝑖+∑𝜃𝑗𝜀𝑡−𝑗+∑𝛽𝑘𝑥𝑘,𝑡−𝑙𝑎𝑔+𝜀𝑡𝐾𝑘=1𝑞𝑗=1𝑝𝑖=1σt2=μ+αεt−12+βσt−12GARCH-X的公式为:σt2=μ+αεt−12+βσt−12+γzt−lag其中:σt2:对数收益率log-ret的方差,即波动率。μ:常数项α:衡量前期冲击(残差平方)的影响程度𝜀𝑡−1:在t-1天的时候对数收益率的残差,类似于前文提到的ARIMAX模型中的对数收益率的白噪声。β:衡量前期波动延续性的强度γzt−lag:此项则为外生变量(VIX)对于波动率造成的影响。GARCH模型的的本质预测当前的波动率不仅受到过去波动率的影响,还受到上一期冲击,即对数收益率残差的影响。而GARCH-X则是在此基础上考虑了外生因素造成的额外影响。结果显示,GARCH模型的𝑅2=0.5737。并且结构简洁、拟合稳定,能有效捕捉波动聚集特征,尤其在高波动期(如2022年初)表现平稳,预测线较为平滑但对剧烈波动存在滞后。而GARCH-X模型在引入市场恐慌指数(VIX)的一阶滞后项后,𝑅2=0.5676,略低于GARCH。但其优势在于通过引入外部变量,实现了对系统外部情绪与风险预期的显式建模,在面对政策不确定性、地缘冲突等外部冲击时,模型响应能力更强,具备更高的宏观解释力。从数学角度看,GARCH-X在条件方差项中加入外部信息,突破了GARCH对历史残差与波动的封闭依赖,允许外部预期直接影响波动估计,从而更贴合金融市场的非马尔可夫特征。从宏观机制看,原油市场波动不仅源于价格自身的反馈过程,更与市场情绪(如避险升温)和政策事件(如OPEC决议)密切相关。VIX的引入为模型提供了“结构先验”,增强了其在宏观扰动时期的灵敏度。但需要指出,VIX的解释力具备阶段性。在市场平稳期,其波动本身有限,外生变量在GARCH-X中的边际贡献趋弱。这也解释了为何在全样本下GARCH-X整体表现不及GARCH,但在波动放大期,其“含时”结构优势显著,体现了非马尔可夫设计的应用价值。 请务必阅读正文之后的法律声