您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ELSEVIER]:JFE 机器学习预测股票走势 - 发现报告

JFE 机器学习预测股票走势

2024-06-18-ELSEVIERA***
JFE 机器学习预测股票走势

斯科特·默里,徐森,肖厚平∗ 乔治亚州立大学,罗宾逊商学院,35号大道,亚特兰大,GA,30303,美国 文章信息 摘要 我们通过使用机器学习预测股票回报的历史数据来检验有效市场假说。表现。这些预测强烈预测了未来股票收益的横截面。其预测能力在大多数子期间中保持,并在最大的500支股票中表现强劲。预测函数具有重要的非线性性和交互性,随时间推移表现得非常稳定,并捕捉到与动量、反转和现有技术信号截然不同的效应。这些发现质疑了有效市场假说,并表明技术分析和图表分析有其价值。我们还证明,在优化中表现良好的机器学习模型在样本外也继续表现良好。 数据集链接:https://.doi.org/10.17632/x63r376783.2dx JEL分类:G11 G12关键词: 有效市场假说 机器学习 深度学习技术分析 股票收益截面 1. 引言 高度显著且具有预测力的预测能力。这种预测能力 在大部分子周期中,我们的焦点测试周期1963.07-2022.12中,电力占据主导地位,包括最近的2015.01-2022.12子周期,并保持如此。 弱形式的效率市场假说(以下简称EMH)。 期间,在最大的500只股票中表现出强劲的表现。预测功能在时间上表现得相当稳定,并且高度复杂,具有大量的非线性以及重要的交互成分,这对于预测至关重要。最后,我们基于机器学习的预测能力并不能用众所周知的动量(Jegadeesh和Titman)来解释。1993)) 和反转(Jegadeesh)1990无已知效果,亦无之前研究过的技术或机器学习信号。基于执行的机器学习过程需要我们进行几个实施—— 规定仅基于描绘股票历史表现(以下称“价格走势图”)的信息构建盈利投资组合是不可能的。因此,技术分析或图表分析应被视为一种徒劳的投资技术。 技术分析领域的学术研究普遍支持这一预测。尽管在学术文献中对技术分析普遍持有负面态度,它仍然被投资经理广泛采用。民主持续广泛使用技术分析表明,其优势可能在学术研究中尚未得到 充分发现,因此进一步的探究是必要的。 本文通过考察来测试有效市场假说的弱形式。 决策。为了减轻与数据挖掘相关的担忧(Harvey)。tation et al. (2016))) 或外样本预测能力(McLean和Pontiff)2016) , 绿等. (2017我们使用192701-196306期间的数据,我们将其称为“优化期”,以选择我们的机器学习模型。1我们的分析引导我们使用具有长短期记忆的卷积神经网络作为机器学习架构,均方误差作为损失函数。项函数,一种将相同的总权重分配给……的加权方案。 机器学习(以下简称ML)产生的预测能否预测未来股票收益的横截面。这些预测仅基于易于从历史价格图中识别的数据,具体而言,是过去12个月的累积股票收益。我们发现有充分证据表明基于机器学习的预测在经济上具有重要意义。 从每个月以及每只股票中获得的等权重观测 月份,以及作为因变量的未来回报的正常化度量。 𝑀𝐿𝐸𝑅回报率,历史累积回报和期限捕捉 变量。2我们的使用仅优化期间的数据来做出这些机器学习模型决策,确保我们的主要测试结果真正反映了样本外预测能力。我们使用优化后的机器学习模型来生成股票回报预测 非线性预报中的非线性行为,表明预测能力存在局限性。 预测由先前记录的关系包含。在控制这些因素后,效果仍然强劲。我们的后续测试将检验机器学习(ML)的预测能力是否…… 基于从历史市场数据和未来股票收益计算出的变量,首先,我们发现,尽管基于机器学习的预测确实包括与动量(Jagadeesh和Titman)相关的因素,但……1993)) 和 在196307-202212这一时段,我们将其称为“测试时期”,我们的主要分析考察了由组成的投资组合的表现 .通过对基于机器学习预测的股票进行排序,我们记为“od”。 组成部分反转(Jegadeesh(1990), Lehmann (1990)) 影响,基于机器学习预测的大部分预测力与这些现象无关。接下来,我们展示了我们的基于机器学习的预测具有积极但 我们发现:是未来股票回报横截面分布的一个强有力的预测指标。仅使用从纽约证券交易所(NYSE)上市公司计算出的断点构建的价值加权十分位端点的平均超额回报。 相对较弱的关系与基于图像的机器学习预测的蒋相关nomena. al. (2022)并且,在考虑了基于图像的预测之后,我们预测的预测力依然强劲。我们还发现,Neely等人(Neely et al.)所考察的14个技术信号中,没有任何一个信号。2014)或Freyberger等人考察的14个贸易摩擦变量。2020请解释:) explain the −0 14% 股票上涨自.每月,对于十等分的投资组合来说为……0.93%1 我国基于机器学习的预测与未来股票回报之间的关系。最后,我们直观地分析了与高回报和低回报相关的图表,并发现即使在具有相似动量和反转值的股票中,这些图表也存在易于观察到的差异。 每月为10分位投资组合计费。.08% 尽管我们的方法是每月由持有十分位高收益组合并做空十分位低收益组合的投资组合产生的收益不仅经济规模巨大,而且高度统计显著。5 51- 统计数据 通过人类图表阅读者识别出的差异。我们最近的研究测试了我们的优化过程的有效性。 tically. 设计以确保我们的结果反映样本外表现,此乃及其他措施。 我们的样本周期为1963年07月至2022年12月。该投资组合为持有高价- 我们的资产定价测试统计数据远超基准- Harvey等人提出的统计数据()2016). 我们发现没有证据表明平均收益率的波动与……(此处缺少具体内容)有关。- 分类投资组合的增加归因于风险。与几个建立的因子模型相比,十分位投资组合的阿尔法(Alpha)表现出与平均超额收益相似的走势。波动性、偏斜、值风险和价值损失(Expected Shortfall)等风险指标均不支持基于风险的……不确定性下的平均收益模式解释。预测能力的在整 值(低价值)股票的长期(短期)头寸。产生一个庞大且高度-1%个大部分区域都十分强劲 使用程序及其相关程序.夏普比率的长短仓投资组合0 69 在每月超过平均超额回报率期间 在测试期间……。这种强烈的正相关表明优化过程成功地识别出哪些机器学习模型将产生更好的样本外预测。我们的工作为三个广泛的研究领域做出了贡献。首先,我们 在大多数子期间均实现了显著增长。例外的是200501-201412子期间,由于数量较少,平均超额收益接近于零。 2009年连续出现巨额月亏损。这些亏损归因于在200904和200908期间,由于该投资组合的异常大的动量倾斜与大量 策略亏损的组合。在最近的情况下,势头 1 20%201501-202212子期间,该组合产生. 每月2 资本化,长期短期投资组合的平均超额收益是与相关.13 统计数据为...。该预测能力的统计值为... 样本仅限于大型股票时,其强度仍然非常显著。最值得注意的是,当仅使用市值排名前500的股票时。0.72%4每月(.37基于ML的预测。在该领域的主要挑战是,ML过程是一个黑盒方法,由学习过程产生的预测函数难以解释。这类测试的第一项是检验过去价格与预测结果之间的关系。 将遗传算法(一种机器学习形式)应用于识别交易标准普尔500指数的技术规则,发现它们在样本外不适用。最近,朱和周(2009我们发现技术分析对于资产配置决策是有用的,Moskowitz 等人(2012al. (2014)表明技术指标对于预测市场风险溢价是有用的,Han等人 (2013)发现移动平均策略对于时机投资于波动率排序投资组合效果良好。3尽管技术分析在实际中得到广泛应用 模式和未来股价的稳定性随时间而稳定。我们发现这确实如此。基于长时间间隔数据子集拟合的预测高度相关,且相关的多空投资组合具有大量共同持仓和高回报相关性。此外,当ML模型拟合所有可用数据时,基于机器学习的预测表现略好。- 统计指标 = )。我们下一个测试的目标是确定预测能力 基于过去数据与当拟合过程应用于滚动窗口子期间数据的比较。随后,我们研究了非线性及相互作用的重要性。 时间序列动量在众多资产类别中,Neely 等人发现 术语在预测函数中,并发现它们是造成其结果的原因。 大部分预测变化的实质部分对于预测至关重要;近三分之二的变化可以归因于 (Menkhoff (2010), Lo 和 Hasanhodzic (2010关于技术信号预先力量的研究相对较少。最近,江等人进行的相关研究。dictive 非线性与预测函数中的相互作用,其中近一半的变异是由相互作用驱动的。未来 3198619931997)Sweeney((Levich and Thomas)), Neely 等人 ((,) 张 和奥瑟尔(1999), 以及 Gehrig 和 Menkhoff (2006发现基于技术分析的投资策略在外汇市场中具有盈利性,这一发现与Osler()的观点相符。2003)归因于止损和止盈订单的集群。LeBaron (1999)认为此类战略的盈利性归因于中央银行在货币市场的干预,但Neely(2002相反的情况。结论 2我们依赖于机器学习文献(例如,参见Goodfellow等人)。 (2016为了激发我们对超参数的选择,例如神经网络中的层数、用于提前停止以防止过拟合的epoch数量等。我们神经网络的配置细节在互联网附录的I节和图A1中描述。工作 (2022使用机器学习来预测股票是否会产生正收益 仅基于过去12个月的累积回报进行估算。主要 过去五天到三个月期间的平均价格基于过去价格和成交量数据的图像表示,预测负面的未来回报。4他们的预测与我们的预测在许多方面存在差异。首先,他们基于机器学习的预测输入是一个图表的图像,该图表描绘了每日的开盘价、收盘价、最高价和最低价,以及交易量和月份。我们的方法更简单,因为我们仅使用过去12个月的月累计回报观察值作为预测的基础。此外,江等人(2022) 将图像缩放以仅反映历史价格和成交量图中的模式形状,而不反映大小。我们不对基于我们预测的基础数据进行缩放,因此允许我们的机器学习过程根据过去收益的形状和大小学习模式。鉴于我们方法上的差异,我们的基于机器学习的预测的预测能力并没有被 Jiang 等人生成的预测所包含。2022)。在江等人(Ad-)的研究中。2022我们发现预测模式是此外,具有独立性的上下文,意味着相同的模式在不同的市场和不同 在我们这个环境中,机器学习的优势在于其检测过去与预期未来收益之间高度复杂关系的能力。7这与先前的研究形成对比,先前的研究利用了机器学习从大量预测变量中生成有意义的预测的能力。与那些通过机器学习识别因素和套利投资组合,从而在风险和预期回报之间找到最优权衡的工作不同,我们评估技术分析在预测未来股票回报有效性方面的目标,使我们使用机器学习仅来预测预期回报。最后,我们为更广泛使用机器学习进行资产研究的文献做出了贡献。 通过展示预先优化模型选择的有效性来提高定价应用。大部分使用机器学习来预测回报的研究都使用某种形式模型优化程序来选择模型参数。Gu等人( )2020对比不同机器学习模型从大量股票层级特征中生成风险溢价估计的表现,但不检验样本外表现是否与优化过程中的表现相关。我们发现不同机器学习模型优化周期与测试周期表现的强相关性表明,此类优化过程是有效的。本文的剩余部分组织如下。第2 de- 的时间尺度上保持不变,我们发现预测模式在时间上是持续的,这表明图表分析师有可能在相对较长的时间内学习这些模式。我们的研究最类似于Lo等人()。2000), 使用平滑估计器 通过提取历史价格模式与未来股票回报之间的非线性关系。这一发现一直是众多审查的主题,真实地,尤其是通过Jegadeesh(200