您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[J.P.摩根]:大数据与人工智能战略:SmartBuzz 用于收益电话会议记录和新闻中的交易主题 - 发现报告
当前位置:首页/宏观策略/报告详情/

大数据与人工智能战略:SmartBuzz 用于收益电话会议记录和新闻中的交易主题

2021-10-22-J.P.摩根北***
大数据与人工智能战略:SmartBuzz 用于收益电话会议记录和新闻中的交易主题

全球量化及衍生策略2021 年 10 月 22 日大数据与人工智能战略SmartBuzz 用于收益电话会议记录和新闻中的交易主题 使用我们的主题识别框架 SmartBuzz 扩展我们之前在 NLP 情绪评分方面的工作,我们根据在股票新闻文章和 ASX 200 股票的公司收益结果记录中发现的机器识别的短期主题开发交易信号。 我们为各种以交易为重点的主题构建 SmartBuzz 因子,这些主题涉及收益和利润、股息和 ESG 等主题——在结果电话会议和新闻发布后测试股票价格的短期变动。我们使用 SmartBuzz 跟踪这些主题随时间的出现和持续存在,并注意到最近对收益和股息主题的看法有所增加。 我们发现这些文本来源提供了独特的见解、信息频率、及时性和挑战。我们可以利用文本在发布后长达 10 天的时间进行多空交易,通过信号和过滤器的组合,平均收益率高达 1% 甚至更多。 通过两个文本源之间的情绪分数识别某些特殊性,我们发现仅使用“Pos”或“Neg”标签对新闻效果很好,但对于成绩单,我们发现需要消除的明显偏见。相关性也被证明是过滤某些结果的有用工具。 使用围绕“报告”主题术语构建的 SmartBuzz 因子,我们测试了围绕事件日期的 10 天表现。我们发现事件的原始来源(即公司成绩单)拥有最强的 alpha,而新闻文章对相关性过滤器很有用。 尽管在管理层财报电话会议中发现了有偏见的“积极前景”,但 SmartBuzz 的“报告”因素仍然可以有效区分后续表现优异者和表现不佳者,如图 1 所示。图 1:报告季节成绩单情绪事件研究资料来源:摩根大通 BD&AI、标准普尔全球。事件研究显示 S&P/ASX 200 股票在 2019-21 财年的超额回报。大数据、人工智能和 NLP 策略 Berowne Hlavaty交流电(61-2) 9003-8602彭博社JPMA HLAVATY <GO>摩根大通证券澳大利亚有限公司罗伯特·史密斯博士交流电(61-2) 9003-8808彭博社JPMA RSMITH <GO>摩根大通证券澳大利亚有限公司埃文胡(852) 2800-8508摩根大通证券(亚太)有限公司彭程,CFA(1-212) 622-5036摩根大通证券有限责任公司托马斯·J·墨菲博士(1-212) 270-7377摩根大通证券有限责任公司阿尤布·哈尼夫博士(44-20) 7742-5620摩根大通证券有限公司Dobromir Tzotchev,博士(44-20) 7134-5331摩根大通证券有限公司库拉姆乔杜里(44-20) 7134-6297摩根大通证券有限公司全球市场策略主管 Marko Kolanovic 博士(1-212) 622-3677摩根大通证券有限责任公司有关分析师认证和重要披露(包括非美国分析师披露)的信息,请参见第 22 页。摩根大通与其研究报告中涵盖的公司开展业务并寻求开展业务。因此,投资者应意识到公司可能存在可能影响本报告客观性的利益冲突。投资者应将本报告视为做出投资决策的唯一因素。 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86022NLP 的示例用例在本报告中,我们使用我们的一些最先进 (SotA) 工具进行情感评分和主题识别,探索自然语言处理 (NLP) 的一些示例用例。Muppet Wars 论文中描述的使用 MPNET 的 SmartBuzz 情绪评分。 受 Smart Buzz 2.0 论文启发的财务相关术语。在本报告中,我们研究了这两种工具,以了解它们如何应用于不同的文本源,确定在从非结构化文本数据构建定量投资信号时需要解决的一些偏见和实际问题。情感模型最简单的情感模型之一基于哈佛词典或 Loughran-McDonald 词典方法(例如,在 NLTK 和 VADER 中可用)。这些模型对每个单词的情感得分为 -1 到 1,使用这些方法可以非常快速地计算任何句子的平均情感。我们使用的另一种类似于上述词典的方法是计算加权术语情绪。有 100 万摩根大通分析师报告可供参考,在之前的研究中,我们在过去 5 年(超过 250k)中对单一股票的增持、中性和减持评级(75k)进行了评估。在 2017 年的论文“从新闻中提取情绪:大数据中的机器学习用于对股票的新闻情绪进行分类”中,我们使用这些评级为每个术语分配了一个极性分数,正面表示超重提及,负面表示体重不足和中性。然而,正如 Loughran 和 McDonald 所报告的那样,这些方法是有缺陷的。在 1994 年至 2008 年的大量 10-K 样本中,被广泛使用的哈佛词典确定为否定词的几乎四分之三是在金融环境中通常不被视为否定词的词。值得庆幸的是,与过去的查字典相比,情绪有了很大的进步。这是我们在之前的报告中比较 17 个最先进的自然语言处理模型的性能的主要原因:“评估一系列 NLP Transformer 模型,例如 BERT、Electra、Funnel、GPT2、MPNet 和变体”这些基于“变形金刚”的 SotA NLP 模型在针对我们的金融情绪问题进行微调之前,通过阅读数十亿文本文档,嵌入了对语言的丰富而深刻的理解。基于那篇论文的结果,我们确定了 MPNet 模型,该模型使用 J.P. Morgan Headline Sentiment 数据集进行了“微调”,该数据集由 4,298 个新闻标题组成。手动分配一个情感标签,该标签来自:POS、NEG、NEUT 或混合. 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86023比较文本来源我们检查了两种不同的文本来源:抄本(3 年)和新闻文章(1 个月),以了解它们在最近的收益季节中的影响。公司成绩单通过评估我们从 S&P Global/Capital IQ 获得的收益电话会议公司成绩单,可以直接从公司寻求信息。也许是最简单的信息来源(但也是最有偏见的),及时直接从公司获取信息应该会提供优势。就其性质而言,公司成绩单仅考虑单个公司在单个日期的情况,通常相隔 3 或 6 个月,具体取决于财务报告规则。图 2:2021 年 8 月报告月份公司成绩单的每日计数资料来源:标普全球、摩根大通BD&AI消息一些最难处理的文本是从我们的新闻供应商处获得的(通过 LexisNexis)。新闻提要提供了一些独特的挑战,内容要大得多。我们在新闻文章中标记“焦点”公司,并过滤掉提及超过 4 家其他公司的新闻文章。对于新闻,我们在将文章截断为 500 字后计算单个情绪分数。平均而言,这涵盖了最相关的前 10 段左右。记者们很清楚读者人数会迅速下降,因此鼓励他们提前报道故事的重要方面。“一个好的路透社报道直截了当,并包含所有主要元素......从顶部编织,而不仅仅是作为事后的想法。久经考验的“倒金字塔”方法——按重要性递减的顺序排列故事元素——很难被击败......”Trust.org 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86024图 3:报告月份内公司相关新闻文章的每日计数资料来源:LexisNexis、摩根大通BD&AIASX 业绩季案例研究将基于 MPNet 的 SmartBuzz Sentiment Scores 和 SmartBuzz Thematics 应用于不同的文本来源,突出了一些有趣的差异。正如我们的自然语言处理报告中所述:“评估一系列 NLP 转换器模型,例如 BERT、Electra、Funnel、GPT2、MPNet 和变体”,我们用 4 个标签之一标记了每个句子或段落:POS、NEG、NEUT或者混合.然而,在一些研究中,我们注意到这些标签之间存在大量偏见,有些是故意的,有些是行为上的。为了为后续的定量分析创建一个更有用的信号,我们还建立了一个情绪分数。情绪得分对于某些情绪聚合,我们需要一个分数。为此,我们使用以下公式:情绪 = (POS – NEG ) / (1 NEUT MIXED)相关性得分(不是概率)尤其是成绩单,而且在新闻中,我们发现很多句子都是纯粹的行政。为了构建相关术语列表,我们使用了 Smart Buzz 框架来识别与各种金融流行语相关的关键术语。使用的 500 字列表请参见附录 2。对于每个句子或段落,我们使用了以下相关性度量:相关性 =(热门词总和)/(词总和)使用此相关性度量,我们为成绩单设置了低至 10% 的阈值,为新闻设置了 5% 的阈值。这有助于过滤掉诸如“我们现在打开问答电话”之类的句子。 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86025图 4:文字记录和新闻文章中每个句子的累积“相关性”。资料来源:摩根大通 BD&AI、标普全球、律商联讯SmartBuzz 情绪评分最后,我们将这两个与相关性过滤器结合在一起,如果相关性低于我们的阈值,则为情绪返回 NULL:SMARTBUZZ 情绪得分 = 如果相关性 >= 阈值:情绪别的:空值观察和实际问题在汇总情绪信号时,我们发现各种文本来源的分数分布存在很大差异。简单地选择所有股票销售点情怀是不够的。成绩单例如,我们注意到对销售点对于公司成绩单,尤其是在仅查看演示文稿部分时!此外,我们注意到大部分问答环节的结果更多中性或中性情绪。图 5:公司成绩单演示和问答环节中的原始情绪标签资料来源:摩根大通 BD&AI、标准普尔全球。注意:#SKIP 用于新闻文章的相关性 < 5% 和成绩单的 <10%在整个公司记录中使用相关性过滤的情绪分数会导致分数分布更加有用。 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86026图 6:成绩单演示文稿(“Senti_scor”)和问答(“SentiQ_scor”)的情绪得分资料来源:摩根大通 BD&AI、标准普尔全球 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86027图 7:用于选择公司成绩单句子的示例情感标签、分数、相关性和文本资料来源:摩根大通 BD&AI、标准普尔全球 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86028新闻报道正面偏见在新闻文章中也很普遍,尽管更易于管理。请注意 SmartBuzz Sentiment Scores 的直方图对于三个不同分组接近 -1、0、1 的新闻有很大不同。请注意,我们的新闻访问是相对较新的,在本研究中,我们仅使用了一个月的关于 S&P/ASX 200 的新闻上市股票。图 8:公司相关新闻文章的 SmartBuzz 情绪标签和分数资料来源:摩根大通BD&AI。注意:#SKIP 用于新闻文章的相关性 < 5% 和成绩单的 <10%图 9:新闻文章的 SmartBuzz 情绪标签、分数、相关性和文本示例资料来源:摩根大通 BD&AI、律商联讯 全球量化及衍生策略2021 年 10 月 22 日Berowne Hlavaty (61-2) 9003-86029事件研究观察围绕这些事件的股票表现非常重要,为此,我们使用事件研究框架来跟踪围绕新闻的成绩单和发布日期的结果的相对回报。活动研究设计对于我们的事件研究,我们在事件日期前 10 天将股票总回报指数重新设定为 1.00 美元,并对基准做同样的事情。然后我们从股票价格中减去指数水平,并在事件日期结束时将主动回报重新设定为 1.0。因此,表现优异的股票将始终具有正梯度。图 10:事件研究回报比较资料来源:摩根大通BD&AI然后对于事件研究,我们简单地取事件日期前后的平均超额(或总)回报。我们还衡量 POS 和 NEG 子投资组合的回报。 POS 投资组合(事前)预计将优于 NEG 投资组合,我们可以使用灵活的过滤器来构建这两个子投资组合