08February2025GlobalQuantitative&Derivatives策略 可供投资的AI一般产业发展概况2H24 全球量化和衍生品战略 BerowneHlavatyAc(61-2)9003-8602berowne.d.hlavaty@jpmorgan.com摩根大通证券澳洲有限公司 RobertSmith,PhD(61-29003-8808robert.2.smith@jpmorgan.com摩根大通证券澳洲有限公司 埃文·胡(852)2800-8508evan.hu@jpmorgan.com摩根大通经纪(香港)有限公司 来源:摩根大通,库存图片。 Arpan辛格22(91-)6157-3301arpan.singh@jpmchase.com摩根大通印度私人有限公司 分析师认证及重要披露见第34页。 摩根大通确实在与它的研究报告所涵盖的公司做生意,也在寻求与这些公司做生意。因此,投资者应该意识到该公司可能存在利益冲突,这可能会影响本报告的客观性。投资者在作出投资决定时,应将本报告视为唯一因素。 www.jpmorganmarkets.com 执行概要 本GenAI研究与发展回顾过去6个月,由于最近的一系列公告,延长至2025年1月31日。 J.P。摩根研究亮点 随着我们穿越2024年,有一件事变得非常清楚,基于任务的AI代理和物理类人机器人即将到来。2024年12月,基础模型领域的竞争加速,OpenAI、Meta和谷歌等主要参与者发布了一系列产品,一展拳路,而nVidia继续在其芯片和技术上取得进展(主要是在2025年1月的CES上宣布的)。然后在1月份DeepSeek-R1下跌,由于其完全开放的性质和高效的模型训练,以及较小的尺寸,使得它在推理中运行的成本显着降低,引发了封闭源领导者的一轮反应。不过,不要担心你的计算工厂的资本支出;这种低价格的每个推理令牌成本很可能被代理消耗(可以消耗100倍到1000倍的令牌,c.f.人类直接使用聊天)。随着我们发现越来越多的理由去消费越来越便宜的代币,Jevons悖论很可能会盛行。 如果我们要按日历年对最近的事件进行分类,并扩展: •2023年是“人工智能年”(又名人工智能炒作年)。•2024年是“生成人工智能”之年——Hinton和Hopfield获得诺贝尔奖•2025年是“人工智能”的一年——以及GPT-o3(深度研究)、DeepSeek-R1和下一个迭代的潜在AGI……•2026+“物理人工智能”年——机器人将从2025年底开始普及•2027+ ASI“人工超级智能”年(自我改进的人工智能…又名奇点?) 2025年预测 人工智能对人类的影响可能堪比印刷机、电力和计算机。在我们最近的年度信中,我们强调,人工智能对社会的变革潜力可能与印刷机和电力等历史上的技术进步相媲美,它有可能重塑劳动力。 我们对2025年的十大预测包括: 1.免费的人工智能:人工智能的价格和供应商的选择将基于哪个模型是“足够聪明”和合理的价格,而不是“最好的”模型。你不需要博士学位才能在工厂车间工作。接近零成本的人类智能即将到来,而且可能比许多人预期的要快。杰文斯悖论意味着单位价格的下降实际上会增加需求。 2.人工智能代理:预计将看到企业使用代理,而最初有限的消费者使用代理“在野外”,因为他们需要信任使用你的信用卡详细信息,登录名,密码等,才能真正有用。 3.机器人热潮:预计今年将有更多的早期采用者使用更多的人形机器人,至少有34种人形机器人已经接近或投入生产。2026年可能是 物理人工智能年。 4.电影和DeepFake Boon:像素完美的电影将允许工作室今年(以及不久的将来)创建自定义电影,以及逼真的Deep Fakes(标志着视频证据的终结?),扩展社交媒体上使用最新人工智能创建的令人惊叹的短视频,看起来像电影。5.开放源码:开放源码的复兴,部分归功于Llama、Graphite、Nemo、Mixtral、Phi,以及现在的DeepSeek-R1和Qwen 2.5。领先的人工智能和开源软件之间12个月的差距正在缩小(缩短到12周?)6.闭源:AGI/ASI将由闭源主导。我们已经有了能够“推理”的法学硕士,比如GPT-o3(alpha)和Gemini 2.0,它们可以将复杂的问题分解成更简单的步骤,使它们更准确,特别是对于数学、物理和逻辑等任务。预计封闭模型将更快地提高AGI得分。7.科学中的AI:AI将继续加速自然科学的发现,重点是材料科学和生物学,这是黄简森一直直言不讳的。期待今年能听到更多关于Longevity和定制癌症疫苗的消息。8.AI和国家安全:预计AI公司将在边境监视和情报收集等任务上与国家安全机构进行更多合作,同时还要遵守更严格的关税和出口限制。9.英伟达的竞争:IBM、亚马逊和AMD等现有芯片公司正在大力投资新芯片,而其他初创公司也在继续开发替代硬件(Cerebus),这可能会挑战英伟达的主导地位,尤其是在推理领域。10.量子优势:来自谷歌的柳树增强了量子电路的误差预测和校正,允许构建更大的电路和计算算法。2025年是国际量子科学与技术年。 人类对人工超级智能的启示 2024年9月,山姆·奥特曼(Sam Altman)发表了《智能时代》(The IntelligenceAge),这是他和OpenAI计划如何在几千天内实现人工超级智能的宣言。随后,GPT-o3模型在ARC-AGI基准测试中取得了87.5%的突破性成绩,该基准测试评估AI在不依赖预训练知识的情况下解决全新问题的能力。ARC-AGI被认为是最难的AI基准之一,因为它测试的是概念推理和自适应智能,这两个领域传统上由人类主导。ARC-AGI-2的挑战预计将使目前的模型恢复到30%以下(智能人类达到95%)。 我们是怎么走到这一步的?简而言之,许多AI的进步归结为复制人类的生物学和行为。 AI领域是在霍奇金和赫胥黎创建神经元动作电位的电模型之后开始的,这是人工神经网络发展的基础。大卫·鲁梅尔哈特(David Rumelhart)和约翰·霍普菲尔德(John Hopfield)等研究人员进一步模拟了这项工作,他们为人工神经网络和rnn铺平了道路。Hubel & Wiesel对视觉皮层的理解为AlexNet等cnn的发展做出了贡献。在Devlin和团队的帮助下,从BERT到GPT-4的模型中可以看到变形金刚的自我注意机制,可以粗略地与人类在处理语言时专注于信息的特定部分而忽略其他部分的认知能力进行比较。 然而,当前模型中缺失的人类特征之一,同样受到我们认知能力的启发,是系统1和系统2思维的区别。系统1涉及自动的、直觉的回忆,比如开车回家时没有有意识的思考,而系统2涉及深思熟虑的、分析性的推理,这对于学习、创造和解决问题至关重要。这个系统2推理驱动测试时间计算,用于推理模型,如gpt - 01、GPT-o3和DeepSeek-R1。请注意,推理(TTC)模型在生产中需要更多的gpu进行推理,因此全球对gpu的需求没有风险,特别是如果更多的企业/团队运行专用的AI模型,而不是通过令牌api共享llm! b谷歌的新泰坦模型引入了一种新颖的方法,它结合了三种不同类型的记忆,类似于人类的记忆系统。泰坦利用短期、长期和持久记忆模块的组合,每个模块都有不同的功能,类似于人类的认知过程。短期记忆, 类似于工作记忆,处理即时数据处理,而长期记忆存储和回忆历史背景,持久记忆编码特定任务的知识。这种架构允许泰坦有效地管理和利用大量信息,扩展到更大的上下文窗口,并在各种任务中超越传统的变压器。 Open-AI vs OpenAI 很多人都在谈论一月份推出的DeepSeek-R1和Qwen模型。通过在过去几年中整合许多不同的先进技术来构建AI技术,开发一些自己的训练数据和建模技术来提高推理性能,并利用免费和开源的基础模型,如QWEN和LLAMA,DeepSeek-R1AI模型可以实现OpenAI的gpt - 01级别的性能,同时运行在便宜得多的硬件上。他们还提供各种大小的完全开放的可下载模型,有些需要小型gpu集群,有些可以在台式机,笔记本电脑甚至iphone上运行,即真正的“开放”AI模型。该研究出版物于上周发布,明确详细说明了所采取的方法,使AI社区的其他人能够验证和增强这些模型。 Huggingface的一个团队接受了一个挑战,“Open-R1”项目和TinyZero也在应对这个挑战。TinyZero刚刚克隆了DeepSeek中使用的一些推理训练,这表明,在有限的训练数据下,团队将能够对模型进行微调,以对任何领域或业务问题进行推理,这对渴望微调自己专有业务特定模型的企业具有积极意义。 DeepSeek已经吸引了市场的注意力,但还有很多其他模型,如微软的Phi-4,Meta的Llama v3.3,以及其他正在推动“边缘计算”或AI的模型,这些模型缺乏当前索塔模型所使用的一些额外的推理训练。但有些说法令人担忧,包括实际使用的gpu,模型的实际成本,以及他们从哪里获得训练数据(微软报告可疑的API使用情况)。 人工AI将消耗任何多余的推理,正如杰文斯悖论(Jevons Paradox)所假设的那样,随着技术的进步提高了资源的使用效率,该资源的总体消耗可能会增加而不是减少。这是因为使用资源的成本降低使其对越来越多的边缘情况和其他以前过于昂贵的情况更具吸引力,从而导致整体需求增加。更多内容见下文。 AI是指数型的 AI的发展速度正在以指数级加快,而成本也在以指数级下降。竞争优势是用几个月而不是几年来衡量的。接近零成本的人类智能即将到来,而且可能比许多人预期的要快。我们在OpenAI为现有用户发布GPT-o3-mini(包括有限的免费使用)之前绘制了这张图表,并注意到GPT-o1的定价是一个异常值。如果没有Deep Research模式(基于GPT-o3 Large)等额外的服务层,这个价格点已经不可行了。 索塔模型 我们不断监测GenAI模型空间的新公告,并在网络上搜索未披露的模型参数大小的提示(例如,很难找到GPT-o1的估计范围从~ 6000亿到4万亿)。最大AGI能力模型的竞争正在与更实用的模型开发相匹配,这些模型设计用于在边缘,单GPU和迷你集群(8GPU DGX-1)上运行,而不是完整的DGOX POD机架或更多。 单靠参数计数是不足以衡量模型中嵌入的智能的方法。下面的图表扩展了人工分析公司的数据。AI显示了各种模型的标准化基准分数(y轴)是如何随着时间(x轴)和模型迭代而演变的,增加了DeepSeek-R1和GPT-o3-mini。 杰文斯悖论 杰文斯悖论在DeepSeek-R1发布后被提及了很多次。这意味着单价的下降会增加需求。因此,虽然OpenAI、Anthropic、谷歌和Meta有了新的竞争对手,但像英伟达、AMD、英特尔、IBM这样的公司,甚至像微软这样的云供应商,都可能受益,因为AI的更多以前不经济的应用变得可行。 收盘思路:CPU和GPU计算的主要限制之一是产生的废热。事实证明,目前的2nm处理器在规模方面接近理论极限,但基本计算(位翻转)消耗热力学能量。但是,事实证明,反转计算(在缓存答案之后)可以回收能量(因此可以回收热量),这可以大大减少热量的产生,从而实现更高效的计算,例如更好的3D计算组件堆叠,或者更稳定的量子计算机。 行业发展及新闻 来源:iStockPhoto 除了摩根大通全球研究,我们还策划了学术和行业研究的关键发展,重点介绍了已经引入的进展和重大发现,特别是在生成式人工智能、自然语言处理、软件、湿软件和硬件系统以及量子力学和时间序列模型方面。 在我们深入研究具体公告之前,我们首先使用SmartBuzz根据2024年1月1日以来的新闻报道,检查哪些公司与“人工智能主题”最相关。人工智能主题包含以下术语:人工智能,ChatGPT,生成式人工智能,扩散模型,自然语言处理,神经网络,神经网络,大型语言模