AI智能总结
2024年09月18日计算机 证券研究报告 OpenAI o1模型发布,Scaling Law有望延续 投资评级领先大市-A维持评级 OpenAI发布o1系列模型,推理能力显著提升 9月13日,OpenAI正式公开o1系列大模型,新模型可以实现复杂推理,解决科学、代码和数学方面的难题。从命名来看,o1系列模型即是之前OpenAI宣称即将发布的草莓(Strawberry)模型,新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1,将模型命名为o1。此次发o1模型更注重于推理能力的提升。在一系列高难基准测试中相比GPT-4o有巨大提升。 首选股票目标价(元)评级 Scaling Law有望从Pre-training向Post-training延伸 从技术上来看,o1在回答之前会自动生成一个隐藏的COT(Chain ofThought,思维链),从而将问题分解成更多步骤进行思考和分析,实现推理能力的提升。 OpenAI o1创造了LLM训练和推理的新范式,将Scaling Law从Pre-training向Post-training环节拓展。ChatGPT 4系列主要是在Pre-training(预训练)环节进行技术的创新,通过多模态的形式,增大预训练的数据集,从而达到模型的通用性和泛化能力的提升。我们认为预训练环节的Scaling Law伴随数据量的持续提升或将放缓,这或成为GPT5始终难产的原因之一。而此次o1模型的发布,我们认为可能在Post-training(后训练)的RL(强化学习)环节进行了创新,同时在Inference(推理)阶段增加了COT,从而实现模型能力的提升。而在OpenAI的技术文档中,也阐述了这种范式带来的Scaling Law,即随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1的性能持续提高。我们认为这是在LLM训练范式上的一种创新,将Scaling Law拓展到后训练环节,从而促使大模型的通用性有望进一步提升。 赵阳分析师SAC执业证书编号:S1450522040001zhaoyang1@essence.com.cn 夏瀛韬分析师SAC执业证书编号:S1450521120006xiayt@essence.com.cn 相关报告 算力需求将进一步提升,应用创新仍有待突破 计算机行业2024年中报总结2024-09-09华为产业链催化密集,与自主可控互为表里2024-09-02数字化绿色化政策发布,数据中心液冷是未来趋势2024-08-26NIST发布全球首个抗量子密码算法标准2024-08-19把握产业发展趋势,关注自主可控三大方向2024-08-12 通过对o1模型性能和原理的简单分析,我们认为o1模型有望进一步增加对算力的消耗。一方面,在Post-traning阶段,由于存在一定程度的Scaling Law,未来必然会伴随RL(强化学习)的数据量和参数量增长。另一方面,在Inference(推理)阶段,由于COT的存在,必然提升推理侧的数据产生量,一定程度也降低了模型的响应速度,延长了响应时间,但也会带来算力方面的提升。因此,o1模型打开了Scaling Law的上限,算力产业链将会持续受益。998345856 应用方面,由于o1模型侧重在STEM(科学、技术、工程、数学)方面的能力提升,因此在偏数学、自然科学和代码编程方面的应用将会受益。然后这些能力的提升并没有带来应用领域的拓展,因此应用侧的产品创新仍需要等待。 风险提示:1)技术创新不及预期;2)政策支持力度不及预期。 内容目录 1.本周行业观点...............................................................32.市场行情回顾...............................................................52.1.本周板块指数涨跌幅...................................................52.2.本周计算机个股表现...................................................63.行业新闻梳理...............................................................73.1. AI大数据应用.........................................................73.2.智能网联汽车.........................................................73.3.低空经济.............................................................73.4.卫星互联网...........................................................73.5.网络安全.............................................................8 图表目录 图1.在数学竞赛、编码竞赛和科学问答中,o1比gpt4o表现更好....................3图2.本周各行业涨跌幅统计....................................................5 表1:本周板块指数涨跌幅统计.................................................5表2:本周计算机个股涨跌幅统计...............................................6 1.本周行业观点 OpenAI发布o1系列模型,推理能力显著提升 9月13日,OpenAI正式公开o1系列大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。从命名来看,o1系列模型即是之前OpenAI宣称即将发布的草莓(Strawberry)模型。此外,OpenAI在发布文档中写道,新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1,将模型命名为o1。 此次发布的o1-preview版本为o1模型的预览版,与之前ChatGPT 4o不同,o1更注重于推理能力的提升。根据OpenAI发布的官方技术文档,o1在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升。在国际数学奥林匹克(IMO)资格考试中,GPT-4o仅正确解答了13%的问题,而o1模型正确解答了83%的问题。模型的编码能力上,在Codeforces比赛中排名89%。OpenAI还在GPQA Diamond基准上评估了o1,这是一个困难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI聘请了拥有博士学位的专家来回答GPQA Diamond基准问题。实验结果表明,o1超越了人类专家的表现。视觉能力上,o1在MMMU基准上得分为78.2%,成为第一个与人类专家相当的模型,还在57个MMLU子类别中的54个上优于GPT-4o。 资料来源:OpenAI,国投证券研究中心 o1是一个系列模型。这次OpenAI还一并发布了一个mini版OpenAI o1-mini。整体来看,o1-mini的成本比o1-preview低,在预训练期间针对STEM推理进行了优化,因此在数学和编码等领域性能显著。 Scaling Law有望从Pre-training向Post-training延伸 从技术上来看,o1在回答之前会自动生成一个隐藏的COT(Chain of Thought,思维链),从而将问题分解成更多步骤进行思考和分析,实现推理能力的提升。COT推理为安全和对齐提供了新的思路。OpenAI发现,将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观和原则。 OpenAIo1创 造 了LLM训 练 和 推 理 的 新 范 式 , 将Scaling Law从Pre-training向Post-training环节拓展。ChatGPT 4主要是在Pre-training(预训练)环节进行技术的创新,通过多模态的形式,增大预训练的数据集,从而达到模型的通用性和泛化能力的提升。我们认为预训练环节的Scaling Law伴随数据量的持续提升或将放缓,这或成为GPT5始终难产的原因之一。而此次o1模型的发布,我们认为可能在Post-training(后训练)的RL (强化学习)环节进行了创新,同时在Inference(推理)阶段增加了COT,从而实现模型能力的提升。而在OpenAI的技术文档中,也阐述了这种范式带来的Scaling Law,即随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1的性能持续提高。我们认为这是来LLM训练范式上的一种创新,将Scaling Law拓展到后训练环节,从而促使大模型的通用性有望进一步提升。 算力需求将进一步提升,应用创新仍有待突破 通过对o1模型性能和原理的简单分析,我们认为o1模型有望进一步增加对算力的消耗。一方面,在Post-traning阶段,由于存在一定程度的Scaling Law,未来必然会伴随RL(强化学习)的数据量和参数量增长。另一方面,在Inference(推理)阶段,由于COT的存在,必然提升推理侧的数据产生量,一定程度也降低了模型的响应速度,延长了响应时间,但也会带来算力方面的提升。因此,o1模型打开了Scaling Law的上限,算力产业链将会持续受益。 应用方面,由于o1模型侧重在STEM(科学、技术、工程、数学)方面的能力提升,因此在偏数学、自然科学和代码编程方面的应用将会受益。然后这些能力的提升并没有带来应用领域的拓展,因此应用侧的产品创新仍需要等待。 2.市场行情回顾 2.1.本周板块指数涨跌幅 本周(2024-09-09至2024-09-13)深证成指下降1.81%,创业板指下降0.19%,计算机行业指数上升0.30%,跑赢深证成指2.11%,跑赢创业板指0.49%。横向来看,本周计算机行业指数在中信30个行业指数中排名第2,在TMT四大行业(电子、通信、计算机、传媒)中排名第2。 资料来源:Wind,国投证券研究中心 2.2.本周计算机个股表现 从涨跌幅情况来看,本周计算机板块整体表现一般。展望2024年,我们仍建议关注景气度向上的人工智能、自主可控、华为产业链等投资机会。 3.行业新闻梳理 3.1.AI大数据应用 北京时间9月13日,OpenAI发布了新一代o1系列模型。其首席执行官山姆奥特曼表示,o1是“迄今为止功能最强大,最具有一致性的模型。”“这是一个新范式的开始,人工智能可以进行复杂推理了。”本次OpenAI更新的方向旨在加固此前大模型的“短板”:数学推理。这种具备更强推理能力的o1系列模型共有三种:o1、o1-mini以及抢先版o1-preview。从今天开始,o1-preview已在ChatGPT中向所有Plus和Team用户推出。(来源:新京报) 9月12日消息,美国AI大模型独角兽OpenAI正在与投资者洽谈65亿美元的股权融资,并且向银行寻求50亿美元的债务资金。OpenAI的投前估值高达1500亿美元,较今年年初的860亿美元翻番。如果这笔交易顺利完成,其市值将反超马斯克创办的私人火箭公司SpaceX,成为全球第二大独角兽企业。(来源:彭博社) 大模型创企元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B,其总参数2550亿,激活参数360亿,实现了达到千亿级别模型的性能“跨级”跃升。同时,这款