行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

通信行业点评报告：OpenAIo1模型来临，RL助力模型提升推理能力

信息技术 2024-09-13 蒋颖开源证券 Yàng

OpenAI于2024年9月13日发布新一代o系列模型o1及o1-mini，通过引入大规模reinforcement learning（RL）训练，显著提升模型推理能力。o1模型在推理时采用思维链（Chain of Thought）技术，将复杂问题分解为多个步骤并即时纠错，性能优于GPT-4o，在57个MMLU子类别中54个子类别表现更佳，部分领域性能媲美人类专家。

o1模型尚未单独定价，计划为ChatGPT免费用户提供o1-mini。o1-preview推理成本较高、速度较慢，而o1-mini针对STEM领域优化，参数较小、延时更低，推理成本降低80%。目前ChatGPT Plus和Team用户可访问o1系列模型，Enterprise和Edu用户下周开通，未来将上线更多功能并免费提供给ChatGPT Free用户。模型使用存在限制：o1-preview每周30条消息，o1-mini每周50条消息。

本次o1系列发布标志着AI大语言模型发展迎来重要拐点，从单纯依赖Scaling law提升转向推理侧技术革新。OpenAI仍继续开发GPT系列模型，算力产业链持续受益，推荐宝信软件、中际旭创等标的，受益标的包括润泽科技、源杰科技等。

风险提示：AI发展不及预期、智算中心建设不及预期、行业竞争加剧。

OpenAI发布o1-preview和o1-mini模型，推理能力显著提升北京时间2024年9月13日，OpenAI发布新一代o系列模型o1以及o1-mini，在模型训练时引入大规模reinforcement learning（RL），随着训练时计算(train-time compute)时间的增加以及推理(test-time compute)时间的延长，o1模型性能持续提升。通过RL训练，o1模型在推理时使用思维链（Chain of Thought）的方式解决问题，能够将复杂问题分解成多个简单步骤，并即时识别和纠正错误，显著提升了模型的推理能力。在最大化推理时间的前提下，o1在绝大多数推理密集型任务中性能显著优于GPT-4o，模型测试结果显示，57个MMLU子类别中，o1在54个子类别中的表现优于GPT-4o，性能可与人类专家媲美。 o1模型尚未单独定价，计划为chatgpt免费用户提供o1-mini使用权限从推理成本上看，o1模型主要在大型文本数据集上预训练，推理成本较高且速度较慢，o1-mini模型在预训练阶段争对STEM推理进行优化，尤其擅长数学及代码领域，模型参数较小且延时推理较低，推理成本比OpenAI o1-preview低80%。目前，ChatGPT Plus和Team用户将能够访问ChatGPT中的o1系列模型，Enterprise和Edu用户将在下周开启访问，OpenAI当前仅在ChatGPT和API中提供模型预览版本，未来将上线浏览、文件和图像上传以及其他功能，未来将为ChatGPTFree用户提供o1-mini使用权限。o1模型并未额外定价，但使用存在限制，o1-preview模型的每周使用限制为30条消息，o1-mini的每周使用限制为50条消息。推理技术迎来革新，或将是AI大语言模型发展重要拐点 OpenAI表示除了新的OpenAI o1系列之外，仍在继续开发GPT系列模型。我们认为早期AI大语言模型性能提升主要凭借Scaling law，在语料数据集以及模型参数持续提升的情况下，模型的性能持续突破，而本次o1系列模型问世，代表着模型能通过RL在除开训练侧之外的推理侧，引入思维链等新技术的方式提升模型的性能，为科学、数学、编码等专业领域提供更准确的答案，或是生成式AI发展的重要拐点。 AI大模型持续迭代，国内外云巨头持续增加对AI基础设施的资本开支，我们持续看好算力产业链。推荐标的：宝信软件、中际旭创、英维克、新易盛、天孚通信、中兴通讯、盛科通信；受益标的：润泽科技、源杰科技、华工科技、紫光股份、光迅科技、华丰科技、网宿科技、烽火通信、云赛智联等。风险提示：AI发展不及预期、智算中心建设不及预期、行业竞争加剧。

点击免费查看完整报告

通信行业点评报告：OpenAIo1模型来临，RL助力模型提升推理能力

你可能感兴趣

传媒行业点评报告：OpenAI o1大幅提升模型推理能力，继续布局AI

通信周跟踪：OpenAI新模型或大幅提升推理能力，萝卜快报带来对智驾能力的新关注

计算机行业周报：OpenAI推出重磅模型O1提升推理能力，算力行业景气度持续得到验证

OpenAI发布o1模型，推理能力提升或改变行业生态

通信行业点评：草莓模型公布，训练与推理共振光模块机会

电子行业周度点评报告：DeepSeekV3.2提升推理及Agent潜在能力

机器人行业2025美国CES展点评：英伟达推出世界基础模型，助力人形机器人场景泛化能力提升

电子行业周度点评报告：谷歌推出Gemini 3 Pro，推理、多模态、长上下文能力提升

高频因子跟踪：ChatGPTo3模型最新发布，推理与编程能力大幅提升

市场资讯晨报：OpenAI发布新AI模型o1，推理能力大幅提升