您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:通信行业点评报告:OpenAIo1模型来临,RL助力模型提升推理能力 - 发现报告

通信行业点评报告:OpenAIo1模型来临,RL助力模型提升推理能力

信息技术2024-09-13蒋颖开源证券Y***
AI智能总结
查看更多
通信行业点评报告:OpenAIo1模型来临,RL助力模型提升推理能力

OpenAI发布o1-preview和o1-mini模型,推理能力显著提升 北京时间2024年9月13日,OpenAI发布新一代o系列模型o1以及o1-mini,在模型训练时引入大规模reinforcement learning(RL),随着训练时计算(train-time compute)时间的增加以及推理(test-time compute)时间的延长,o1模型性能持续提升。通过RL训练,o1模型在推理时使用思维链(Chain of Thought)的方式解决问题,能够将复杂问题分解成多个简单步骤,并即时识别和纠正错误,显著提升了模型的推理能力。在最大化推理时间的前提下,o1在绝大多数推理密集型任务中性能显著优于GPT-4o,模型测试结果显示,57个MMLU子类别中,o1在54个子类别中的表现优于GPT-4o,性能可与人类专家媲美。 o1模型尚未单独定价,计划为chatgpt免费用户提供o1-mini使用权限 从推理成本上看,o1模型主要在大型文本数据集上预训练,推理成本较高且速度较慢,o1-mini模型在预训练阶段争对STEM推理进行优化,尤其擅长数学及代码领域,模型参数较小且延时推理较低,推理成本比OpenAI o1-preview低80%。目前,ChatGPT Plus和Team用户将能够访问ChatGPT中的o1系列模型,Enterprise和Edu用户将在下周开启访问,OpenAI当前仅在ChatGPT和API中提供模型预览版本,未来将上线浏览、文件和图像上传以及其他功能,未来将为ChatGPTFree用户提供o1-mini使用权限。o1模型并未额外定价,但使用存在限制,o1-preview模型的每周使用限制为30条消息,o1-mini的每周使用限制为50条消息。 推理技术迎来革新,或将是AI大语言模型发展重要拐点 OpenAI表示除了新的OpenAI o1系列之外,仍在继续开发GPT系列模型。我们认为早期AI大语言模型性能提升主要凭借Scaling law,在语料数据集以及模型参数持续提升的情况下,模型的性能持续突破,而本次o1系列模型问世,代表着模型能通过RL在除开训练侧之外的推理侧,引入思维链等新技术的方式提升模型的性能,为科学、数学、编码等专业领域提供更准确的答案,或是生成式AI发展的重要拐点。 AI大模型持续迭代,国内外云巨头持续增加对AI基础设施的资本开支,我们持续看好算力产业链。推荐标的:宝信软件、中际旭创、英维克、新易盛、天孚通信、中兴通讯、盛科通信;受益标的:润泽科技、源杰科技、华工科技、紫光股份、光迅科技、华丰科技、网宿科技、烽火通信、云赛智联等。 风险提示:AI发展不及预期、智算中心建设不及预期、行业竞争加剧。