您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国信证券]:人工智能专题:Openai发布会梳理 - 发现报告

人工智能专题:Openai发布会梳理

信息技术 2024-12-23 熊莉 国信证券 话唠
报告封面

行业研究·行业专题 投资评级:优于大市(维持) 证券分析师:熊莉021-61761067xiongli1@guosen.com.cnS0980519030002 联系人:云梦泽021-60933155yunmengze@guosen.com.cn 摘要 OpenAI从12月5日连续12个工作日每天公布一个新应用或功能。 1)DAY1:发布完整版o1;2)DAY2:发布强化微调技术;3)DAY3:发布视频大模型Sora;4)DAY4:发布协作平台Canvas;5)DAY5:发布ChatGPT×Apple Intelligence;6)DAY6:发布高级语音模式;7)DAY7:发布Projects in ChatGPT;8)DAY8:发布ChatGPT搜索;9)DAY9:发布o1 API;10)DAY10:发布通话访问模式;11)DAY11:发布全新桌面应用;12)DAY12:发布新一代推理模型o3 & o3 mini。 •风险提示:AI应用落地不及预期、行业竞争加剧、大模型研发不及预期。 目录 Openai发布会——基础模型 Ø发布三大基础模型,模型性能跨越式提升 •12天的发布会中,OpenAI推出了三款基础模型,分别是增强的ChatGPT o1模型、Sora视频生成模型、o3模型,新的模型在数学和科学领域均有着卓越表现,同时也意味着openai在推理能力方面迈出了重要一步。 •o3模型的发布,更是标志着AI在编程、科学推理等领域的巨大进步。o3模型接近通用人工智能(AGI)的标准,为复杂决策和高端问题解决提供了新的技术基础。 •Sora的发布将极大降低内容创作的成本和时间。为营销、培训、市场等各领域提供AI生成的高质量视频,有望成为企业未来内容创作的新标准。 Openai发布会——微调 Ø强化微调技术,提升垂直行业模型能力 •用户可以根据极少量的数据,训练特定领域的专家模型。这意味着企业构建定制化的AI模型,不再需要大量的特定数据集标注。 •定制化能力:相较于通用AI,强化微调技术为企业提供了更灵活的定制化路径。企业可以通过这一技术打造专属的AI助手,在提高生产效率的同时,提供更具个性化的服务,从而有效地提升用户体验。•例如,个性化推荐、AI诊疗系统、AI审查工具等特定场景均都可以通过这一技术快速部署。 Openai发布会—— ai agent Ø多款ai智能体升级,大幅提升用户体验 •发布会发布了集智能写作&代码协作于一身的ai工作台、新的桌面应用、高级语音模式、通话访问模式等多款ai agent产品,标志着ChatGPT从简单的会话助手向更强大的代理工具的转变,从而可以代表客户执行更多任务,为用户带来全新的便捷体验。 DAY1:完整版o1发布 Ø正式发布完整版o1,性能大幅提升 •在今年9月份,OpenAI发布o1-preview,对模型的技术思路进行了改进:将更多算力运用于推理侧,o1是使用大规模强化学习训练并使用思维链进行推理的系列模型。•今年12月,OpenAI正式发布了o1完整版,o1完整版在数学、编程、博士阶段科学问题(困难问题)领域的性能远超GPT4o,在科学问题领域超越人类专家,并在数学、编程领域的性能较o1-preview有了大幅提升。•相较于o1-preview,OpenAI对o1进行了使用体验方面的改进:o1目前对于简单问题能够回答更加迅速,OpenAI测试目前o1较o1-preview重大错误率降低了34%,速度提升50%。•目前o1已面向所有Plus订阅用户推出,用于替代o1-preview,并将上线后续推出的Pro订阅。 DAY1:完整版o1发布 Ø支持多模态,可处理模糊问题 •OpenAI对o1进行了改进,目前支持图像、文本两种输入方式。在演示中,对于一张手绘的太空太阳能驱动的数据中心示意图,o1估计出了其散热器表面积并解答了两个问题:如何处理太阳和深空环境,以及这里如何体现了热力学第一定律,整个推理过程仅需10秒钟。 •在示例中,OpenAI故意省略了冷却面板的温度等关键数据,用以测试o1在处理模糊问题时的能力。示例中o1自行识别了关键参数缺失,并选择了合理的温度范围进行后续的推理,输出了合理结果。•OpenAI表示,o1未来还会添加网页浏览、文件上传等功能,以及引入API,具体上线时间未知。 资料来源:OpenAI,国信证券经济研究所整理 资料来源:OpenAI,国信证券经济研究所整理 DAY1:完整版o1发布 Ø推出PRO订阅 •OpenAI发布最新订阅选项ChatGPT Pro,定价200美金/月,在这个套餐里,OpenAI提供了o1 pro mode,这个模式中o1处理非常难的题目时,用户可要求o1 pro获得更多算力,并强化思考。o1 pro mode在数学、编程、科学问题领域性能较o1均有提升,但重点在于o1 pro mode的连续性。 •OpenAI设计了“四次测试”评估:模型需要连续四次都答对同一个问题才算通过。在这种条件下,o1 pro模式保持了相当高的可靠性:在竞赛数学中达到80%,编程测试中达到74.9%,科学问题中达到74.2%。远超普通版o1。这说明o1 pro能提供更佳的稳定性和一致性,对于需要AI协助完成重要工作的专业人士来说能够有更好的保障。 资料来源:OpenAI,国信证券经济研究所整理 •同时,ChatGPT Pro订阅计划能无限制访问OpenAI o1,以及o1-mini、GPT-4o和Advanced Voice。 资料来源:OpenAI,国信证券经济研究所整理 资料来源:OpenAI,国信证券经济研究所整理 DAY1:完整版o1发布 Øo1 pro拥有更强的推理能力 •在示例中,OpenAI的研究员要求o1找到一种符合六个标准的特定蛋白质。这个问题的挑战在于,需要模型回忆起相当专业的化学领域知识,而对于任何给定的标准,可能会有数十种蛋白质符合该标准。所以模型必须全面考虑所有候选者,然后检查它们是否符合所有标准。 •o1-preview在此问题经常出错,而示例中o1 pro仅使用53秒便准确回答了相关问题,并可查看详细的思考过程。•在思考困难问题时,目前o1模型的思考时间可达几分钟,因此OpenAI为模型添加了思考进度条,以直观展示目前模型的进程。 DAY2:强化微调技术 Ø什么是强化微调? •强化微调可让开发者使用强化学习针对具体任务对模型进行进一步微调,并根据提供的参考答案对模型的响应进行评分具体来说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。当模型发现问题时,要为它提供思考问题的空间,然后再对模型给出的响应进行打分。之后,利用强化学习的力量,可以强化模型得到正确答案的思维方式并抑制导向错误答案的思维方式。 Ø强化微调的优势? •快速高效:相比于传统技术,强化微调技术更高效,不需要大规模的数据集支持。•使用灵活:用户可根据需求即时调整模型,使模型更加符合特定场景需求。•应用广泛:强化微调技术可以推动客服、教育、创意、研究等各个领域的应用。 DAY2:强化微调技术 Ø强化微调后在特定领域性能明显提升 •在官方演示里,OpenAI设置了一个实验:在给定症状列表的情况下,用模型预测可能导致罕见遗传疾病的基因,并让模型解释为什么选这些基因。实验人员使用三种模型进行对比:o1 mini、o1完整版、o1 mini强化微调版。 •对于o1 mini强化微调版,实验人员汇集了大约1100个病例报告作为训练和验证的数据集,在使用训练数据集对模型进行训练后,上传验证数据集对模型推理能力进行反复测试和调整,同时保证验证数据集和训练数据集之间的正确基因没有重叠,以防模型作弊。评估结果时,实验人员设置了三项指标:1)模型一次答对的概率;2)模型前五次预测中有正确答案的概率;3)模型预测中有正确答案的概率。 •结果显示,经过强化微调的o1 mini在一次答对的准确率上跃升180%达到了31%,各方面全面超越了o1。强化微调技术将使开发者能够通过更快、成本更低的o1 mini模型获得超越o1的专业性能,将极大促进AI在各领域的应用。 资料来源:OpenAI,国信证券经济研究所整理 资料来源:OpenAI,国信证券经济研究所整理 DAY3:视频大模型Sora发布 Ø正式发布视频大模型Sora •时间线编辑:全新推出的故事板工具让用户可以精准地指定每个帧的输入和生成视频的内容,并轻松进行视频剪辑,用户指令越少,Sora会尝试填充更多细节,用户指令越详细,Sora会尝试遵循要求方向生成视频。用户可在Sora中保存自己喜欢的风格,并在后续视频生成任务中重复调用。 •高分辨率、多种格式支持:Sora可以生成480p-1080p分辨率、5-20秒、宽屏、竖屏或方形的视频。并且用户可以利用资源进行扩展、remix(用户只需描述对视频的更改,Sora将自行完成)和融合。对于同一指示,Sora可生成多个不同视频方向的变体,供用户选择。 DAY3:视频大模型Sora发布 Ø多种工具支持Sora •2)Re-cut:找到并提取最佳帧或视频段落,然后向任一方向延伸它们以完成特定场景,例如可对之前生成的视频进行裁剪,要求Sora生成全新开头或结尾;•3)Loop:使用Loop剪辑并创建无限重复的视频,例如:用户喜欢灯塔视频,可使用Loop工具,Sora将自动生成内容将重复视频的开头和结尾连接,生成可重复视频;•4)Blend:将两个视频合并为一个视频,给Sora两个视频场景,Sora会将其中元素合并生成全新视频,用户可用指令提示Sora两个视频的合并方向;•5)Style presets:使用Presets创建和分享自己的视频风格。 ØSora定价 •Sora目前已在欧洲和英国以外的其他地区上线,Plus用户可获得一个月生成50个优先视频的权限,Pro用户可获得无限生成权限,以及500次优先生成权限。 DAY4:Canvas协作平台发布 Ø正式发布Canvas协作平台 •Canvas全面开放,已被整合进ChatGPT中;•提升了代码功能,用户可以直接在Canvas上运行Python代码,并可直观看到代码结果输出;•Canvas目前可被CustomGPT调用 DAY4:Canvas协作平台发布 ØCanvas主要功能 •用户编辑文字:在使用Canvas工具后,交互页面将被分为两部分,左侧为与模型的对话,右侧为用户可直接编辑的文档,用户可直接在Canvas工具中删除、添加、修改ChatGPT回复的内容,以及进行加粗等格式调整。不论是写信、写公文还是论文,这种新生成模式都可以大幅提升效率。同时OpenAI在Canvas工具右下角集成了部分快捷工具,用户只需点击即可实现包括询问模型反馈(Suggest edits)、文档长度调整(Adjustthe length)、语言风格转化(Reading level)、文档润色(Add final polish)、添加表情(Add emojis)这些用户在处理文档时的常用功能。 •审稿:很多人使用ChatGPT帮助写作,但以前一问一答的形式非常繁琐,现在用户只需要把文章复制粘贴到ChatGPT的文本框中,通过文本输入让其给出修改建议,大模型给出的建议会以逐条批注的形式出现。用户可在页面中对应位置看到ChatGPT给出的修改建议,并决定是否根据批注进行润色,之后关闭建议,或者直接选择Apply,让ChatGPT自行对内容进行修改。这使用户可以更直观的使用模型帮助自己审阅文章,并给出建议。 DAY4:Canvas协作平台发布 ØCanvas主要功能 •编程:Canvas可以直接识别代码,并转变成为代码编辑模式。用户还可以在Canvas上直接运行测试,以及错误识别和修改错误的建议。用户想要Debug时,可直接代码复制到ChatGPT上,即可让模型解释问题,给出正确代码的示例。如果在C