您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:计算机行业:OpenAI提升用户体验,o3模型创新突破 - 发现报告

计算机行业:OpenAI提升用户体验,o3模型创新突破

AI智能总结
查看更多
计算机行业:OpenAI提升用户体验,o3模型创新突破

OpenAI提升用户体验,o3模型创新突破 [table_Authors]李博伦(分析师) 0755-23976516 libolun@gtjas.com 本报告导读: 计算机《OpenAI生态闭环与商业化进程加速》2024.12.23计算机《打造韧性城市,车路云、智慧运维等方向将显著受益》2024.12.06计算机《景气度反转为盾,新技术应用为矛》2024.12.05计算机《四大协会建议慎采美国芯片,利好信创》2024.12.04计算机《低空经济、车路云新基建将在物流等领域快速落地》2024.11.28 OpenAI发布o1模型API升级、ChatGPT多渠道集成及o3系列模型创新,大幅提升开发者体验与AI应用的易用性、性能与安全性,推动AI技术普及与商业化。 投资要点: OpenAI通过发布o1模型,显著增强了API功能。新功能包括函数调用、结构化输出和视觉输入,极大地提升了开发者的工作效率。o1模型在结构化输出调用中的准确率达95%,远超GPT-4o模型,确保了复杂任务中的高准确性和稳定性。此外,开发者消息和推理努力程度的控制选项,帮助开发者在性能与成本之间找到最佳平衡,进一步优化了开发体验。视觉输入功能的加入,使得o1模型能够直接处理图像输入,如分析表格中的错误,进一步扩展了其应用场景。 ChatGPT桌面应用的原生化与深度集成大幅提升了编程与创作效率。用户可通过快捷键快速调用ChatGPT,在Xcode和Warp终端生成复杂代码片段,显著缩短开发时间,提升代码质量。与Notion、Apple Notes等创作工具的集成,进一步提升了文档编辑和信息整合的效率,使得ChatGPT更加深入用户的日常工作和创作流程。高级语音模式的引入,增强了用户与ChatGPT的互动体验,为用户带来了更高的便利性和生产力。 OpenAI推出的o3系列模型在性能、成本和安全性上取得突破。o3在ARC AGI基准测试中得分达到87.5%,超越人类平均水平,显著提升了编码、数学和科学问题解决能力。在Codeforces竞技编程中,o3的ELO值接近2727,远超o1模型的1891;在Epoch AI的FrontierMath Benchmark中准确率超过25%,这是目前最难的数学基准测试之一,此前所有现有模型的准确率均低于2%。o3 mini通过灵活的推理强度设置(低、中、高),在低推理强度下编码能力已超越o1mini,中等推理强度下性能优于o1,为开发者在使用成本和推理性能之间提供了平衡的选项。o3 mini在低推理强度下的延迟已接近GPT4o的水平,而成本仅为o1模型的一小部分,为大规模商业化应用提供了坚实基础。此外,OpenAI首次开放o3系列模型给外部研究人员进行安全测试,增强了公众对技术的信任,进一步巩固了OpenAI在AI领域的领先地位。 风险提示:技术突破存在安全与隐私风险;商业化进程不及预期。 目录 1.投资建议..........................................................................................................32.OpenAI技术升级增强开发者支持,进行多渠道扩展.................................32.1.o1模型发布API,偏好微调等功能升级增强开发者体验....................32.2.ChatGPT桌面应用升级,功能深度集成提升交互体验.........................52.3.电话与WhatsApp集成实现多渠道接入,提升市场渗透......................63.o3系列模型推出,实现性能、成本、安全全面优化..................................74.风险提示........................................................................................................10 1.投资建议 投资建议:OpenAI 12 days发布会最后四天发布了o1 API、o3等最新功能。o1模型通过增强API功能(如函数调用、结构化输出和视觉输入),大幅提升了开发者的效率和应用场景的多样性;o3系列模型则在编码、数学和科学推理等领域展现出接近或超越人类专家的能力,同时通过灵活的推理强度设置,显著降低了使用成本。重点关注以下赛道:AI开发工具与平台(如API服务和SDK支持);AI推理与高性能计算,以及AI安全对齐技术产品。这些领域或将受益于OpenAI的技术突破得到更多发展机遇。推荐标的:福昕软件、万兴科技、科大讯飞、浪潮信息、虹软科技。受益标的:昆仑万维、润达医疗、迈富时、海天瑞声。 2.OpenAI技术升级增强开发者支持,进行多渠道扩展2.1.o1模型发布API,偏好微调等功能升级增强开发者体验 OpenAI正式发布o1模型,增强开发者API功能。在2024年12月18日,OpenAI最新的o1模型预览阶段结束,将其全面纳入API服务中。o1模型引入了多项关键功能,包括函数调用、结构化输出、开发者消息以及推理努力程度的控制。通过函数调用,模型能够与后端API进行交互,例如实时获取税收数据;结构化输出允许开发者指定JSON模式,确保模型输出严格符合预期格式,便于应用程序处理。此外,开发者消息作为系统消息的新变体,使开发者能够更精确地引导模型行为,而推理努力程度的新参数则帮助开发者在性能与成本之间找到最佳平衡。视觉输入功能的加入,使得o1模型能够直接处理图像输入,如分析表格中的错误,进一步扩展了其应用场景。 数据来源:OpenAI 数据来源:OpenAI OpenAI的o1 API在引入结构化输出(Structured Outputs, SO)后,依然保持了优异的性能表现。下图第一张图显示,o1-2024-12-17版本在结构化输出调用中,准确率均维持在0.95左右,显著高于之前的GPT-4o-2024-11-20版本。这表明,o1模型在处理复杂的函数调用和结构化数据时,能够保 持高度的准确性和稳定性。o1在引入结构化输出后于AIME中的准确率表现同样优异,与o1-2024-12-17版本持平,远超预览版本o1-preview和早期GPT-4o模型。结构化输出的增加并未影响o1模型的整体性能,反而增强了复杂任务中的应用能力,确保了在多样化应用场景下满足个性化需求。 数据来源:OpenAI 数据来源:OpenAI 实时API升级与成本优化助力开发者高效构建应用。OpenAI在实时API方面也进行了重大更新,特别是引入了WebRTC支持,这大大简化了实时语音应用的开发过程,减少了代码量,并提升了对网络波动和回声消除的处理能力。此外,GPT-4的音频token成本降低了60%,而GPT-4 mini的音频token成本更是降低了10倍,这显著降低了开发者的使用成本。为了进一步便利开发者,OpenAI发布了Python SDK,使实时API的集成更加简便。同时,API的其他改进,如更易于使用的函数代码和增强的安全措施,也提升了开发者的使用体验。这些更新不仅提升了实时语音应用的性能和经济性,也为开发者提供了更强大的工具,助力他们构建高效、可靠的实时交互应用。 数据来源:OpenAI 偏好微调功能推出,定制化模型满足多样化需求。偏好微调允许开发者通过提供成对的偏好响应来定制模型,使其更符合特定用例的需求,如内容审核和风格调整。与传统的监督微调不同,偏好微调不需要提供确切的输入输出对,而是通过比较不同响应的优劣,优化模型的行为。这一方法在实际应用中表现出色,例如Rogo AI在使用偏好微调后,其模型准确率从75%提升至80%以上,显著优于基础模型。OpenAI计划将这一功能扩展到GPT-4o和GPT-4o mini,进一步满足开发者在定制化模型方面的需求,推动模型在更多专业领域的应用。 扩展SDK支持与简化用户体验,提升开发者参与度。为了进一步支持开发者社区,OpenAI此次发布了Go和Java SDK,拓展了API支持的编程语言,满足更多开发者的需求。同时,OpenAI简化了登录和注册流程,使开发者能够更快速地获取API密钥,减少了繁琐的步骤,提升了用户体验。此外,OpenAI通过举办AMA(Ask Me Anything)活动,与开发者社区保持紧密互动,提供更多学习和交流的机会。这些举措增强了社区的活跃度,促进了OpenAI API的广泛应用和持续发展。 2.2.ChatGPT桌面应用升级,功能深度集成提升交互体验 ChatGPT桌面应用的原生化与效率提升。OpenAI在2024年12月20日正式发布了适用于Mac和Windows的原生ChatGPT桌面应用。这些原生应用不仅更加轻量级和高效,还引入了快捷键(如Mac中Option +空格键)以快速调用ChatGPT,极大提升了用户操作的便捷性和工作效率。原生应用的特性使ChatGPT能够更无缝地集成到用户的日常工作流程中,减少资源占用,提高响应速度,为用户提供更加流畅和高效的使用体验。 ChatGPT与IDE深度集成,实现高效编码与自动化。OpenAI展示了ChatGPT桌面应用与多种开发工具的深度集成,在Warp终端和Xcode的代码编写场景中,o1和o1 Pro开始投入使用。在Warp终端中,用户可以通过ChatGPT生成复杂的命令和代码片段,从而大幅提升编程效率,用户只需复制粘贴即可在Warp中运行。同样,在Xcode中,ChatGPT能够辅助开发者自动添加观察者或生成调试代码,确保代码的准确性和高效性。这些集成展示了ChatGPT从简单的问答系统向强大代理功能的转变,帮助开发者更高效地完成编程任务,显著提升了开发效率和代码质量。 数据来源:OpenAI 与更多应用集成,扩展创作领域自动化操作能力。ChatGPT推出了在Notion、Apple Notes、Quip等工具中的应用。用户可以直接在这些平台中与ChatGPT协作,进行文档内容编辑、风格匹配和信息整合,极大提升了创作效率。随着这些新功能的上线,ChatGPT将更加深入日常工作和创作流程,为用户带来更高的便利性和生产力。 数据来源:OpenAI 高级语音模式引入提升交互体验。OpenAI在最新的桌面应用中引入了高级语音模式,允许用户通过语音与ChatGPT进行交互,并获得实时反馈。这一功能极大地提升了使用便捷性,例如在节日曲目列表的讨论中,用户可以通过语音命令与模拟的圣诞老人互动,快速生成和调整音乐建议。这不仅为用户带来了更具互动性和趣味性的体验,还使得ChatGPT在不同情境下的应用更加广泛和灵活,进一步增强了用户的交互体验。 数据来源:OpenAI 2.3.电话与WhatsApp集成实现多渠道接入,提升市场渗透 OpenAI推出的ChatGPT电话接入功能,赋予了AI服务前所未有的易用性。通过拨打1-800-242-8478,无论是智能手机、翻盖手机,还是座机,用户都能与ChatGPT进行互动。这一创新不仅突破了互联网和智能设备的限制,还直接面向技术接触较少的群体,尤其是老年人等目前渗透率较低的市场。 数据来源:OpenAI ChatGPT与WhatsApp的集成拓展了与用户的互动方式,使得用户能够在这一全球流行的通讯应用中直接与ChatGPT进行对话。这一功能的推出丰富了AI的接入渠道,使得用户可以随时随地与ChatGPT进行沟通,提升了用户的互动体验。未来的更新将可能使用户能通过WhatsApp实现更多高级功能,如实时网络信息访问。对于长期用户而言无疑是一个重大的便利性提升。 数据来源:OpenAI ChatGPT的电话接入和WhatsApp集成具有重要的商业化意义。这些功能不仅为用户带来了更加便捷的互动方