您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国盛证券]:计算机行业周报:GPT-5最受益的方向 自定义AGENT - 发现报告

计算机行业周报:GPT-5最受益的方向 自定义AGENT

信息技术 2025-08-10 刘高畅,李可夫 国盛证券 测试专用号1普通版
报告封面

GPT-5最受益的方向:自定义Agent GPT-5发布,顶尖模型能力全方位提升。OpenAI于8月7日发布GPT-5,重要提升包括以下方面:1)编码能力大幅提升,在复杂的前端生成和大型代码库的调试方面表现出色。2)幻觉率大幅降低。在思考时,GPT-5的响应包含事实错误的可能性比OpenAIo3低约80%。3)健康领域表现优异。GPT-5在HealthBench上的得分明显高于任何先前的模型。4)更快更高效的思维。在视觉推理、代理编码和研究生水平的科学问题解决等各个功能中的输出token相比OpenAIo3减少了50-80%。5)总上下文长度扩展至400k个token。6)一系列多模态基准测试中表现出色,涵盖视觉、基于视频、空间和科学推理。7)在遵循工具指令、处理工具错误以及自主实现串行或并行的多工具调用方面表现更佳。8)模型API价格相对业内其他顶尖模型如Gemini和Claude有显著优势。30% 增持(维持) 作者 GPT-5发布最受益的方向是自定义Agent。GPT-5把更低幻觉、更强工具使用、更长上下文和更高性价比的推理打包到统一系统里,最利好的方向是各类自定义Agent,具体而言:1)编程能力提高,降低Agent开发门槛。2)幻觉显著下降,Agent可靠性跃升,尤其在一些高风险领域。3)工具调用能力提升,Agent执行中可能需要与多个API、数据库或内部系统交互,GPT-5能帮助Agent完成更复杂任务。4)GPT-5高达400K上下文窗口+多模态理解升级,让Agent可以处理多模态和更大量数据和记忆,大幅提高可用性。5)GPT-5推理效率提高与API降价,利好Agent经济性价比提升。 分析师刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 分析师李可夫执业证书编号:S0680525060001邮箱:likefu@gszq.com 相关研究 1、《计算机:国产化大势所趋》2025-08-092、《计算机:静待AI+细则与GPT-5》2025-08-023、《计算机:军工AI的两种范式:Palantir和Anduril》2025-07-27 未来有三种Agent:用户给自己做Agent、厂商给用户做Agent、单位给员工做Agent。Agent是当下大模型产业的重要方向,我们认为未来Agent的形式有三种:1)用户给自己做的Agent:AI带来的技术普惠让不具备编程背景的个人用户也能为自己高度特定的个人及工作任务,构建和部署定制化的AI Agent。2)模型厂商给用户做Agent,科技巨头为抢夺流量入口构建功能强大的通用Agent。3)单位给员工做Agent,作为企业中强大的“数字同事”或“数字员工”,带来可衡量的投资回报。除了将Agent分为三类以外,我们还认为Agent落地的三大要素分别是数据、模型、接口。GPT-5是顶尖模型的重大突破,其编程能力的提升极大利好用户自定义Agent的推广渗透,进一步会带来广泛的算力需求,幻觉降低尤其有利于严肃2B场景Agent。 建议关注: 算力:寒武纪、海光信息、有方科技、协创数据、奥飞数据、沪电股份、新易盛、东阳光、胜宏科技、中际旭创、东山精密、伟仕佳杰、云赛智联、潍柴重机、科华数据、禾盛新材、青云、金山云、浙数文化、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、润泽科技、润建 股份、深信服、神州数码、深桑达、品高股份、金山云、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。 Agent:阿里巴巴、腾讯控股、快手、拓尔思、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、海天瑞声、慧辰股份、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 内容目录 GPT-5发布,顶尖模型能力全方位提升....................................................................................4GPT-5最受益的方向是自定义Agent........................................................................................6未来有三种Agent:自己给自己做Agent、厂商给用户做Agent、单位给员工做Agent..................7建议关注.............................................................................................................................12风险提示.............................................................................................................................13 图表目录 图表1:GPT-5创建的网页小游戏..........................................................................................4图表2:GPT-5创建的绘画工具.............................................................................................4图表3:GPT-5幻觉率相比o3大幅降低.................................................................................5图表4:模型API价格..........................................................................................................6图表5:Agent的落地形式....................................................................................................7图表6:Lovable平台上的大量AI创作项目............................................................................8图表7:YouWare平台上的大量AI创作项目..........................................................................9图表8:ChatGPT Agent在虚拟机中工作..............................................................................10图表9:扣子空间...............................................................................................................10图表10:百度心响APP.......................................................................................................11图表11:Agent的要素包括模型、数据、接口......................................................................12 GPT-5发布,顶尖模型能力全方位提升 OpenAI于8月7日发布GPT-5。GPT-5是一个统一的系统,它包含一个能够解答大多数问题的智能高效模型、一个能够解决更复杂问题的更深层次的推理模型(GPT-5 thingking),以及一个实时路由器,可以根据对话类型、复杂度、工具需求以及用户的明确意图选择模型。 GPT-5的综合能力全面提升,具体而言,GPT-5的突出进步包括如下方面:编码能力大幅提升。GPT-5在复杂的前端生成和大型代码库的调试方面表现出色,通常只需一次提示就能创建美观且响应迅速的网站、应用程序和游戏。 资料来源:OpenAI,国盛证券研究所 资料来源:OpenAI,国盛证券研究所 幻觉率大幅降低。GPT-5产生幻觉的可能性显著低于OpenAI之前的模型。在ChatGPT生产流量中代表匿名提示的网页搜索中,GPT-5的响应包含事实错误的可能性比GPT-4o低约45%;在思考时,GPT-5的响应包含事实错误的可能性比OpenAI o3低约80%。 资料来源:OpenAI,国盛证券研究所 健康领域表现优异。GPT-5在HealthBench上的得分明显高于任何先前的模型。HealthBench是OpenAI今年早些时候基于现实场景和医生定义的标准发布的评估。与之前的模型相比,GPT-5更像是一个积极的思想伙伴,主动标记潜在顾虑并提出问题以提供更有用的答案。 更快更高效的思考。GPT-5从更少的思考时间中获得更多价值,在视觉推理、代理编码和研究生水平的科学问题解决等各个功能中的输出token相比OpenAIo3减少了50-80%。 上下文长度增加,在API中所有GPT-5模型最多可接受272k个输入token,并生成最多128k个推理及输出token,总上下文长度为400k个token。 在一系列多模态基准测试中表现出色,涵盖视觉推理、视频推理、空间推理和科学推理。更强大的多模态性能意味着ChatGPT能够更准确地对图像和其他非文本输入进行推理——无论是解读图表、总结演示文稿照片,还是回答有关图表的问题。 工具调用能力进步。GPT-5在遵循工具指令、处理工具错误以及自主实现串行或并行的多工具调用方面表现更佳。两个月前,Sierra.ai发布了τ2-benchtelecom测试基准,作为高难度工具使用评估体系,重点揭示了语言模型在用户可变更环境状态下的性能显著衰减现象。此前所有参评模型的得分均未超过49%,而GPT-5的得分为97%。 模型价格有竞争力,GPT-5在各项能力提升的同时,API价格相对业内其他顶尖模型有显著优势: GPT-5最受益的方向是自定义Agent 能够自主规划和执行任务的AI Agent是当下产业热点。然而在Agent实际落地过程中依然存在多种问题,GPT-5的提升大幅降低了Agent落地的门槛,提高了可用性。 GPT-5把更低幻觉、更强工具使用、更长上下文和更高性价比的推理打包到一套统一系统里,因此我们认为GPT-5最利好的方向是各类自定义Agent,具体展开理由有下: 1)编程能力提高,降低Agent开发门槛 编程语言用简洁、优雅的语法和语义规则,定义清晰明确的指令,让计算机完成各种任务。代码是数字世界的基础生产力工具。GPT-5的编程能力提高,进一步降低了大众通过AI编程开发Agent的门槛。