第四次谈自定义Agent 增持(维持) 国盛计算机自定义Agent相关报告: 2025年8月10日——《GPT-5最受益的方向:自定义Agent》2025年7月27日——《再谈这轮AI持续性》2025年7月19日——《海外AI应用的持续性如何》 DeepSeek-V3.1发布,迈向Agent时代的一大步。2025年8月21日,DeepSeek-V3.1正式发布,包含以下主要变化:1)混合推理架构支持思考模式与非思考模式;2)更高的思考效率:V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平;3)更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升;4)上下文已扩展为128K。5)Base模型与后训练模型均开源。DeepSeek-V3.1报告中还提及使用了UE8M0 FP8 Scale的参数精度,针对即将发布的下一代国产芯片设计,我们认为这意味着DeepSeek正在构建软硬协同的生态,推动AI与国产硬件自主发展。 作者 分析师刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 模型能力持续进步,Agent落地加速:近期DeepSeek/OpenAI等厂商的模型进步多方面利好Agent落地:1)架构整合统一模型入口:DeepSeek-V3.1混合推理架构把思考模式与非思考模式结合。GPT-5通过实时路由器根据对话类型、复杂度、工具需求以及明确意图选择模型。降低了需要用户手动选择具体模型的使用复杂度。2)模型编程能力提高,降低了大众通过AI编程开发Agent的门槛。3)工具调用能力提升,GPT-5和DeepSeek-V3.1的智能体能力增强,能帮助Agent完成更复杂任务。4)幻觉显著下降,Agent可靠性跃升。5)推理效率提高减少token消耗,使得Agent应用更具经济性价比。6)上下文窗口扩大,Agent能处理更长任务更大量数据。7)模型开源:DeepSeek-V3.1的Base模型与后训练模型均开源,OpenAI也发布gpt-oss-120b和gpt-oss-20b两款性能卓越的开源模型,预计能进一步推动Agent开发生态的繁荣。 分析师李可夫执业证书编号:S0680525060001邮箱:likefu@gszq.com 相关研究 1、《计算机:从稳定币到政策牛》2025-07-122、《计算机:Grok 4发布,Scaling Law延续》2025-07-123、《计算机:全球AI持续景气》2025-07-06 未来有三种Agent:用户给自己做Agent、厂商给用户做Agent、单位给员工做Agent。Agent是当下大模型产业的重要方向,我们认为未来Agent的形式有三种:1)用户给自己做的Agent:AI带来的技术普惠让不具备编程背景的个人用户也能为自己高度特定的个人及工作任务,构建和部署定制化的AI Agent。2)模型厂商给用户做Agent,科技巨头为抢夺流量入口构建功能强大的通用Agent。3)单位给员工做Agent,作为企业中强大的“数字同事”或“数字员工”,带来可衡量的投资回报。除了将Agent分为三类以外,我们还认为Agent落地的三大要素分别是数据、模型、接口。近期的DeepSeek-V3.1和GPT-5模型的进步, 编程能力的提升利好用户自定义Agent的推广渗透,进一步会带来广泛的算力需求,幻觉降低尤其有利于严肃2B场景Agent。 建议关注: 算力:寒武纪、海光信息、有方科技、协创数据、新易盛、东阳光、胜宏科技、鸿腾精密科技、中际旭创、沪电股份、东山精密、伟仕佳杰、奥飞数据、云赛智联、潍柴重机、科华数据、禾盛新材、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。 Agent:阿里巴巴、腾讯控股、快手、拓尔思、阜博集团、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、嘉和美康、慧辰股份、海天瑞声、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 内容目录 国盛计算机自定义Agent相关报告................................................................................4DeepSeek-V3.1发布,迈向Agent时代的一大步..........................................................4模型能力持续进步,Agent落地加速..............................................................................6未来有三种Agent:自己给自己做Agent、厂商给用户做Agent、单位给员工做Agent.......7建议关注...................................................................................................................11风险提示...................................................................................................................12 图表目录 图表1:编程智能体测评(SWE使用内部框架测评,相比开源框架OpenHands所需轮数更少;Terminal Bench使用官方Terminus 1 framework)...............................................4图表2:搜索智能体测评.............................................................................................5图表3:在各项评测指标得分基本持平的情况下R1-0528与V3.1-Think的token消耗量对比图........................................................................................................................6图表4:Agent的落地形式..........................................................................................8图表5:Lovable平台上的大量AI创作项目..................................................................9图表6:扣子空间.....................................................................................................10图表7:Agent的要素包括模型、数据、接口.............................................................11 国盛计算机自定义Agent相关报告 2025年8月10日——《GPT-5最受益的方向:自定义Agent》2025年7月27日——《再谈这轮AI持续性》2025年7月19日——《海外AI应用的持续性如何》 DeepSeek-V3.1发布,迈向Agent时代的一大步 2025年8月21日,DeepSeek-V3.1正式发布,包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升上下文均已扩展为128K。 编程智能体:在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高 搜索智能体:DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。 思考效率提升:经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。 资料来源:DeepSeek,国盛证券研究所 模型开源:V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Huggingface与魔搭开源。 DeepSeek-V3.1报告中还提及使用了UE8M0 FP8 Scale的参数精度,在公众号评论区,官 方 指 出该 参 数 精 度 针 对 即 将 发 布 的 下 一 代 国 产 芯 片 设 计, 我 们 认 为这 意 味 着DeepSeek正在构建软硬协同的生态,推动AI与国产硬件自主发展。 模型能力持续进步,Agent落地加速 我们认为近期DeepSeek/OpenAI等厂商的模型进步将加速Agent应用落地。 架构整合统一模型入口: DeepSeek-V3.1通过混合推理架构,把思考模式与非思考模式结合。GPT-5是一个统一的系统,包含一个能够解答大多数问题的智能高效模型、一个能够解决更复杂问题的更深层次的推理模型(GPT-5thinking),以及一个实时路由器,可以根据对话类型、复杂度、工具需求以及明确意图选择模型。我们认为模型将不同模式的入口整合,降低了需要用户手动选择具体模型的使用复杂度。 编程能力提高,降低Agent开发门槛 编程语言用简洁、优雅的语法和语义规则,定义清晰明确的指令,让计算机完成各种任务。代码是数字世界的基础生产力工具。GPT-5、DeepSeek-V3.1的编程能力提高,进一步降低了大众通过AI编程开发Agent的门槛。 工具调用能力提升,能完成更复杂任务。 Agent执行中可能需要与多个API、数据库或内部系统交互。GPT-5工具调用能力提升,在遵循工具指令、处理工具错误以及自主实现串行或并行的多工具调用方面表现更佳。DeepSeek-V3.1也在工具使用与智能体任务中的表现有较大提升,如搜索智能体能力增强,也能帮助Agent完成更复杂任务。 幻觉显著下降,Agent可靠性跃升。 大模型的幻觉问题是Agent落地的一大障碍,尤其在一些高风险领域模型出现幻觉可能造成严重后果,GPT-5的幻觉显著下降提高