您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:国盛计算机自定义Agent相关报告:Agent的下半场,从解决问题到定义问题 - 发现报告

国盛计算机自定义Agent相关报告:Agent的下半场,从解决问题到定义问题

信息技术2025-09-14国盛证券晓***
AI智能总结
查看更多
国盛计算机自定义Agent相关报告:Agent的下半场,从解决问题到定义问题

Agent的下半场,从解决问题到定义问题 增持(维持) 国盛计算机自定义Agent相关报告: 2025年8月24日——《第四次谈自定义Agent》2025年8月10日——《GPT-5最受益的方向:自定义Agent》2025年7月27日——《再谈这轮AI持续性》2025年7月19日——《海外AI应用的持续性如何》 Agent的下半场,从解决问题转向定义问题。OpenAI的Agent研究员姚顺雨2025年4月发表文章《The Second Half》,认为AI发展到了下半场,此前训练>评估,之后评估>训练,从解决问题转向定义问题。前半部分专注于建立新的模型和方法,各个领域的基准性能不断提升,但目前已有较好的解决方案,即语言通过Agent的推理进行泛化,其要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。目前即使创建更严格的基准,它们很快也会被解决。因此下半场重点是开发针对现实效用的新型评估或任务。当今Agent发展最关键的两个方向一个是让它拥有自己的奖励,能自己探索;另一个是Multi-Agent,让它们之间能形成组织结构。提升Agent能力方面最重要的是上下文处理能力,或记忆能力,未来一类很有价值的,是能积累用户上下文,或者能构建特殊环境的公司。 作者 分析师刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 分析师李可夫执业证书编号:S0680525060001邮箱:likefu@gszq.com 相关研究 自定义Agent是AI应用与算力闭环重要因素。我们认为未来有Agent的形式有三种:用户个人自制的Agent、模型厂商驱动的通用Agent和企业定制的Agent。2025年上半年中国企业级市场大模型的日均总消耗量为10.2万亿Token,较2024年下半年日均调用量暴增363%,其中阿里通义占比17.7%,字节豆包占比14.1%,DeepSeek占比10.3%。大模型在工作中的调用量不仅来自于企业的直接调用,MIT的研究显示AI已经在改变工作,员工使用个人ChatGPT账户、Claude订阅和其他消费工具来自动化他们工作的大部分内容,MIT调查的公司只有40%表示购买了官方LLM订阅,但调查的90%以上的公司员工报告说他们经常使用个人AI工具用于工作任务,侧面反映了大模型的使用量有许多是用户已经在用自定义的Agent完成任务,而没有体现在B端直接对大模型的采购。 1、《计算机:AI电商进展研究》2025-09-112、《计算机:再谈算力下一站》2025-09-063、《计算机:算力下一站?》2025-08-31 阿里AI进展不断,国内算力与应用形成初步闭环。9月10日阿里旗下高德地图宣布推出全球首个基于用户行为产生的榜单“高德扫街榜”,构建线下服务信用体系,高德AI模型能识别真实到达行为、现场照片等,剔除无效和虚假评论,同时启动“烟火好店支持计划”,通过发放超10亿元补贴等措施,鼓励用户到店消费,希望每天能为线下餐饮及其他服务业多带去1000万客流。模型方面。模型方面,9月12日阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3- Next-80B-A3B系列模型。设计了全新的模型结构,改进了混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。Qwen3-Next-80B-A3B在“思考模式”和“非思考模式”下的性能均与规模更大的Qwen3-235B-A22B-2507相当,同时在推理速度上显著提升,尤其在长上下文场景中表现更为突出。我们认为阿里已经实现了算力投入-模型创新-应用落地及云服务增长的初步闭环,以阿里为标杆,看好国内其他公司把握AI发展机遇创造更多成就。 建议关注: 算力:寒武纪、海光信息、东阳光、有方科技、协创数据、新易盛、胜宏科技、鸿腾精密科技、中际旭创、沪电股份、东山精密、伟仕佳杰、宏景科技、奥飞数据、云赛智联、潍柴重机、科华数据、禾盛新材、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深信服、神州数码、深桑达、品高股份、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、数据港。 Agent:阿里巴巴、腾讯控股、快手、拓尔思、阜博集团、美图公司、金蝶国际、金山办公、金桥信息、鼎捷数智、嘉和美康、慧辰股份、海天瑞声、泛微网络、税友股份、朗新集团、润达医疗、360、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 内容目录 国盛计算机自定义Agent相关报告..........................................................................................................................4Agent的下半场,从解决问题转向定义问题..............................................................................................................4自定义Agent是AI应用与算力闭环重要因素...........................................................................................................6阿里AI进展不断,国内应用与算力形成初步闭环.....................................................................................................8建议关注.............................................................................................................................................................11风险提示.............................................................................................................................................................11 图表目录 图表1:更难的基准越来越快被解决......................................................................................................................4图表2:姚顺雨认为AI发展之后评估>训练...........................................................................................................5图表3:Agent的落地形式....................................................................................................................................6图表4:高德扫街榜店铺界面................................................................................................................................9图表5:Qwen3-Next模型架构............................................................................................................................10 国盛计算机自定义Agent相关报告 2025年8月10日——《GPT-5最受益的方向:自定义Agent》2025年7月27日——《再谈这轮AI持续性》2025年7月19日——《海外AI应用的持续性如何》 Agent的下半场,从解决问题转向定义问题 OpenAI研究language Agent的研究员姚顺雨于2025年4月发表文章《The SecondHalf》,文章认为人工智能的“下半场”从现在开始将从解决问题转向定义问题。在这个新时代,评估变得比训练更重要,不再只是问“我们能训练一个模型来解决X问题吗?”,而是问“我们应该训练人工智能做什么?我们如何衡量真正的进展?”为了在“下半场”蓬勃发展,我们需要及时转变思维方式和技能,或许更接近产品经理的水平。 游戏的前半部分:专注于建立新的模型和方法,评估和基准是次要的。这项游戏已经运行了数十年,并激发了改变世界的理念和突破,体现在各个领域的基准性能不断提升。这项游戏究竟为何会发生改变?这些理念和突破的积累,在创建解决任务的有效方案上产生了质的改变。解决方案的要素包括大规模语言预训练、Scaling数据和计算以及推理和行动的理念。抽象的解释是:语言通过Agent的推理进行泛化。 上半场游戏的玩法是不断开发新的训练方法或模型,以攀登基准测试。然后创建更难的基准测试,并继续这个循环。 但目前即使创建更严格的基准,它们很快也会被解决。 资料来源:github,国盛证券研究所 姚顺雨认为“我们应该从根本上重新思考评估。这意味着不仅仅是创建新的、更难的基准,而是从根本上质疑现有的评估设置并创建新的,这样我们就被迫发明新的方法,而不仅仅是遵循现有的配方。”下半场新游戏的办法是 ——我们开发针对现实效用的新型评估设置或任务。——我们用方案来解决它们,或者用新颖的组件来增强方案。继续这个循环。 姚顺雨也在社交媒体发文称:“现在是一个我称之为中场休息的特殊时刻。在此之前,训练>评估,在此之后,评估>训练”。 图表2:姚顺雨认为AI发展之后评估>训练 资料来源:36kr,国盛证券研究所 在“语言即世界language is world”访谈中,姚顺雨也再次提到基于语言的Agent的主线正从“上半场”转向“下半场”,当前从语言出发,去定义Reasoning(推理)、定义Agent,终于有了一个非常通用的方法,而且这个方法是可泛化的。这带来一个本质变化:“以前我面对很多怪兽,需要造出各种不同武器去打它们;现在我有了一把通用武器,比如机关枪,我不需要再为每个怪兽单独造武器。接下来要思考的问题就变成:我该朝哪个方向开枪?现在方法的问题已基本解决,真正重要的是——我们要用这个通用方法,解决什么问题?” 今天Agent发展最关键的两个方向: 一个是让它拥有自己的reward(奖励),能自己探索;另一个是Multi-Agent(多智能体),让它们之间能形成组织结构。 提升Agent能力,姚顺雨最看重的是Context(上下文)处理能力,或记忆能力。因为只有在这个基础上