您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:计算机行业周报:Coding驱动全球AI应用闭环 - 发现报告

计算机行业周报:Coding驱动全球AI应用闭环

信息技术2025-06-14刘高畅国盛证券J***
AI智能总结
查看更多
计算机行业周报:Coding驱动全球AI应用闭环

请仔细阅读本报告末页声明 增持(维持)刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com1、《计算机:国内智驾整车军团成型》2025-06-022、《计算机:稳定币关键政策落地,全球化债时代新宠》2025-06-023、《计算机:全球算力景气度再验证》2025-06-012024-102025-02计算机沪深300 作者分析师相关研究 P.2请仔细阅读本报告末页声明能体系统之所以有效,主要在于它们能够帮助消耗足够的token来解决问题,工具调用次数和模型选择是另外两个因素。Agent通常比聊天交互多消耗4倍令牌,而多智能体系统则比聊天多消耗15倍token。因此多智能体系统需要执行那些价值足够高的任务,以抵消其性能提升带来的成本。建议关注:算力:寒武纪、海光信息、阿里巴巴、奥飞数据、协创数据、沪电股份、新易盛、中际旭创、胜宏股份、海南华铁、云赛智联、潍柴重机、科华数据、利通电子、大位科技、玉柴国际、亿田智能、有方科技、宏景科技、东阳光、弘信电子、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份。Agent:阿里巴巴、腾讯控股、金山办公、泛微网络、金蝶国际、鼎捷数智、拓尔思、朗新集团、用友网络、宇信科技、京北方、中科金财、麦迪科技、致远互联、金桥信息、汉得信息、软通动力、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、光云科技、科大讯飞、万兴科技、海天瑞声、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 P.3内容目录基础模型编程能力提升,AI Coding落地加速.....................................................................................................4海外AI编程龙头Cursor商业化成果显著,估值飙升。......................................................................................7字节TRAE月活过百万,AI Coding为火山引擎大会要点....................................................................................9Anthropic分享Multi-Agent研究系统架构........................................................................................................12建议关注.........................................................................................................................................................15风险提示.........................................................................................................................................................15图表目录图表1:Claude使用数据中的职业代表性与美国劳动力分布.............................................................................4图表2:Claude 4模型在SWE-bench Verified上领先,SWE-bench Verified是实际软件工程任务的性能基准...5图表3:记忆:当获得对本地文件的访问权限时,Claude Opus 4会记录关键信息以帮助改进其游戏体验.........6图表4:Cursor部分功能示例..........................................................................................................................8图表5:火山引擎Force原动力大会AI Coding相关论坛..................................................................................9图表6:奥数竞赛题库网站截图.....................................................................................................................10图表7:TRAE自定义Agent演示案例............................................................................................................11图表8:多智能体架构的实际应用:用户查询流经主Agent,主Agent创建专门的子Agent并行搜索不同方面.......................................................................................................................................................................13图表9:Anthropic多智能体研究系统的完整工作流程....................................................................................14 请仔细阅读本报告末页声明 请仔细阅读本报告末页声明基础模型编程能力提升,AI Coding落地加速据外媒innolead在6月9日的报道,编码和软件开发支持已成为生成式AI最突出且增长最快的用例之一。从2024年到2029年,代码生成行业的复合年增长率预计将达到53%的惊人增长。斯坦福大学发布的《2025年人工智能指数报告》发现,专业开发人员仅占美国劳动力的3.4%,但已经占Anthropic的Claude对话的37%。值得关注的是许多开发人员都认为Claude暂时比Gemini或ChatGPT或其他公司更具优势。生成式AI编码为何如此有效?Innolead总结原因有三:1、代码本质上更加结构化,为LLM训练提供了更受约束的数据空间。2、代码生成系统的输出可以立即测试;代码要么有效,要么无效。3、代码质量有明确的评估基准(好、更好、最好),可以更轻松地进行微调和模型改进,包括人为微调和自动微调。同时,GitHub等代码社区海量的高质量代码库,也为模型训练提供了丰富的数据。基座大模型的编程能力持续提升是AI编程工具落地加速的核心动力:2025年5月23日,Anthropic推出Claude4系列模型:Claude Opus 4和ClaudeSonnet 4,Anthropic称Claude Opus 4是世界上最好的编码模型,在复杂、长时间运行的任务和Agent工作流程上具有持续的性能。Claude Sonnet 4是Claude Sonnet 3.7的重大升级,提供卓越的编码和推理,同时更精确地响应指示。Claude Opus 4是Anthropic最强大的模型,在SWE-bench((72.5%)和Terminal-bench((43.2%)上领先。它可以在需要集中精力和数千个步骤的长时间运行任务上提供持续的性能,并且能够连续工作数小时,性能大大优于所有Sonnet模型,并显著扩展了AI代理可以完成的工作。Claude Opus 4擅长编码和解决复杂问题,为Frontier Agent产品提供支持。Cursor称其为最先进的编码技术,是复杂代码库理解的飞跃。Replit报告提高了多个文件中复 杂更改的精度和 显著进步。Block称其 为第一个在其代理codename goose中编辑和调试期间提高代码质量,同时保持完整性能和可靠性的模型。Rakuten通过要求苛刻的开源重构独立运行7小时并持续运行来验证其功能。Cognition图表1:Claude使用数据中的职业代表性与美国劳动力分布资料来源:Anthropic官网,国盛证券研究所 请仔细阅读本报告末页声明指出,Opus 4擅长解决其他模型无法解决的复杂挑战,成功处理了以前模型错过的关键行动。Claude Sonnet 4显著改进了Sonnet 3.7的行业领先功能,在SWE上以最先进的72.7%的编码能力表现出色。该模型平衡了内部和外部用例的性能和效率,并增强了可控性,从而更好地控制实施。Claude Opus 4在内存能力方面的表现也大大优于所有以前的型号。当开发者构建允许Claude访问本地文件的应用程序时,Opus 4能够熟练地创建和维护“内存文件”来存储关键信息。这能够提升代理在长期任务中的感知能力、连贯性和执行性能——例如,Opus 4在玩宝可梦时能够创建“导航指南”。图表2:Claude 4模型在SWE-bench Verified上领先,SWE-bench Verified是实际软件工程任务的性能基准资料来源:Anthropic官网,国盛证券研究所 请仔细阅读本报告末页声明资料来源:Anthropic官网,国盛证券研究所 请仔细阅读本报告末页声明海外AI编程龙头Cursor商业化成果显著,估值飙升。当前各类AI编程工具层出不穷,Innolead总结大致可以分为三大类:1)第一类是面向广大消费者和开发者的通用多模态模型,例如Claude、Gemini、ChatGPT等。许多非程序员通过创建各种简单的脚本和基础应用,发现了“编程的乐趣”。2)第二类是中等规模的专业消费者工具(例如Bolt、Replit或Lovable),它们的目标客户是希望快速将创意转化为可运行应用程序的创意和创新专业人士。这些系统的输出包含托管功能,其模型在现代网页设计调色板上进行训练和调整。3)第三部分是真正的专业级编码工具(例如Cursor、Poolside和Windsurf),这些工具可能对像我这样的新手来说很容易上手,但真正适合在大型系统上协作的软件团队。这些工具可以自动化开发团队的许多繁琐工作,例如生成平台的云实例,在GitHub等代码存储库中创建提交和PR(“拉取请求”)。而且,它们还经过精心设计,可以识别和修复代码中的错误,其中许多工具可以自动执行此类过程。据新浪新闻,AI编程助手开发商Anysphere凭借Cursor产品强势崛起,Cursor以独特的“氛围编程”(Vibe Coding)体验引领风潮,通过智能预测、自然语言交互和深度集成显著提升开发效率,已吸引超3万家企业客户。Anysphere于今年6月完成9亿美元新一轮融资,公司估值飙升至99亿美元,正式跻身全球顶级AI独角兽阵营。本轮融资由老股东Thrive Capital领投,a16z、Accel等知名机构跟投。值得注意的是,这已是该公司近一年内的第三次融资,半年多前的2024年12月,其完成100万美元融资时估值仅为25亿美元,增长势头迅猛。Anysphere展现出的强劲商业化能力