AI智能总结
AI编程重塑软件开发,是实现Agent的关键一环。AI编程产品赋能软件开发全生命周期,帮助程序员提高工作效率、减少错误、优化代码质量,并加速了软件的交付和迭代;同时,企业可借助AI编程产品不断完善积累的代码数字资产,形成正向循环。OpenAI o1开启大模型推理时代,基础大模型厂商陆续在后训练和推理阶段Scaling,“推理模型”成为迭代主基调,推理模型的编程能力(Codeforces得分)相比基础通用模型有明显跃升。未来在面对复杂项目开发,在初始设计、架构选择、迭代试错等当前人工主导的环节,Agent可借助AI编程能力调用已有资源(代码库、API、办公应用等),其自主性将大幅提升。 AI编程“增效”优先于“降本”,软件企业利润弹性大。互联网等以软件开发为主的科技企业,将优先受益于AI代码生成带来的效率提升。我们认为,当前软件开发面临巨大变革,软件企业在AI浪潮下将优先选择“增效”,即利用AI工具提升人均创收,而并非立即采取裁员进行“降本”,以应对快速变化的市场需求与繁杂的业务智能化重构。根据iFinD数据,自2022年一季度以来,美国七大科技公司与国内互联网巨头的人均创收大多实现了增长,这反映了AI编程为软件企业实现提效,我们预计,国内软件企业受益于AI编程,利润弹性大。 海外AI编程产品成熟度高,国内开源生态迎头追赶。海外AI代码技术起步早、企业付费意愿强,AI编程已逐步进入成熟应用阶段;国内在软件生态融合与场景丰富度相比海外明显欠缺,当前的软件生态需要进行大量融合工作,以提升对不同工程场景的适应力。国内AI编程产品主要出自大模型公司,“模型即应用”的闭源形态居多,创业类公司较少。我们认为,近期DeepSeek等开源模型的兴起,可能改变AI编程产品格局,开源模型分离了底层模型训练与产品开发两个阶段,更多的参与者加入生态将加速开源能力跃升,因此垂直行业公司与创业公司可能在AI编码市场获得更多机会。 投资建议:AI编程为软件开发降本增效,提升软件公司人均创收,计算机软件应用公司有望实现较高利润弹性;强化学习阶段Scaling继续演绎,推理模型成本降低,加速AI应用落地,中长期推理算力需求持续增长,持续看好国产算力链。 风险提示:技术迭代不及预期;商业化落地不及预期;政策支持不及预期; 全球宏观经济风险。 1AI编程重塑软件开发,是实现Agent的关键一环 基于LLM的软件开发,AI编程加速产品迭代 AI编程产品赋能软件开发全生命周期。编写代码、理解代码及互联网搜索、调试、写注释、测试等工作是软件开发者的最高频、最耗时的工作需求,随着生成式AI底层能力提升,开发者普遍开始借助AI解决项目问题。AI代码生成工具可赋能软件开发的全生命周期,帮助程序员提高工作效率、减少错误、优化代码质量,并加速了软件的交付和迭代。 需求分析:通过AI辅助解析需求文档,提供代码实现的初步建议。 架构设计:提供设计建议,自动生成数据库架构代码和初步系统设计文档。 代码编写:提供代码自动完成建议,生成常用的代码片段,辅助编写复杂的逻辑结构,包括代码补全、生成、重构等。 软件测试:自动生成测试用例,提供潜在的错误检测和修复建议;代码审查阶段,AI辅助分析代码,提供风格改进建议,检查潜在的安全漏洞。 部署与维护:AI代码生成工具监控代码性能,提供优化建议,辅助处理用户反馈和问题修复。 图1.AI编程能力覆盖大部分软件开发过程 加速软件工程智能化重塑,与企业代码知识资产的建立。随着企业研发工作开展,内部有很多优质的代码、框架、规范需要逐步积累,但分立的系统、人工收集操作往往造成优质数据的闲置甚至丢失,代码know-how没有充分得到积累与运用,对于新的开发项目企业边际成本很难下降。采用AI代码开发平台,将大模型与RAG技术结合运用,使企业已有代码库、内部规范、过程数据等资产能够充分融合运用,进而将企业自身的代码管理规范、代码输出格式、文档输出格式,产品文档、技术文档、企业代码仓库等现有知识与AI代码平台打通,使生成代码更加贴合企业业务、更符合企业内部的管理要求。企业可借助AI编程产品不断完善积累的代码数字资产,形成正向循环。 图2.AI编程平台加快企业代码资产的积累 代码开发与测试位居企业应用AI场景首位,是落地最快、最直接的AI应用。易观分析联合CSDN在2024年9月至10月对开发者进行调研,发现代码开发与测试以59.2%的选择比例位居企业AI应用首位,用户营销与运营以52.0%紧随其后,而协同办公、客户服务和产品体验提升等处于中等水平,财务、供应链管理、法务相对较低。这表明企业优先将AI应用于现有产品开发提效,其次是创造基于大模型的新产品,而将AI与企业工作流know-how结合则需要时间磨合对接。 图3.行业企业目前选择的AI场景(2024年10月) AI代码生成在互联网和游戏行业的渗透率最高,应用渗透次序2C、2B、2G依次递减。互联网、游戏、人工智能行业主要工作以软件开发为主(密集、规范、项目制),2C需求通用性高、业务变化快、产品迭代迅速,因此对标准化和效率提升需求强烈,AI代码生成的应用优先级较高。对于金融、能源、医疗、电信等2B行业,需要代码平台理解行业工作流细节,一般需要大模型厂商与B端企业合作开发AI产品,落地节奏略慢。政务体系对新系统平台的应用抱有谨慎态度,因此渗透率仅为15%。 图4.中国AI代码生成在各行业的渗透率(2024年9月) 大模型进入推理时代,AI编程基础能力加速跃升,产品性能升级可期 OpenAIo1开启大模型推理时代,基础大模型厂商陆续在后训练和推理阶段Scaling,“推理模型”成为迭代主基调。根据2024年9月,OpenAI发布o1-preview与o1-mini,大模型技术发展进入预训练放缓而后训练加速的阶段,模型厂商更重视思维链(CoT)的延长、强化学习算法的创新、以及通过算法优化降低推理成本。 例如2025年1月20日发布的DeepSeek R1-Zero,是首个通过纯强化学习(RL)训练且无需任何监督微调(SFT)数据的模型,该模型根据环境反馈的奖励信号来调整自身策略,探索如何更好地完成任务,验证了强化学习Scaling在模型训练中的潜力。推理性能的提升,往往带来模型的数学、编码、逻辑能力提升,AI编程产品的基座也将进一步优化。 图5.基础大模型厂商陆续推出“推理模型”版本 推理模型的编程能力(Codeforces得分)相比基础通用模型有明显跃升。Codeforces是一个面向全球程序员的在线编程竞赛平台,涵盖了各种难度和类型的编程题目,大模型在Codeforces的得分能直观反映其在算法设计、数据结构运用、代码实现等编程核心技能方面的水平。推理模型(红色)由于通过强化学习实现了推理能力的提升,编程竞赛得分显著高于通用模型(蓝色)。 图6.推理模型的编程能力(Codeforces得分)相比基础通用模型有明显跃升 开源模型的发展,有望加速国内AI编程产品追赶海外。当前闭源模型整体性能仍优于开源,基于闭源模型的产品优先实现了商业化,随着DeepSeek等开源模型快速发展,吸引广大开发者投入开源生态,基于开源的产品和商业模式将加速构建,赋予国内AI编程弯道超车的机会。在Hugging Face平台发布的BigCodeBench可以合理评估LLMs解决实际和具有挑战性的编程任务的能力,其包含1140个函数级任务,考察LLMs遵循指令并将来自139个库的多个函数调用作为工具进行组合的能力,主要目标场景是代码完成与指令调整。截至2月4日,该评价体系的排名前十的模型中包括DeepSeek-R1、DeepSeek-V3-Chat、Athene-V2-Chat(基于阿里云的Qwen2.5-72B-Instruct)是开源大模型,且都来自中国,其余主要为o1、o3系列闭源模型。DeepSeek带动开源能力上限的跃升,遵循MIT开源协议(授予所有人免费使用、修改、再次出版售卖的权力),未来基于开源模型的产品值得期待。 图7.BigCodeBench上评估当前模型的代码能力(2025.02.04) AI代码能力仍有提升空间,作为Agent自主执行的关键环节 AI编程产品仍有优化空间,“技术+产品”两手都要硬。(1)技术方面:沿着强化学习Scaling的方向继续前进,进一步优化训练数据和算法,提高代码的准确性和可靠性;(2)产品方面:面对垂直领域与复杂业务流程,AI编程工具需要更多结合行业与工作流know-how,另外再与开发环境IDE深度集成,提升产品的可用性。 图8.AI编程的优势与局限性 AI编程作为Agent规划与调用工具执行的环节,其能力关乎Agent的应用边界。 AI代码平台的Agent,是基于特定训练的大模型,并结合代码规划、知识记忆、工具集成、自动执行的能力的自主代理。未来在面对复杂项目开发,在初始设计、架构选择、迭代试错等当前人工主导的环节,Agent可借助AI编程能力调用已有资源(代码库、API、办公应用等),其自主性将大幅提升。 图9.代码生成Agent将加强任务理解与规划调动能力 2AI编程“增效”优先于“降本”,软件企业利润弹性大 互联网等以软件开发为主的科技企业,将优先受益于AI代码生成带来的效率提升。我们认为,当前软件开发面临巨大变革,软件企业在AI浪潮下将优先选择“增效”,即利用AI工具提升人均创收,而并非立即采取裁员进行“降本”,以应对快速变化的市场需求与繁杂的业务智能化重构。根据iFinD数据,2022年一季度至2024年三季度(生成式AI浪潮自2022年末开启),美国七大科技巨头当中,除去苹果和特斯拉,单季度人均创收总体呈现上行趋势。其中,Meta由37万美元提升至77万美元,英伟达由25万美元提升至58万美元,Alphabet、微软、亚马逊均呈现提升趋势。考虑到苹果与特斯拉产品形态以实体硬件为主,而英伟达是受益于算力的需求扩张,剔除以上因素,我们认为产品的“软件属性”越强,由AI编程驱动的企业人均创收提升越显著。 图10.美国七大科技公司单季度人均创收(万美元) 国内互联网企业人均创收同样呈现稳步提升趋势。根据iFinD数据,2022年一季度至2024年三季度,阿里巴巴单季度人均创收由80万元提升至119万元;2022年一季度至2023年四季度,百度、网易、拼多多总体人均创收提升,京东人均创收处于平稳状态,考虑是物流员工比例相对较高,人员扩招压制了人均创收的提升。由此可知,互联网大厂的优势在AI时代进一步被巩固,收入端可开发基于大模型的C端产品解决用户痛点,成本端可采用AI编程提升产品开发效率,为更大规模的国内软件公司的发展提供了范本。 图11.中国互联网厂商单季度人均创收(万元) AI编程可能会造成初级、中级程序员部分被优化,企业将聚焦产品设计与创新。 自2024年下半年以来,海外科技厂商陆续发布裁员或减缓招聘的公告,尤其针对初、中级程序员进行了优化。2024年12月18日,Salesforce表示2025年将不再招聘软件工程师,因为2024年其通过Agentforce和用于工程团队的其他AI技术将生产力提高了30%以上。我们预计,随着AI推理能力提升,AI编程产品将规模化应用于当前的初、中级程序员岗位。 图12.2025年各大科技公司放缓程序员招聘进程 AI编程将系统性利好计算机板块,“分子端”降本将带来总体的利润弹性。根据Wind数据,2023年A股计算机公司人均创收主要集中于50~100万元(39%),人均创利主要集中于0~10万元(43%),该类公司主要商业模式一般为2B的软件项目外包,同时该类公司拥有较高技术壁垒,客户资质较好、粘性较强;而人均创利为亏损的公司(35%)通常重心在2G、2B的业务,在当前的宏观背景下客户回款较慢,对下游议价能力较弱。我们认为,由于计算机行业软件公司占比较高,短期来看AI编程将带动整体计算机板块的利润弹性,人均创利为亏损的企业有望实现扭亏为盈;长期来看