行业研究公司研究宏观策略财报招股书会议纪要中央经济工作会议低空经济 DeepSeek AIGC 智能驾驶大模型

2025年DORA AI辅助软件开发状态报告

信息技术2025-09-24Google Cloud健***

AI智能总结

执行摘要

AI是放大器：2025年，AI在软件开发中的主要作用是放大器，它能放大高绩效组织的优势，也能放大表现不佳组织的弊病。AI投资的最大回报并非来自工具本身，而是源于对底层组织系统的战略关注：内部平台的质量、工作流程的清晰度以及团队的协作一致性。
主要发现：
- AI的采用已接近普及，95%的受访者现在依赖AI，超过80%的受访者认为AI提高了生产力。
- AI的采用现在能提高软件交付吞吐量，但仍然会增加交付的不稳定性。
- 成功的AI采用不仅仅需要工具，DORA AI能力模型确定了七项基础实践，包括清晰的AI政策、健康的数据生态系统和以用户为中心的关注点。
- 研究确定了七种不同的团队画像，为有针对性的改进提供了一个新框架。
- 价值流管理是可视化、分析和改进从构想到客户的工作流动的实践，它能作为AI的倍增器，确保局部生产力提升转化为团队和产品绩效的可衡量改进。
- 90%的组织已采用平台工程，使得高质量的内部平台成为AI成功的必要基础。
关键建议：
- 将成功的AI采用视为一场组织转型。
- 投资那些能够放大AI优势的基础系统：内部平台、数据生态系统以及团队的核⼼工程实践。
- 广泛采用AI，但保持健康的审慎态度，专注于教导团队如何批判性地指导、评估和验证AI生成的工作。
- 利用团队绩效的七种画像来诊断团队健康状况，超越软件交付绩效指标。
- 优先投资并资助你的平台工程计划。

理解您的软件交付绩效

软件交付绩效因素：吞吐量（衡量在一段时间内有多少变更可以通过系统）和不稳定性（衡量软件部署成功程度）。
七种团队画像：
- 基础挑战型：在流程、环境和结果方面都面临基础性缺陷带来的重大挑战。
- 遗留瓶颈型：持续处于被动应对状态，不稳定的系统削弱了他们的士气。
- 流程受限型：精力被低效的流程所消耗，导致高倦怠和低影响力。
- 高影响力，低交付节奏：产出了高影响力的工作，但伴随着低交付节奏。
- 稳定而有条不紊：以深思熟虑且可持续的节奏交付高质量、有价值的工作。
- 务实高效型：始终以惊人的速度和稳定性交付工作，但工作环境尚未达到最佳投入状态。
- 和谐高效型：卓越的表现，稳定、低摩擦的环境赋能团队持续且不倦怠地交付高质量的工作。

AI的采纳与使用

AI的采用已接近普及：90%的受访者表示在工作中使用AI，比去年报告中的相同指标增加了14.1%。
AI的用户状态：中位数为16个月，平均为16.22个月。
AI的依赖度：只有5%的AI用户表示在工作中“完全不”依赖AI，而65%的用户表示“适度”、“很多”或“非常”依赖AI。
AI的使用任务：71%的编写代码的受访者使用AI辅助他们完成此任务，68%用于文献综述，66%用于修改现有代码，66%用于校对，66%用于创建或编辑图像。
AI的交互界面：对话式AI聊天机器人和嵌入式到IDE中的AI是最常见的载体。
AI的使用模式：文本聊天和预测文本模式是最常见的模式，代理式AI的使用最不常见。
AI对个人生产力的感知影响：超过80%的受访者认为AI提升了他们的生产力。
AI对代码质量的感知影响：59%的受访者观察到AI对他们的代码质量产生了积极影响。
AI的可信度：70%的受访者对其质量表示一定程度的信任，30%的受访者表示对AI生成的代码几乎不信任。

探索AI与关键成果的关系

AI的采纳的影响：AI的采纳与个人效能、代码质量、团队绩效和组织绩效持续保持积极关联。
顽固的结果：AI与摩擦和倦怠没有可测量的关系，并且它继续与软件交付稳定性保持着有害的关系。
AI对专业开发人员的社会认知影响：AI的采纳并未显著影响开发者体验其工作生活的方式。

DORA AI能力模型

七项AI能力：
- 清晰且已传达的AI立场
- 健康的数据生态系统
- AI可访问的内部数据
- 强大的版本控制实践
- 小批量工作
- 以用户为中心
- 高质量内部平台
AI能力的影响：这些能力被证明能够扩大AI采纳的益处，放大AI对绩效的积极影响。

平台工程

平台现状：平台采用已近乎普及，90%的组织至少采用了一个平台，76%的组织至少有一个专属平台团队。
整体体验至关重要：用户将他们的平台视为一个单一的实体，其整体有效性比平台中任何单个功能的质量都更为重要。
平台能力相关性矩阵：与积极用户体验最相关的能力是为任务提供清晰的反馈，“用户界面简洁明了”的相关性较低。
绩效、福祉和风险的倍增器：一个高质量的平台在各个方面都具有广泛、统计学上积极的影响，与更高的组织绩效、产品绩效和生产力相关。
平台时代的三大要务：
- 拥抱整体体验
- 将平台视为旨在改善开发者体验的内部产品
- 利用你的平台来校准你的风险偏好

价值流管理

价值流管理的原则：
- 从思维混乱到共享地图
- 关注流动，而非仅仅是速度
- 创建持续改进的文化
- 建立在卓越技术的基础之上
VSM (价值流管理) 推动团队绩效：持续审查和改进其价值流的团队，其绩效报告显著更高。
VSM 带来更有价值的⼯作：这些团队将更多的时间花在对组织及其客户至关重要的工作上。
VSM 提升产品绩效：最终，这种对价值流的关注转化为更好的产品成果。

AI的镜子：AI如何反映并放大你组织的真实能力

AI影响的图景：AI的使用对吞吐量、代码质量以及团队和组织绩效等结果的影响，始终通过七项能力得到了显著增强。
组织是系统，而非个体的总和：要理解如何将AI的影响从个人生产力提升扩展到组织层面的收益，我们需要思考系统。
突破工具限制，推动AI影响力：AI有潜力重塑软件的构建方式，但它本身不会改变组织系统。
AI既是镜子，也是倍增器：AI能揭示哪些方面运作良好，加速已在进行的进程，但同时也会暴露需要改变之处。
AI：技能发展的威胁——亦是机遇：AI的采用可能会改变传统的学徒制模型，组织需要利用AI本身来同时衡量技能发展和生产力。

度量框架

选择合适的测量框架以适应组织目标：框架将一个广泛的主题分解为可衡量的不同概念。
衡量软件开发常⽤的框架类型：开发者体验、产品卓越性、组织效率。
在人工智能时代应用衡量框架：随着技术的出现，衡量可能必须进行调整，以包含不同的用户画像并捕捉不断变化的工作流。
在人工智能时代应用衡量框架：你可能会想，将AI引入开发工作流会改变一切吗？是沿用现有框架还是需要新的框架？我们建议仔细考虑实际需要改变什么，尤其是在考虑AI的影响时。

最终思考：从洞察到行动

关注用户：AI的广泛采用表明组织已不能再忽视其使用带来的影响。
将研究付诸实践：利用DORA的发现来制定假设并在您的团队中进行测试。
加⼊对话：通过加入DORA社区，分享您的经验，向同行学习，并寻找灵感。

Google Cloud出品⽩⾦赞助商：Swarmia /thoughtworks⻩⾦赞助商：Buildkite CodeRabbit DATADOG Deloitte. harness JELLYFISH OctopusDeploy OPSRA⾸席研究合作伙伴：REVOLUTION研究合作伙伴：GitHub GitLab skillbench Workhelix ⽬录 1.执⾏摘要2.前⾔3.理解您的软件交付绩效4.AI的采纳与使⽤5.探索AI与关键成果的关系6.DORA AI能⼒模型(Capabilities Model)7.平台⼯程(Platform engineering)8.价值流管理(Value stream management)9.AI之镜：AI如何反映并放⼤您的组织真实能⼒10.度量框架(Metrics frameworks)11.最终思考：从洞察到⾏动第⼀章：执⾏摘要关键启示：AI是⼀个放⼤器 2025年，技术领导者⾯临的核⼼问题不再是“是否”应该采纳⼈⼯智能(AI)，⽽是“如何”实现其价值。DORA的研究涵盖了超过100⼩时的定性数据，以及来⾃全球近5,000名技术专业⼈⼠的问卷回复。这项研究揭示了⼀个关键真相：AI在软件开发中的主要作⽤是⼀个放⼤器。它能放⼤⾼绩效组织的优势，也能放⼤表现不佳组织的弊病。 AI投资的最⼤回报并⾮来⾃⼯具本身，⽽是源于对底层组织系统的战略关注：内部平台的质量、⼯作流程的清晰度以及团队的协作⼀致性。缺乏这个基础，AI只能创造局部的⽣产⼒提升，⽽这些提升往往会因下游的混乱⽽⽩费。主要发现本报告基于2025年6⽉13⽇⾄7⽉21⽇期间进⾏的定性数据分析和全球调查，揭示了AI辅助软件开发现状的⼏项主要发现，包括：⼈⼯智能(AI)的采⽤已接近普及。⼤多数受访者(95%)现在依赖AI，并且超过80%的受访者认为AI提⾼了他们的⽣产⼒。然⽽，有相当⼀部分受访者(30%)⽬前表示对AI⽣成的代码⼏乎不信任，这表明亟需关键的验证技能。详情请阅读《AI采⽤与使⽤》章节。 AI的采⽤现在能提⾼软件交付吞吐量，这与去年相⽐是⼀个关键转变。然⽽，它仍然会增加交付的不稳定性。这表明，尽管团队正在适应追求速度，但其底层系统尚未演进到能够安全地管理AI加速的开发。详情请阅读《探索AI与关键成果的关系》章节。成功的AI采⽤不仅仅需要⼯具。我们新的DORA AI能⼒模型(DORA AI Capabilities Model)确定了七项基础实践——包括清晰的AI政策、健康的数据⽣态系统和以⽤户为中⼼的关注点——这些实践已被证明能够扩⼤AI对组织绩效的积极影响。详情请阅读《DORA AI能⼒模型》章节。今年的研究确定了七种不同的团队画像，从“和谐⾼效的团队(harmonious highachievers)”到“陷⼊遗留瓶颈的团队(legacy bottleneck)”，为有针对性的改进提供了⼀个新框架。详情请阅读《了解你的软件交付绩效》章节。价值流管理(Value Stream Management, VSM)是⼀种可视化、分析和改进从构想到客户的⼯作流动的实践，它能作为AI的倍增器(force multiplier)，确保局部⽣产⼒提升转化为团队和产品绩效的可衡量改进。详情请阅读《价值流管理》章节。90%的组织已采⽤平台⼯程(Platform Engineering)，使得⾼质量的内部平台成为AI成功的必要基础。详情请阅读《平台⼯程》章节。 AI影响的图景 AI采⽤对关键成果的估计影响，具有89%的可信区间对于橙⾊标注的成果，例如倦怠(Burnout)，负⾯影响是可取的。对技术领导者的分析和建议成功的AI采⽤是⼀个系统问题，⽽⾮⼯具问题 DORA新的AI能⼒模型揭示，AI的价值并⾮由⼯具本身决定，⽽是由其周围的技术和⽂化环境所释放。我们确定了七项基础能⼒——包括清晰的AI政策、健康的数据⽣态系统、⾼质量的内部平台以及以⽤户为中⼼（User-centric）的关注点——这些能⼒已被证明能放⼤AI对绩效的积极影响。将你的AI采⽤视为⼀场组织转型。最⼤的回报将来⾃于投资那些能够放⼤AI优势的基础系统：你的内部平台、数据⽣态系统以及团队的核⼼⼯程实践。这些要素是将AI潜⼒转化为可衡量的组织绩效的必要先决条件。⼴泛采⽤AI，但保持健康的审慎态度尽管⼤多数开发者使⽤AI来提⾼⽣产⼒，但对其产出质量仍存在健康的审慎态度。这种“信任但验证”的⽅法是成熟采⽤的标志。讨论必须从“采⽤”转向“有效使⽤”。你的培训项⽬应该专注于教导团队如何批判性地指导、评估和验证AI⽣成的⼯作，⽽不是仅仅⿎励使⽤。团队绩效的七种画像简单的指标已不⾜够。我们确定了七种截然不同的团队画像，每种都具有独特的绩效、稳定性和幸福感（Well-being）组合。这个模型提供了⼀种细致⼊微的⽅式来理解团队的具体挑战，并创建量身定制的改进路径。利⽤这些画像来诊断团队健康状况，超越软件交付绩效指标。了解⼀个团队是⾼绩效但⾯临倦怠，还是稳定但受困于遗留系统，并采取正确的⼲预措施。⾼质量平台释放AI价值平台⼯程（Platform Engineering）现已⼏乎普及（94%的采⽤率）。我们的数据显示，⾼质量内部平台与组织释放AI价值的能⼒之间存在直接关联。将平台视为旨在改善开发者体验（Developer Experience）的内部产品的组织，将获得显著更⾼的回报。优先投资并资助你的平台⼯程计划。糟糕的开发者体验和零散的⼯具可能会阻碍你的AI战略产⽣影响。系统视⻆指引AI潜⼒今年的研究证实，价值流管理（Value Stream Management, VSM）能够带来集中的改进，从⽽提升团队和产品绩效。价值流管理(VSM)作为AI投资的倍增器。通过提供系统级视图，它确保AI被应⽤于正确的问题，将局部的⽣产⼒提升转化为显著的组织优势，⽽不是简单地制造更多的下游混乱。本报告的使⽤说明本报告详细介绍了这些发现背后的数据，包括我们全新的DORA AI能⼒模型(DORA AICapabilities Model)，该模型确定了能够放⼤AI益处的关键实践。尽管每个组织都是独⼀⽆⼆的，但我们的研究结果提供了⼀个框架，可以为您的战略提供参考并指导您的团队。利⽤这项研究来提出假设、开展实验并衡量结果，以发现哪些因素能在您的特定背景下带来最⾼的绩效。为什么要加⼊DORA社区？ DORA社区为专业⼈⼠提供了⼀个平台，让他们可以参与这项研究并将其应⽤于改善⾃身的组织绩效。您应该成为DORA社区⼀部分的⼏个原因：向专家和同⾏学习：社区提供机会，通过演讲和讨论向特邀演讲者和其他成员学习。及时了解研究进展：成为第⼀个了解DORA新信息和出版物的⼈。协作与讨论：DORA社区Google⼩组提供了⼀个论坛，⽤于异步对话、公告和活动邀请。这使得成员能够讨论话题并与该领域的其他⼈分享他们的经验。参与社区活动：DORA.community上提供了线上和线下活动的⽇历。为对话贡献⼒量：通过倾听、交谈和参与聊天来为对话贡献⼒量。社区重视成员的意⻅，并为关于领导⼒、团队赋能和技术实践演变等话题的持续讨论提供了⼀个空间。第⼆章：前⾔许多⼈认为，科学的⽬标是⽤最少的原理来解释最多的可观测现象，以证实根深蒂固的直觉，并揭示令⼈惊讶的洞察。⼗多年来，DORA研究项⽬正是这样做的。今年的研究成果让我们对如何利⽤AI改进软件有了更深⼊的理解，这令我感到⾮常兴奋。 Gene Kim Vibe Coder,《Vibe Coding》,《凤凰项⽬》,《DevOps⼿册》,《加速》合著者 2013年，我有幸与Nicole Forsgren博⼠和Jez Humble共同开展了DevOps现状研究(State ofDevOps research)。这项⼯作成为了DevOps研究与评估⼩组(DevOps Research andAssessment group)——简称DORA——的基础，该⼩组于2018年成为Google Cloud的⼀部分。对于许多⼈来说，很难相信仅仅⼗多年前，软件部署还是危险⽽复杂的。它们需要细致的规划和审批，并且通常涉及数百个有⻛险、易出错的⼿动步骤。尽管经过了周密的计划和细致的考量，部署仍然会造成巨⼤的混乱和中断，这也是我们每年只敢进⾏⼀次部署的原因。 2013年，DevOps现状研究表明，每天进⾏多次部署并⾮异想天开，并且可靠性似乎需要更频繁地进⾏⼩规模部署。更令⼈兴奋的是：你⽆需身处初创公司或硅⾕(Silicon Valley)。你只需要卓越的技术实践（例如，⾃动化构建、⾃动化测试、⾃动化部署、主动式⽣产遥测(proactive productiontelemetry)）、⽀持独⽴⾏动的架构（即能够独⽴开发、测试和部署价值，⼏乎或完全没有协调成本的能⼒），以及⼀种学习⽂化。如今，12年过去了，作为⼀个技术社区，我们再次⾯临⼀项引⼈注⽬的新技术——AI。正如⼗年前我们所做的那样，我们正在⾃问：这项新技术是否真的能提升软件交付和组织绩效？ 2024年，DORA发布了⼀份具有⾥程碑意义的报告，衡量了AI对软件交付性能(softwaredelivery performance)的影响，这是同类研究中⾸批系统性研究之⼀。研究结果令⼀些⼈感到震惊。数据显示，AI的使⽤越多，软件交付的稳定性(stability)和吞吐量(throughput)就越差——⽽这些正是软件开发专业⼈员在过去⼗年中⼀直致⼒于改进的属性。是的，我曾亲眼⽬睹并亲身体验过使⽤AI会带来的问题，从悄⽆声息地删除测试、明显损坏的功能，甚⾄到删除⽣产数据。但我也看到过AI被⽤于⼤规模改善结果。我将去年的报告及其发现称之为“DORA 2024异常现象”——⼀个亟待解决的激动⼈⼼的谜团。这⼀信念的形成，源于我过去⼀年与Steve Yegge的合作。他在Amazon和Google⼯作了20年，享有盛誉。他曾记录了Amazon创始⼈Jeff Bezos的⼀份备忘录如何推动Amazon从⼀个软件单体（monolith）架构转型为数千个微服务（microservices）。这⼀转变使得Amazon在2015年实现了每天136,000次部署，这⼀成就多年来⼀直是DORA研究的灵感来源。 Steve和我合著了⼀本即将出版的书，名为《Vibe Coding》。在书中，我们将“vibe coding”定义为任何不通过⼿动敲击键盘编写代码的编码形式。相反，代码是在与AI进⾏迭代对话中产⽣的。我们描述了vibe coding如何改变了我们的⽣活——它使我们能够更快地构建所需之物，追求更宏伟的项⽬，更⾃主地⼯作，享受更多乐趣，并探索⼴阔得多的选择空间(FAAFO!)。 Steve和我看到了使⽤vibe coding可能出错的情况，例如导致测试被删除、系统中断（outages），甚⾄代码仓库（code repositories）被删除。但我们得出结论，这是因为⼏⼗年来⼀直为我们所⽤的⼯程直觉，如今已远远不⾜以应对新的挑战。假设你最快的⾏进速度是步⾏，每⼩时四英⾥，⽽有⼈让你以每⼩时50英⾥的速度驾驶汽⻋。如果没有练习和训练，你⽆疑会把⻋撞毁。我们得出结论，当AI显著加速软件开发时，我们的控制系统——也就是我们⾃身——也必须加速。换句话说，DORA⻓达⼗年的研究很可能已经表明，整个软件开发⾏业的实践必须不断演进。我们需要快速的反馈循环（fast feedback loops）——⽐以往任何时候都快——以适应AI加速的代码⽣成。我们需要在能赋予我们⾏动独⽴性的软件架构（software architectures）中⼯作——⽐以往任何时候都更需要能够独⽴地开发、测试和部署软件。我们需要⼀种学习的氛围，尤其考虑到AI的特异性及其快速发展的速度。在《Vibe Coding》⼀书

点击免费查看完整报告