AI智能总结
Google Cloud出品 ⽩⾦赞助商:Swarmia /thoughtworks⻩⾦赞助商:Buildkite CodeRabbit DATADOG Deloitte. harness JELLYFISH OctopusDeploy OPSRA⾸席研究合作伙伴:REVOLUTION研究合作伙伴:GitHub GitLab skillbench Workhelix ⽬录 1.执⾏摘要2.前⾔3.理解您的软件交付绩效4.AI的采纳与使⽤5.探索AI与关键成果的关系6.DORA AI能⼒模型(Capabilities Model)7.平台⼯程(Platform engineering)8.价值流管理(Value stream management)9.AI之镜:AI如何反映并放⼤您的组织真实能⼒10.度量框架(Metrics frameworks)11.最终思考:从洞察到⾏动 第⼀章:执⾏摘要 关键启示:AI是⼀个放⼤器 2025年,技术领导者⾯临的核⼼问题不再是“是否”应该采纳⼈⼯智能(AI),⽽是“如何”实现其价值。DORA的研究涵盖了超过100⼩时的定性数据,以及来⾃全球近5,000名技术专业⼈⼠的问卷回复。这项研究揭示了⼀个关键真相:AI在软件开发中的主要作⽤是⼀个放⼤器。它能放⼤⾼绩效组织的优势,也能放⼤表现不佳组织的弊病。 AI投资的最⼤回报并⾮来⾃⼯具本身,⽽是源于对底层组织系统的战略关注:内部平台的质量、⼯作流程的清晰度以及团队的协作⼀致性。缺乏这个基础,AI只能创造局部的⽣产⼒提升,⽽这些提升往往会因下游的混乱⽽⽩费。 主要发现 本报告基于2025年6⽉13⽇⾄7⽉21⽇期间进⾏的定性数据分析和全球调查,揭示了AI辅助软件开发现状的⼏项主要发现,包括: ⼈⼯智能(AI)的采⽤已接近普及。⼤多数受访者(95%)现在依赖AI,并且超过80%的受访者认为AI提⾼了他们的⽣产⼒。然⽽,有相当⼀部分受访者(30%)⽬前表示对AI⽣成的代码⼏乎不信任,这表明亟需关键的验证技能。详情请阅读《AI采⽤与使⽤》章节。 AI的采⽤现在能提⾼软件交付吞吐量,这与去年相⽐是⼀个关键转变。然⽽,它仍然会增加交付的不稳定性。这表明,尽管团队正在适应追求速度,但其底层系统尚未演进到能够安全地管理AI加速的开发。详情请阅读《探索AI与关键成果的关系》章节。成功的AI采⽤不仅仅需要⼯具。我们新的DORA AI能⼒模型(DORA AI Capabilities Model)确定了七项基础实践——包括清晰的AI政策、健康的数据⽣态系统和以⽤户为中⼼的关注点——这些实践已被证明能够扩⼤AI对组织绩效的积极影响。详情请阅读《DORA AI能⼒模型》章节。今年的研究确定了七种不同的团队画像,从“和谐⾼效的团队(harmonious highachievers)”到“陷⼊遗留瓶颈的团队(legacy bottleneck)”,为有针对性的改进提供了⼀个新框架。详情请阅读《了解你的软件交付绩效》章节。价值流管理(Value Stream Management, VSM)是⼀种可视化、分析和改进从构想到客户的⼯作流动的实践,它能作为AI的倍增器(force multiplier),确保局部⽣产⼒提升转化为团队和产品绩效的可衡量改进。详情请阅读《价值流管理》章节。90%的组织已采⽤平台⼯程(Platform Engineering),使得⾼质量的内部平台成为AI成功的必要基础。详情请阅读《平台⼯程》章节。 AI影响的图景 AI采⽤对关键成果的估计影响,具有89%的可信区间 对于橙⾊标注的成果,例如倦怠(Burnout),负⾯影响是可取的。 对技术领导者的分析和建议 成功的AI采⽤是⼀个系统问题,⽽⾮⼯具问题 DORA新的AI能⼒模型揭示,AI的价值并⾮由⼯具本身决定,⽽是由其周围的技术和⽂化环境所释放。我们确定了七项基础能⼒——包括清晰的AI政策、健康的数据⽣态系统、⾼质量的内部平台以及以⽤户为中⼼(User-centric)的关注点——这些能⼒已被证明能放⼤AI对绩效的积极影响。 将你的AI采⽤视为⼀场组织转型。最⼤的回报将来⾃于投资那些能够放⼤AI优势的基础系统:你的内部平台、数据⽣态系统以及团队的核⼼⼯程实践。这些要素是将AI潜⼒转化为可衡量的组织绩效的必要先决条件。 ⼴泛采⽤AI,但保持健康的审慎态度 尽管⼤多数开发者使⽤AI来提⾼⽣产⼒,但对其产出质量仍存在健康的审慎态度。这种“信任但验证”的⽅法是成熟采⽤的标志。 讨论必须从“采⽤”转向“有效使⽤”。你的培训项⽬应该专注于教导团队如何批判性地指导、评估和验证AI⽣成的⼯作,⽽不是仅仅⿎励使⽤。 团队绩效的七种画像 简单的指标已不⾜够。我们确定了七种截然不同的团队画像,每种都具有独特的绩效、稳定性和幸福感(Well-being)组合。这个模型提供了⼀种细致⼊微的⽅式来理解团队的具体挑战,并创建量身定制的改进路径。 利⽤这些画像来诊断团队健康状况,超越软件交付绩效指标。了解⼀个团队是⾼绩效但⾯临倦怠,还是稳定但受困于遗留系统,并采取正确的⼲预措施。 ⾼质量平台释放AI价值 平台⼯程(Platform Engineering)现已⼏乎普及(94%的采⽤率)。我们的数据显示,⾼质量内部平台与组织释放AI价值的能⼒之间存在直接关联。将平台视为旨在改善开发者体验(Developer Experience)的内部产品的组织,将获得显著更⾼的回报。 优先投资并资助你的平台⼯程计划。糟糕的开发者体验和零散的⼯具可能会阻碍你的AI战略产⽣影响。 系统视⻆指引AI潜⼒ 今年的研究证实,价值流管理(Value Stream Management, VSM)能够带来集中的改进,从⽽提升团队和产品绩效。 价值流管理(VSM)作为AI投资的倍增器。通过提供系统级视图,它确保AI被应⽤于正确的问题,将局部的⽣产⼒提升转化为显著的组织优势,⽽不是简单地制造更多的下游混乱。 本报告的使⽤说明 本报告详细介绍了这些发现背后的数据,包括我们全新的DORA AI能⼒模型(DORA AICapabilities Model),该模型确定了能够放⼤AI益处的关键实践。 尽管每个组织都是独⼀⽆⼆的,但我们的研究结果提供了⼀个框架,可以为您的战略提供参考并指导您的团队。利⽤这项研究来提出假设、开展实验并衡量结果,以发现哪些因素能在您的特定背景下带来最⾼的绩效。 为什么要加⼊DORA社区? DORA社区为专业⼈⼠提供了⼀个平台,让他们可以参与这项研究并将其应⽤于改善⾃身的组织绩效。 您应该成为DORA社区⼀部分的⼏个原因: 向专家和同⾏学习:社区提供机会,通过演讲和讨论向特邀演讲者和其他成员学习。及时了解研究进展:成为第⼀个了解DORA新信息和出版物的⼈。协作与讨论:DORA社区Google⼩组提供了⼀个论坛,⽤于异步对话、公告和活动邀请。这使得成员能够讨论话题并与该领域的其他⼈分享他们的经验。参与社区活动:DORA.community上提供了线上和线下活动的⽇历。为对话贡献⼒量:通过倾听、交谈和参与聊天来为对话贡献⼒量。社区重视成员的意⻅,并为关于领导⼒、团队赋能和技术实践演变等话题的持续讨论提供了⼀个空间。 第⼆章:前⾔ 许多⼈认为,科学的⽬标是⽤最少的原理来解释最多的可观测现象,以证实根深蒂固的直觉,并揭示令⼈惊讶的洞察。⼗多年来,DORA研究项⽬正是这样做的。 今年的研究成果让我们对如何利⽤AI改进软件有了更深⼊的理解,这令我感到⾮常兴奋。 Gene Kim Vibe Coder,《Vibe Coding》,《凤凰项⽬》,《DevOps⼿册》,《加速》合著者 2013年,我有幸与Nicole Forsgren博⼠和Jez Humble共同开展了DevOps现状研究(State ofDevOps research)。这项⼯作成为了DevOps研究与评估⼩组(DevOps Research andAssessment group)——简称DORA——的基础,该⼩组于2018年成为Google Cloud的⼀部分。 对于许多⼈来说,很难相信仅仅⼗多年前,软件部署还是危险⽽复杂的。它们需要细致的规划和审批,并且通常涉及数百个有⻛险、易出错的⼿动步骤。尽管经过了周密的计划和细致的考量,部署仍然会造成巨⼤的混乱和中断,这也是我们每年只敢进⾏⼀次部署的原因。 2013年,DevOps现状研究表明,每天进⾏多次部署并⾮异想天开,并且可靠性似乎需要更频繁地进⾏⼩规模部署。 更令⼈兴奋的是:你⽆需身处初创公司或硅⾕(Silicon Valley)。你只需要卓越的技术实践(例如,⾃动化构建、⾃动化测试、⾃动化部署、主动式⽣产遥测(proactive productiontelemetry))、⽀持独⽴⾏动的架构(即能够独⽴开发、测试和部署价值,⼏乎或完全没有协调成本的能⼒),以及⼀种学习⽂化。 如今,12年过去了,作为⼀个技术社区,我们再次⾯临⼀项引⼈注⽬的新技术——AI。正如⼗年前我们所做的那样,我们正在⾃问:这项新技术是否真的能提升软件交付和组织绩效? 2024年,DORA发布了⼀份具有⾥程碑意义的报告,衡量了AI对软件交付性能(softwaredelivery performance)的影响,这是同类研究中⾸批系统性研究之⼀。研究结果令⼀些⼈感到震惊。数据显示,AI的使⽤越多,软件交付的稳定性(stability)和吞吐量(throughput)就越差——⽽这些正是软件开发专业⼈员在过去⼗年中⼀直致⼒于改进的属性。 是的,我曾亲眼⽬睹并亲身体验过使⽤AI会带来的问题,从悄⽆声息地删除测试、明显损坏的功能,甚⾄到删除⽣产数据。但我也看到过AI被⽤于⼤规模改善结果。我将去年的报告及其发现称之为“DORA 2024异常现象”——⼀个亟待解决的激动⼈⼼的谜团。 这⼀信念的形成,源于我过去⼀年与Steve Yegge的合作。他在Amazon和Google⼯作了20年,享有盛誉。他曾记录了Amazon创始⼈Jeff Bezos的⼀份备忘录如何推动Amazon从⼀个软件单体(monolith)架构转型为数千个微服务(microservices)。这⼀转变使得Amazon在2015年实现了每天136,000次部署,这⼀成就多年来⼀直是DORA研究的灵感来源。 Steve和我合著了⼀本即将出版的书,名为《Vibe Coding》。在书中,我们将“vibe coding”定义为任何不通过⼿动敲击键盘编写代码的编码形式。相反,代码是在与AI进⾏迭代对话中产⽣的。 我们描述了vibe coding如何改变了我们的⽣活——它使我们能够更快地构建所需之物,追求更宏伟的项⽬,更⾃主地⼯作,享受更多乐趣,并探索⼴阔得多的选择空间(FAAFO!)。 Steve和我看到了使⽤vibe coding可能出错的情况,例如导致测试被删除、系统中断(outages),甚⾄代码仓库(code repositories)被删除。但我们得出结论,这是因为⼏⼗年来⼀直为我们所⽤的⼯程直觉,如今已远远不⾜以应对新的挑战。 假设你最快的⾏进速度是步⾏,每⼩时四英⾥,⽽有⼈让你以每⼩时50英⾥的速度驾驶汽⻋。如果没有练习和训练,你⽆疑会把⻋撞毁。 我们得出结论,当AI显著加速软件开发时,我们的控制系统——也就是我们⾃身——也必须加速。换句话说,DORA⻓达⼗年的研究很可能已经表明,整个软件开发⾏业的实践必须不断演进。 我们需要快速的反馈循环(fast feedback loops)——⽐以往任何时候都快——以适应AI加速的代码⽣成。 我们需要在能赋予我们⾏动独⽴性的软件架构(software architectures)中⼯作——⽐以往任何时候都更需要能够独⽴地开发、测试和部署软件。 我们需要⼀种学习的氛围,尤其考虑到AI的特异性及其快速发展的速度。 在《Vibe Coding》⼀书