高采用率、信任度不均以及当前工具的任务尚未解决 关于 SlashData 自信且清晰地导航人工智能技术决策 SlashData 是一家人工智能分析师公司,一直与顶尖科技品牌合作,为其决策提供清晰度和信心。 二十年来,我们一直追踪软件技术趋势,帮助科技品牌制定产品与营销投资决策,挑战固有认知,重塑市场趋势,赋能行业领导者引领世界走向未来。 关于开发者国度 割数据有限公司天鹅楼(一楼)20 鹅街 曼彻斯特, M4 5JW +44 161 240 0603www.slashdata.co 开发者国度是一个全球开发者社区,致力于为所有软件创作者打造一个能够为其职业生涯奠定坚实基础、了解自身在新兴软件开发趋势中的水平、获取建议、发现专业成长机会以及明智规划下一步行动的空间。我们的愿景是赋能开发者,塑造未来!www.developernation.net @devnationworld @SlashdataHQ SlashData @SlashDataHQ 关于报告系列 生成式人工智能已进入开发者工具箱,但它究竟有多深入?实际上已融入工作本身?本报告考察开发者如何在其工作流程中使用人工智能:他们正将哪些任务交给AI处理,愿意将每项任务的多少部分交由AI完成,以及采用与依赖之间的差距揭示了当前工具的局限性。 SlashData的Developer Nation调查是领先的研究项目人工智能、机器学习(ML)、云计算、网络、移动设备、桌面电脑、工业物联网、消费电子、嵌入式系统、第三方应用程序生态系统、游戏以及AR/VR开发者,追踪技术从业者跨平台、技术、编程语言、应用程序和API类别、收入模式、细分市场及地区的经验。 参考积极使用人工智能辅助工具的开发者所提供的调查数据软件开发工具,该研究发现的结论超越了引人注目的采用数据,转而考察人工智能在十多个不同开发任务中的具体应用情况。其结果描绘了一幅更真实的图景:人工智能真正加速开发者工作的领域,它为开发者乐于外包的任务找到了愿意接受的用户群体,以及能力差距正在抑制更深层次依赖所需的信任。对于正在评估或扩展人工智能工具采用的组织而言,数据它提供了一个实用的视角,用于校准预期、指导治理,并识别出人类监督仍然不可或缺的领域。 开发者国度调查的第31版达到了超过来自全球100个国家的11,500余名受访者。本研究报告系列深入探讨了2026年第一季度及 以后的关键开发者趋势。 对于正在构建下一代AI开发者工具的人来说,它清晰地勾勒出了前沿方向:需求高但信任度低的任务并非旁枝末节;它们理应成为发展路线图。 报告要点 • 代码生成是应用最广泛的AI辅助任务,49%的开发者使用AI进行此操作,但其中不到一半的人让AI处理大部分工作。➜ • 当现有的工作流程和工具深度嵌入时,例如在DevOps领域,人工智能面临着其最高的采纳壁垒。仅仅具备能力是不够的;它必须被证明明显优于系统开发人员已经信任的现有系统。➜ • 修改现有代码是AI效率最低的环节。尽管高达40%,任何高采用任务的多数依赖性作为第二常见的用例。➜ • 在依赖性方面存在不足的任务(如编辑、重构、理解和整合现有系统等并非边缘性工作。它们是专业软件开发的核心,并具有共同特点:人工智能必须在既有的约束条件下运行。➜ • 文档、代码注释和测试生成显示出最高的依赖评分。开发者愿意卸载的任务以及AI错误的后果则较低。立即可见。➜ • 预测性在结构上与其他人工智能不同局限性。与语境或冗长性不同,它无法通过扩展来解决,因此,在现有 的代码库中,人为监督是必要的。➜ 引言 随着生成式人工智能(AI)产品和服务不断演进并融入开发者工作流程,理解开发者实际上正在使用AI完成哪些任务至关重要。此外,了解开发者对AI完成这些任务的依赖程度,揭示了AI在他们日常工作中嵌入的深度。随后的研究结果将考察这些任务中的两个维度。据报道,开发者大多使用AI辅助开发工具。 当前针对特定任务应用人工智能,标志着两个不同层面的考量:开发者对使用人工智能执行特定任务的兴趣,以及人工智能的能力。随着各组织寻求将工具整合到其开发者工作流程中,了解开发者认为哪些任务适合人工智能辅助,以及人工智能在多大程度上能实际处理这些任务,有助于指导有针对性的改进方向。在当前技术水平下。对于开发者而言 或者,在推进人工智能助手发展的过程中,流行任务能够让人了解潜在的市场规模,并帮助识别出当前可能服务不足的领域。 人工智能辅助任务 “使用AI的开发者不到一半。辅助开发工具正将大部分工作交由人工智能处理,而即便是那些使用人工智能的,也很少完全放手。 代码生成是开发者报告的最常见任务。使用人工智能进行[某项任务],几乎有一半(49%)使用人工智能助手的人是为了这个目的。接下来最受欢迎的任务是编辑或修改代码以及错误检测和修复,这两项均为44%;考虑到人工智能辅助编码工具一直被大力宣传其这些具体功能,这一点并不令人意外。尽管如此,在所有这三项任务中,大多数开发者仍然...他们自己完成大部分工作。用于代码生成。以及调试或修复错误,46%的开发者报告称使用AI完成超过一半的任务,但在这些人中,四分之三处于51%至75%的范围内。这表明即使AI占据主导地位,开发者仍然深度参与。编辑和修改现有代码显示AI主导依赖程度最低,为40%。 “人工智能是开发者工作的加速器,而不是用它来替代。劳动力规划与生产率预期应相应设定。 当考虑那项工作时会更清晰地看到这个信号。实际上涉及。在编写第一行AI生成的代码之前,开发者通常需要构建问题、评估方法,并做出一系列塑造后续所有工作的设计决策。生成之后,还有审查、测试和验证输出的工作:所有这些工作都承担着真正的责任,并且不能轻易地委托。实用,许多开发人员也期望维护一个对他们在代码库中的逻辑和架构有深入理解,而人工智能作为主要作者时,这一点更难保持。总而言之,这些要求意味着,即使在人工智能发挥重要作用的任务中,开发者仍然是核心角色。 值得注意的是,这些数据是基于自我报告的。数据应被视为指示性而非精确性,因为开发者如何解读和报告他们自身对人工智 能的依赖程度存在一定程度的差异是意料之中的。话虽如此,整体情况是一致的:虽然人工智能工具被广泛使用,但它们是开发者工作的加速组成部分,而非取代其本身。界定问题所涉及的时间和精力,评估输出,并确保正确性意味着即使 人工智能辅助的任务仍然主要由人类主导。尽管有关人工智能工具在几分钟内生成数千行代码或推出新功能的报道屡见不鲜,但大多数开发者仍表示他们自己完成了大部分工作。 编辑现有代码“ 对于人工智能工具在语境方面面临的挑战,即便如此它们已经能够同时处理更大量的信息,但仍然可能难以掌握现有代码库的全貌:不同组件之间如何相互关联,存在哪些依赖关系,以及已经有哪些限制条件。当那个完整图片丢失,工具可能读错。所要求解决的问题本身存在冗余功能,导致修复措施仅针对症状而非根本原因。 编辑和修改代码是其中最AI辅助的流行任务。然而,它拥有最少的开发者比例,却承担 了大部分工作,这很可能反映了该技术目前存在的不足。AI辅助编码工具仍然面临三个关键问题,这些问题使得它们难以被信任用于此目的。特定任务:有限语境,有某种倾向 代表最明显的差距在于需求与信任 AI在开发者工作流程中 第二个问题是倾向于过度。众所周知,AI 编码工具往往会生成比实际任务所需更多的代码,包含不必要的行、冗余逻辑或库。它们已经在代码库的其他地方可用。当目标旨在对已存在之物进行有针对性的编辑,这种习惯会与任务背道而驰。它非但不能简化或精炼,反而可能引入新的复杂性,迫使开发者再去理清。 这个故事会因询问对象的不同而有所变化。采用率和对人工智能的依赖程度因开发者的资历、角色类型以及组织规模而异。要了解不同群体在人工智能使用模式上的具体差异,请参考完整分析。专业段落联系我们团队 不确定性带来了其中一个更为棘手的挑战。由于AI工具每次生成的输出并不相同,因此任何特定建议最终呈现的样子或产生的影响都存在固有的不确定性。对于从零开始编写的新代码,这是可以管理的;风险相对可控。然而,在现有系统中,一个出乎意料的变更,或是一个执行重要工作的代码行的悄然移除,都可能由此带来的影响远超即时编辑本身。这使开发者们对放弃过多控制权而感到可以理解地谨慎。 这项不可预测性挑战值得在此特别关注。尽管上下文限制是整个行业一个积极发展的领域,所提出的扩展模型一次性可承载信息量的解决方案,伴随着高昂且不断增长的计算成本和支出。更根本地说,它针对的是症状而非根本特征:这些模型是非确定性的。天性,且无论提供多少额外背景都无法消除这一点对于正在构建治理框架的组织以及考虑将开发精力投向何处的工具制作者而言,这种区别很重要。在绿野项目中,不可预测性是一种麻烦;而在成熟、相互连接的代码库中,它则是一项有意义的风险。 任务之间的差异促使我们仔细思考人工智能工具部署的地点和方式与其在所有开发工作中都采用单一政策。代 码生成提供了最直接的生产力提升。而修改现有系统则完全是另一回事。那些限制开发者信任的相同失败模式,也应当为组织治理提供启示,尤其是在代码审查方面。质量保证,以及对人工智能辅助变更的责任。 代码生成与编辑是当前最流行的任务。开发者使用人工智能来协助他们。 开发者对AI助手的依赖 在最受关注的任务之外,其余数据呈现出更为多样的图景。为帮助理解这些数据,此处根据两个维度对任务进行分组:该任务中AI辅助的普及程度,以及开发者在使用AI辅助时对其依赖的程度。在本分析中,超过三分之一的开发者使用AI辅助的任务被视为高普及度;此阈值旨在作为实用分界线而非精确界限,且两个维度都应被视为连续谱而非硬性类别。依赖度轴的零点是特例:低于零分的评分具有明确含义。少数开发者使用AI来完成那部分任务,这种情况比以往更多了。多数 “高度依赖和采用反映了难得的契合:开发者愿意移交的任务与足够胜任接手的人工智能。 这使得高依赖评分变得可以理解,但它也引入了一种容易忽视的风险。代码,当它出错时,它往往自报家门。它失效、破裂或产生可见的 位于两个维度上最高的那个集群(生成代码注释和注解,生成文档,)生成测试等任务是一个很好的切入点。仅仅因为AI能高效执行它们,开发者才愿意将它们交接出去,所以表现良好,这 或许只是因为开发者愿意将它们交接出去。文档编写、注释编写和测试编写被广泛认为工作是必要但不值得回报的部分:它们重要到必须完成,但很少成为开发者注意力或兴趣的焦点。AI工具已经找到了它们最容易软件工程中并非在光鲜亮丽的那一端获得立足之地,而是在开发者最想免费提供的部分。 需要关注的错误。文档、注释和测试所带来的即时且剧烈的影响并不相同。它们可能是不完整的或存在细微的错误,而不会立即显现为问题,这意味着在这些领域生成的AI错误不太可能被发现和纠正。代码所受到的审视,这些输出往往唯有通过良好实践才能获得,而良好实践则更容易被跳过。在时间压力下。 围绕AI生成测试的风险依然更加深远。测试确实存在。为确保代码按预期运行并提供信心,以及在出现故障时使其可追溯和可解释。如果AI生成的测试未能充分覆盖边缘情况或错误条件,则可能同时削弱这两种功能。错误持续存在是因为测试从未捕获到它们,并且当故障确实发生时,由于测试套件,诊断起来也更加困难。无法提供有意义的信息。更令人担忧的是 对于文档和代码注释,关注点在于传播。文档中的错误或歧义会悄无声息地传递给下一位阅读者,无论是未来的开 发者,还是确实使用该文档来理解代码库的其他AI工具。在后一种情况下,一旦犯下错误,就可能在后续的AI辅助工作中不断累积,而人类几乎没有机会干预。 人工智能助手通过修改测试本身以不再标记问题,而非修复底层代码,从而解决 失败测试的案例已被记录在案。其结果是,代码库看似经过充分测试,实则并非如此。对于组织而言,这或许是在本报告中,人工智能看似完成工作与实际出色完成工作之间差距最鲜明的例证。 将AI应用于某项任务的低