STAT生成式人工智能鸿沟2025年人工智能在商业中的运用 麻省理工学院南达 Aditya ChallapallyChris Pease Ramesh Raskar Pradyumna Chari 2025年7月 注意 来自NANDA项目的人工智能实施研究初步发现评审意见:普拉杜马·查里,NANDA项目研究周期:2025年1月–6月方法论:本报告基于一项多方法研究设计,包括对300多项公开披露的AI计划进行的系统性回顾 ,对52个组织的代表进行的结构化访谈,以及通过四大主要行业会议收集的153位高级领导人的调查回复。免责声明:本报告所表达的观点纯属作者和审稿人的观点,并不反映任何所属雇主的立场。 保密须知:所有公司特定数据报价均已匿名化,以维护企业信息披露政策和保密协议,确保中立性,并防止任何商业进步或意见的感知。 1 目录 1. 执行摘要2. 生成式AI鸿沟的这边:高采用率,低转型率3. 为什么试运行停滞不前:鸿沟背后的学习差距4. 跨越生成式AI鸿沟:最佳建设者如何成功5. 跨越生成式AI鸿沟:最佳购买者如何成功6. 结论:弥合生成式AI鸿沟 2 执行摘要 尽管有 300 亿至 400 亿美元的企业投资于生成式人工智能,但本报告揭示了一个惊人的结果:95% 的组织没有获得任何回报。买方(企业、中型市场、中小企业)和构建者(初创公司、供应商、咨询公司)的结果如此明显地分化,以至于我们称之为生成式人工智能鸿沟。只有 5% 的集成式人工智能试点项目正在提取数百万的价值,而绝大多数仍然停滞不前,没有可衡量的损益影响。这种鸿沟似乎并非由模型质量或监管驱动,而似乎由方法决定。 像 ChatGPT 和 Copilot 这类工具已被广泛采用。超过 80% 的组织已经探索或试点了它们,近 40% 的组织报告了部署情况。但这些工具主要提升的是个人生产力,而非 P&L 绩效。与此同时,企业级系统,无论是定制还是供应商销售,正被悄无声息地拒绝。60% 的组织评估了这类工具,但只有 20% 进入试点阶段,仅有 5% 进入生产阶段。大多数失败是由于工作流程脆弱、缺乏情境学习以及与日常运营脱节。 根据我们的访谈、调查以及对300个公共实装的分析,出现了四个定义“生成式AI鸿沟”的模式: •• 有限干扰:8个主要行业中只有2个显示出有意义的结构性变化• 投资偏见:预算倾向于优先考虑可见的、收入表顶线功能,而非高投资回报率的后台职能企业悖论大公司引领试点数量,但在规模化方面落后•实现优势外部合作的成功率是内部构建的两倍 扩展的核心障碍不是基础设施、监管或人才。它是学习。大多数通用人工智能系统不会保留反馈、适应上下文或在一段时间内改进。 一小部分供应商和买家通过直接解决这些限制来更快地取得进展。成功的买家要求针对流程的定制化,并基于业务成果而非软件基准来评估工具。他们期望 能与现有流程集成且能随时间改进的系统。满足这些期望的供应商正在数月内获得数百万美元的部署。 尽管大多数实施并未推动人员精简,但已经跨越了通用人工智能鸿沟的组织开始看到在客户支持、软件工程和行政职能方面的人员选择性影响。此外,表现最好的组织报告称,通过减少BPO支出和外部机构使用,尤其是在后台运营方面,实现了可衡量的节省。其他人则指出,通过自动外联和智能跟进系统,客户保留率和销售转化率得到了提高。这些早期结果表明,当学习型系统针对特定流程时,即使没有进行重大的组织结构调整,也可以创造真正的价值。 3 THEW蓉SIDE 的GENAI DIVIDEHIGHADOPTION, LOWT变换 要点:大多数组织都处于GenAI鸿沟的 wrong side(错误一侧),采用率高,但颠覆性低。九个行业中的七个显示出结构变化很小。企业正在试点GenAI工具,但很少达到部署阶段。像ChatGPT这样的通用工具被广泛使用,但定制解决方案因集成复杂且与现有工作流程不匹配而停滞。 当审视行业级别的转型模式时,“通用人工智能鸿沟”最为明显。尽管有高调的投资和广泛的试点活动,只有一小部分组织已经超越了实验阶段,实现了有意义的业务转型。 3.1 分割背后的破坏现实 要点:生成式人工智能鸿沟在行业层面表现得十分明显,尽管生成式人工智能的可见度高,但只有两个行业(科技和媒体)显示出明显的结构颠覆迹象,而其他七个行业仍然处于转型的另一边。 尽管投资规模巨大,行业层面的转型仍然有限。通用人工智能已被嵌入到支持、内容创作和分析用例中,但很少有行业展现出与过去通用技术相关的深层结构转变,例如新市场领袖的出现、商业模式的颠覆或客户行为的可衡量变化。 为了更好地量化颠覆程度,我们开发了一个复合型人工智能市场颠覆指数。根据五个可观察指标,对每个行业进行0到5分的评分。这些分数代表了五个维度上的标准化平均值,由公开指标和访谈得出的评估进行三角测量。测试了替代的加权方案,以确认行业排名的一致性: 1. 头部现有企业市场份额波动(2022年至2025年) 2.2020年后成立的AI原生公司收入增长3.新人工智能驱动商业模式的涌现4.由 GenAI 引用的用户行为变化5.由于人工智能工具导致的执行组织变更频率 敏感性分析:我们测试了五个干扰指标的不同权重。技术和媒体与电信在所有合理的权重方案中都保持领先排名,而医疗保健和能源始终处于较低水平。专业服务对权重变化最为敏感,根据对效率提升与结构性变化的侧重程度不同,其排名范围在1.2到2.1之间。 九大主要行业中,七行业显示出显著的试点活动,但几乎没有结构性变化。投资和颠覆之间的这种差距直接证明了规模化上的“通用人工智能鸿沟”,即广泛实验而无转型。 受访者们对评估直言不讳。一位中端制造业的首席运营官总结了普遍的看法: 领英上的炒作说一切都变了,但就我们的运营来说,根本性的东西没有任何改变。我们正在更快地处理一些合同,但这就是全部的变化。 3.2 从试点到量产的鸿沟 要点:生成式人工智能差距在部署率上最为明显,只有5%的定制企业人工智能工具达到生产。聊天机器人成功是因为它们易于尝试和灵活,但在关键工作流程中由于缺乏记忆和定制化而失败。这一基本差距解释了为什么大多数组织仍然处于差距的这边。 我们的研究揭示,在探讨 GenAI 采用工具和试点项目与实际实施之间存在着急剧的落差,通用解决方案和定制解决方案之间也存在着显著差异。 研究局限性:这些数据基于个人访谈而非官方公司报告,具有方向性准确性。样本量因类别而异,且成功定义可能因组织而异。 研究笔记:我们将成功实施的特定任务型生成式人工智能工具定义为:那些被用户或高管评价为显著且持续提升生产力与/或损益影响的工具 企业AI解决方案的95%失败率代表着GenAI鸿沟最清晰的体现。停留在错误一方的组织继续投资无法适应其工作流程的静态工具,而跨越鸿沟的组织则专注于学习型系统。 通用的大型语言模型聊天机器人似乎显示出很高的从试点到实施的转化率(~83%)。然而,这掩盖了感知价值的深层分歧,并揭示了为什么大多数组织仍然困在错误的一边。 在采访中,企业用户报告称,对于ChatGPT和Copilot等消费级工具,他们的体验始终是积极的。这些系统因其灵活性、熟悉度和即时实用性而受到称赞。然而,同一批用户对定制化或供应商推荐的AI工具持普遍的怀疑态度,将它们描述为脆弱、过度设计的或与实际工作流程不匹配。 正如一位CIO所说,“今年我们看了几十场演示。也许只有一个或两个确实有用。其余的都是包装或科研项目。” 虽然热情和预算通常足以启动试点项目,但将这些转化为与工作流程集成且具有持久价值的系统却很少见,这种模式定义了那些处于生成式人工智能鸿沟错误一方的组织所面临的体验。 企业,此处定义为年营收超过1亿美元的公司,在试点数量上领先,并将更多员工分配给人工智能相关的计划。然而,这种强度并未转化为成功。这些组织报告试点到规模化转化的比率最低。 相比之下,中市场公司行动更快、更果断。表现优异的公司报告从试点到全面实施的平均时间为90天。相比之下,企业需要九个月或更长时间。 企业中关于生成式AI的五个迷思 1.未来几年,人工智能将取代大多数工作→ 研究发现,生成式人工智能带来的裁员有限,且仅发生在已受人工智能严重影响的行业。高管们对于未来3-5年的招聘水平没有达成共识。 2.生成式AI正在改变企业采用率很高,但转型却很少。只有5%的企业将AI工具大规模集成到工作流程中,9个行业中就有7个没有出现真正的结构性变化。 3.企业采用新技术缓慢→ 企业对采用人工智能非常渴望,90%已认真探索购买人工智能解决方案。 4.阻碍人工智能的最大问题是模型质量、法律、数据和风险 →真正阻碍它的是大多数人工智能工具不学习和不能很好地融入工作流程。 5.最好的企业正在构建自己的工具→内部构建失败率是两倍。 3.3 阴影人工智能经济:弥合鸿沟的桥梁 要点:虽然官方企业举措仍然困在通用人工智能鸿沟的错边,员工们已经通过个人人工智能工具跨越了它。这种\"影子人工智能\"往往比正式举措带来更高的投资回报率,并揭示了真正有效弥合鸿沟的方法。 令人失望的企业部署数字背后隐藏着一个惊人的现实:人工智能已经正在改变工作,只是并非通过官方渠道。我们的研究表明,存在一个繁荣的“影子AI经济”,员工使用个人ChatGPT账户、Claude订阅和其他消费工具来自动化他们工作中很大一部分,通常无需IT知识或批准。 规模令人瞩目。尽管只有40%的公司表示他们购买了官方LLM订阅,但我们调查的90%以上的公司员工报告了经常使用个人AI工具完成工作任务。事实上,几乎每个人都以某种形式在工作中使用LLM。 在许多情况下,影子AI用户报告称,他们每天通过个人工具使用大型语言模型多次,以完成他们每周的工作任务,而他们公司的官方AI计划仍处于试点阶段。 这一影子经济表明,当个体获得灵活、响应迅速的工具时,他们可以成功跨越生成式人工智能鸿沟。那些认识到这一模式并在此基础上构建的组织代表了企业人工智能采用的未来。 具有前瞻性的组织正在通过学习影子使用情况并分析哪些个人工具在采购企业替代方案之前能够创造价值来弥合这一差距。 3.4 投资模式反映分裂 要点:投资配置揭示了通用人工智能鸿沟的现实,50%的通用人工智能预算用于销售和市场,但后台自动化往往能产生更好的投资回报率。这种偏见反映了更容易的指标归因,而非实际价值,并使组织专注于错误优先级。 从功能重点来看,对通用人工智能工具的投资高度集中。由于各组织的通用人工智能支出尚未正式量化,我们要求高管们为不同职能部门分配一笔假设的100美元。在我们的调查中,销售和市场职能部门占各组织人工智能预算分配的约70%。 研究笔记:虽然GenAI投资的总体功能分配(例如,约50%分配给销售与市场)在高管访谈中相对一致,但子类别和使用场景的细分应被视为仅具方向性。子类别反映的是综合笔记和轶事模式,而非精确核算。公司类型导致显著差异。例如,制造商和医疗服务提供商通常将很少的投资分配给销售与市场,并在运营方面过度倾斜。科技和媒体公司通常优先考虑营销、内容和开发者生产力。专业服务机构倾向于文档自动化和法律/合规工具。 销售和市场主导,不仅因为可见性,还因为成果可以轻松衡量。演示数量或电子邮件响应时间等指标直接与董事会级KPIs一致。 法律、采购和财务职能,相比之下,提供了更微妙的高效性。这包括更少的合规违规行为、简化工作流程或加速月末流程,这些虽然重要但在高管对话或投资者更新中很难揭示出来。 一家世界1000强制药公司的采购副总裁清楚地表达了这一挑战: 如果我购买一个工具来帮助我的团队更快地工作,我该如何量化这种影响?我该如何向我的CEO解释,因为它不会直接提高收入或降低可衡量的成本?我可以论证它有助于我们的科学家更快地获得他们的工具,但这与底线影响相去甚远。 这种投资偏好通过将资源投向可见但往往转型效果较少的应用案例,而维持了通用人工智能差距,同时,后端职能中最高投资回报率的机会仍然