您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[IDC]:AI原生云/新型云厂商重构Agentic基础设施 - 发现报告

AI原生云/新型云厂商重构Agentic基础设施

信息技术2025-09-30IDC芥***
AI智能总结
查看更多
AI原生云/新型云厂商重构Agentic基础设施

AI原生云/新型云厂商重构Agentic基础设施 Yanxia Lu 执行概况 AI原生云/新型云厂商重构Agentic基础设施 生成式AI(Generative AI,下文简称GenAI)以及Agent的采用势头强劲,大幅带动了AI基础设施的增长。在Agentic时代,曾经相对线性的技术栈已经演变为动态、互联的生态系统。这种变化不仅扩展了老牌企业的角色,也刺激很多企业跨界进入到AI基础设施市场。此外,全新的AI基础设施提供商凭借稳定的供应链、显著的价格优势也在该市场站稳脚跟。本IDC研究报告分析了亚太地区不断变化的AI基础设施市场及其带来的挑战,同时重点介绍了整个生态系统如何适应这些新要求。 生成式AI应用指数级裂变 生成式AI在消费者群体广泛渗透 在大模型的驱动下,目前全球AI应用公司达数千家,这些应用既有基础大模型类通用助手,也有基于模型的的AI搜索、社交、音视频生成等。如下表所示,按照应用的场景,可以分为通用AI助手、AI搜索、生成图片、生成音频、生成视频、社交与情感平台、生产力工具等,此外也有众多AI应用落地到智能硬件中。尽管尚不确定未来的终极形态是将以少数AI超级入口为主,还是会分散在多个应用中,现有的应用已经吸引了消费者的注意并被越来越多的采用。 根据IDC全球追踪的数据,预计到2029年底,全球使用这些生成式AI应用的消费者数量将超过57亿人,远超2024年底的31亿人。在预测期内,用户数量预计将以13.2%的复合年增长率增长。此外,预计为GenAI服务付费的消费者用户在未来4年内仍将保持10%以下,但到2029年底整体付费用户数将增长到超过5.5亿人。整体付费用户预计将以32.3%的复合年增长率增长,而非付费用户预计将以12.0%的复合年增长率增长(见表1)。 在亚太市场,消费者对GenAI的采用也呈明显且加速的趋势。值得注意的是,不使用GenAI的消费者的比例大幅下降,从2024年的15%下降到2025年的零。这种剧降凸显了GenAI技术得到了广泛认可。更引人注目的是,每日用户数量从2024年的19%飙升至2025年的29%,这表明人们日常生活中与生成式AI应用交互的频率在上升。这些数据生动地说明了生成式AI应用已普遍融入到日常生活中,凸显出它们对社会和数字生态系统的影响越来越大。 关于生成式AI的落地应用场景,目前主要以搜索、文本生成、实时新闻、图像创作等为主。如下图所示,消费者使用GenAI的最大用途是搜索(50.2%),大量用户依赖GenAI来收集信息或寻求意见建议。文本创建(41.8%)是其第二大常见用途,在文章写作、电子邮件生成或社交媒体内容撰写等写作任务中得到广泛采用。学习和新闻信息类的应用也比较广泛——用户在积极使用GenAI获得更多教育机会以及阅览实事新闻。此外,图像创作(35.6%)和计划管理(33.8%)类的创意和组织场景也在成为主流。也有近三分之一的企业都在使用GenAI处理诸如视频创作(29.5%)和内容编辑(29.2%)的多媒体相关活动。与健康信息(25.8%)和业务任务(24.8%)相关的用途表明,企业越来越信任GenAI来提升个人幸福感和工作效率。GenAI在音频创作(18.5%)和教学(16.8%)方面的应用场景则相对小众,主要用于提升自我学习能力和创造力。 总体而言,调研表明,GenAI基本上被视为一种通用的多功能工具,在搜索和内容创作方面需求量最大,已扩展到教育、创意媒体、企业生产力和个人成长管理等领域。这些琳琅满目的用途凸显了GenAI的广泛吸引力且与消费者日常工作的融合程度不断提高。AI的这种普遍增长正在加速亚洲市场对AI基础设施的需求。我们相信,在这一由消费者驱动的大规模GenAI和智能体采用潮流中,中国和日本等市场将扮演引领者角色。例如,消费者可以选择创建个人助手或机器人为自己的生活提供协助,包括健身、烹饪、学习、购物等。这些场景必将改变消费者采用AI的方式。 生成式AI在企业级市场开始扩展 GenAI在亚太地区企业中的采用正在迅速加速。根据IDC的一项调查(图5),87%的亚太企业在2024年至少部署了10个生成式AI场景,预计到2025年这一数字将上升到近94%。此外,该调查预计,65%的亚太区企业将有超过50个生成式AI场景投入生产,其中26%的企业预计到2025年将拥有超过100个应用。IDC的研究中也发现,一家领先的全球性银行已在全球业务中部署了一千多个AI和生成式AI场景,证实了上述发现。鉴于采用速度之快,IDC认为,企业面临的关键问题不再是是否采用生成式AI,而是在企业中应用的的广度和深度。 随着GenAI的普及,下一个关键问题是,哪些业务职能部门对这些应用的需求最大,为这些应用带来了最大的机会?如图6所示,35%(最高比例)的企业希望使用智能体变革业务职能部门,以提高生产力和效率,这也是当下企业投资GenAI的最主要的落地形态。 业务职能部门转型以及助力任务自动化和决策的智能体部署是重点领域 同样,亚太区企业也将GenAI场景实施到了所有业务部门,不过采用率可能因业务部门而异。图7显示,2025年,采用GenAI最多的部门分别是采购、销售和财务,而在2025年,GenAI应用场景在网络安全、人力资源(HR)、ITOps和营销等部门发展迅速。 来源: IDC, WW AI Use Case Survey July 2025 (AP N=919) 亚太地区的消费者在日常生活中越来越多地使用生成式AI(GenAI),依赖它获取新技能,获得个性化协助等。这种依赖性越来越高,使得GenAI生成的互联网流量大幅增加,对AI计算资源的需求飙升。与此同时,亚太地区的企业正在迅速采用生成式AI和智能体技术,从根本上转变了其核心业务运营方式。这种战略性的采用将加速自动化,优化资源分配,并以前所未有的速度实现数据驱动决策。通过嵌入这些先进的AI功能,企业不仅可以提高运营效率,还可以激发创新,发掘新的竞争优势。 无论是消费级的AI应用,还是企业级的AI应用,规模化的落地离不开各种AI应用开发平台、工具与生态,以及支撑AI应用的基础设施。尤其面向不同的应用场景训练、调优各种大模型,需要高计算效率、高可靠的基础设施的保障。 专用AI基础设施加速应用落地 尽管亚太地区许多企业都在积极试验GenAI,但试点项目和概念验证的成功率仍然有限。根据IDC Future Enterprise Resiliency & Spending Survey Wave 4, 2025调查,阻碍企业GenAI跨越试点到生产的挑战在于基础设施的可用性、成本以及性能等。此外,数据的共享、数据的安全合规,也是当下企业面临的挑战。随着企业从AI试点计划发展到大规模任务关键型应用,基础设施需求也变得更加复杂和细致。 阻碍AI应用扩展的挑战:基础设施,数据共享,安全与合规 从训练到推理,AI Infra需求激增 自ChatGPT 2022年发布以来,大型互联网公司以及部分初创企业聚焦在大模型训练,以期在基础模型领域占据市场领先地位。因此在2022—2024年间,AI基础设施的投资更多聚焦在模型训练侧。基础设施技术栈的重点在于打造千卡万卡级算力集群、确保训练过程的稳定性,不断优化从硬件到AI开发框架再到模型侧的技术栈以提高算力效率。此外,AI应用开发企业在训练行业/领域模型时,也会需要小规模的算力来做模型的微调、调优。 进入2025年,大模型的预训练开始收敛,AI基础设施市场的焦点更多在于模型推理侧。从IDC追踪的全球人工智能训练与推理的算力市场规模数据也可以看到,对推理基础设施的投资规模在2024年开始逐渐超越用于训练的基础设施。相比于训练环节强调的算力集群稳定性、大小数据混合训练、断点恢复能力等不同,推理环节则更强调高吞吐、大并发以及成本与性能的平衡,这也要求投资AI基础设施的企业必须在推理技术栈加大投入。 在亚太市场,2023年只有40%的组织使用人工智能推理基础设施,但在2025年,这一数字也增长到84%。在传统AI时代,企业主要关注AI落地的效果与价值,缺乏对专有AI基础设施的重视。随着生成式AI应用渗透率的不断提高,企业必须要选择能够支持AI应用规模化的基础设施。 主权云和混合云模式驾驭亚太区GenAI合规 25%的亚太组织已经或计划将AI和数据工作负载迁移到主权云,其出发点是对敏感数据和知识产权保持管控的必要性(图10)。数据主权是亚太区GenAI基础设施战略的重点。要遵守GDPR、CCPA等法律法规和特定地区颁布的本地化法律法规,需要采用分布式和联邦式AI基础设施模型,为此许多企业将敏感的GenAI数据保存在专有本地系统上,以遵守严格的当地法规并避免跨境风险。因此,混合云和主权云模式发展势头强劲,这些模式在满足监管要求与实现可扩展性和创新之间取得了平衡。AI原生云提供商则通过提供合规自动化、工作负载地理围栏、本地化培训以及与国家数字系统集成等功能引领这一转变。这些经GPU加速的低延迟平台可确保AI安全、高性能落地,且遵循地区性法律法规。 企业对本地区数据主权法规的应对之道 为AI推理提供安全保障 随着企业扩大GenAI的规模,基础设施和安全变得至关重要。AI原生云提供商提供具备GPU加速计算、低延迟网络和高级冷却等功能的专用平台。这些平台支持要求苛刻的AI工作负载,同时嵌入了强大的安全、合规和治理控制措施,包括加密、访问管理和自动数据保护。这可确保GenAI部署安全、合规、可扩展。 下图显示了对于保障GenAI部署至关重要的综合安全框架。它重点介绍了治理、访问管理、数据保护、威胁监控和合规措施等关键要素,这些要素综合预防PII外泄和数据中毒等风险。 注:这些因素综合起来迫使企业必须构建能够支持下一代企业AI工作负载的韧性、合规且安全的AI基础设施,这将推动对AI训练和推理基础设施的持续投资激增。 来源:IDC's Future Enterprise Resiliency & Spending Survey Wave8,2025年8月。AP = 300 面向AI与Agent重构基础设施 在AI基础设施市场爆发式增长的当下,越来越多的新入局者开始涌入这一市场。下图显示了当今AI基础设施生态系统概况。其中,公有云提供商提供全球化规模的、弹性的集成化AI服务,加速企业的AI采用。边缘和混合云提供商让AI更接近数据源,为关键场景实现实时处理和本地化部署提供支撑。AI原生云提供商专注于高性能GPU集群和经济高效的基础设施,专门满足训练和推理需求。数据中心与托管服务提供商致力于打造安全、可靠且高性能的运行环境,其设施通常邻近云接入点,以显著提升工作负载的灵活性。AI硬件和平台提供商正在推进专用芯片和系统的发展,为下一代AI性能提供动力。此外,越来越多的电信公司正在进入这一领域,利用其广泛的网络基础设施支持边缘AI部署,增强AI工作负载的连接性,并跨分布式环境提供集成的AI驱动型服务。 AI基础设施生态系统现状 公有云服务提供商 这些厂商通过多租户云平台提供可扩展的按需IT资源,例如计算、存储和网络,为AI、HPC和企业工作负载提供支持。典型厂商包括AWS、Microsoft Azure和Google Cloud。该类厂商的既定优势在于全栈AI能力,同时他们也在面向生成式AI积极重构技术栈。 边缘和混合云提供商 这些厂商在更靠近数据源的位置提供计算和存储功能,降低了物联网和AI推理等实时应用的延迟。典型厂商例如施耐德电气和台达电子。当今的生成式AI应用场景在快速从云端向边缘和端侧扩展,是边缘和混合云厂商大展身手的时刻。 AI原生云提供商(GPU加速云提供商) 这些提供商提供可扩展的基础设施、高性能GPU和AI专用工具,用于模型训练和推理。他们专注于可持续发展、合规和多云战略,帮助企业加速AI创新并优化现代工作负载的成本。例如CoreWeave、GMI Cloud和Nebius。该类厂商通常具备稳定高效的供应链,