您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [IDC&宁畅]:新质算力发展白皮书:生成式AI驱动算力基础设施向纵深升级 - 发现报告

新质算力发展白皮书:生成式AI驱动算力基础设施向纵深升级

信息技术 2025-04-21 - IDC&宁畅 乐
报告封面

新质算力发展白皮书 生成式AI驱动算力基础设施向纵深升级 前言 报告主旨:为了推动新质生产力的发展,实现算力市场的高质量增长,IDC联合宁畅共同提出了新质算力概念,旨在帮助企业突破传统算力在成本、效率、灵活性和适用性等方面的瓶颈,加速以智能化场景为核心的业务融合创新进程。本白皮书在解读新质算力的基础上,为企业用户制定出算力效率雷达、算力建设路径图和算力产品选型标准,指引企业更加科学地规划、设计和建设面向未来的全栈AI算力基础设施,实现AI应用场景的全面落地,持续推动企业智能化转型升级和创新发展。 内容框架:今年以来,DeepSeek的异军突起引发了市场对生成式AI的新一轮关注,从模型结构、计算通信、训推流程、成本控制、开源生态等维度带来一系列创新,为企业用户带来更低门槛、更多样化的AI应用空间,基于其开源模型,只需要后续通过百卡结合客户数据微调即可打造垂直化业务模型。行业大模型、行业智能体正在向深化场景持续迈进,算力的使用需求也将随着垂直场景的爆发式发展呈现出多样化、定制化、精细化特征。未来推理所需要的算力将来会成为主要需求,但高质量、绿色发展一定是长期趋势,企业发展目标将从大算力转向高算效。 挑战:传统算力基础设施在技术架构、投资回报、使用效率等方面正显现出一些亟待解决的问题,大量的算力出现供需不匹配或脱节的现象。企业需要在驾驭算力使用效率、强化场景化算力匹配和管理调度能力、提升算力易用性和敏捷性、推动绿色节能等方面破解一系列挑战。 思路:全新定义的新质算力,从客户最为关注的算效提升、体系化管理、一体化调度以及应用落地优化等方面进行整体统筹,帮助企业突破传统算力服务的瓶颈,推动从算力到算效的全面思维转变。企业通过新质算力栈建设,还可以有效推动绿色计算理念的实践落地,建立持续改进的局面,在横向广度和纵向深度上共同实现创新突破。 行动:在算力中心建设和运行过程中,企业可围绕软硬协同、绿色节能、高效存储、网络互联、智能运维五个维度,形成算力运营效率的联合评估框架体系,并参考PEEIE算力设施产品选型标准,重点考评产品丰富度、关键性能指标、工程化落地支持、行业落地实践、服务与生态建设等能力指标。此外,企业还须重点关注面向智能化场景的算力需求,综合考虑自身的规模、资金现状、发展规划、市场环境以及技术发展趋势等因素,选择适合当前和未来发展的架构和定制化特性。 目录 第一章 新环境:生成式AI持续进化,企业算力场景加速爆发�� �.� 生成式AI规模化落地在即,算力市场进入高质量增长阶段�.� 算力场景需求持续深化���� 第二章 新挑战:传统算力基础设施效率低下,企业亟需升级服务�� �.� 算力粗放建设带来供需脱节�.� 企业算力建设面临五大挑战���� 第三章 新定义:新质算力帮助企业突破发展壁垒�� �.� 全新定义新质算力�.� 横纵联合,突破传统算力服务瓶颈�.� 从投入到产出全链条优化������ 第四章 新路径:算力效率雷达指引企业新质算力建设�� �.� 算力效率雷达联合评估算力运营效率�.� 企业新质算力建设路径图�.� 算力产品选型标准������ 第五章 新实践:新质算力建设场景和案例分析�� �.� 算力集群建设场景�.� 算力建设的实践案例及分析���� 第六章 IDC建议与未来展望�� �.� 机遇与挑战�.� 结语 �� 第七章 关于宁畅�� �.� 企业荣誉�� PART第一章 新环境:生成式AI持续进化,企业算力场景加速爆发 �.� 生成式AI规模化落地在即,算力市场有望进入高质量增长阶段�.� 算力场景需求持续深化 �.� 生成式AI规模化落地在即,算力市场进入高质量增长阶段 DeepSeek引发市场对生成式AI的新一轮关注,带来了生态的繁荣以及对模型开发的进一步思考。从生成式AI生态来看,DeepSeek在短期内接连发布新的模型并刷新榜单,以高质量、高可靠的推理过程和回答体验快速积累了庞大的用户群体。同时,低成本、开源特性也让DeepSeek相比OpenAI更加友好,促使全球和中国的AI技术供应商、云厂商纷纷在自有平台服务中上线支持DeepSeek模型,截止目前已有上百家技术供应商和企业宣布接入DeepSeek模型,这加速了AI对更广泛用户群体的覆盖。从模型开发来看,DeepSeek在全球产生巨大影响的核心是高性价比的模型训练和高质量的结果输出,通过MLA多头潜在注意力机制、MOE混合专家模型、GRPO组相对优化策略、MTP优化训练成本与同等最优模型相比大幅度降低。但需要强调的是,高性能算力仍然是打造领先AI大模型的基础,另一方面对于模型训练、优化、推理步骤的拆解,以及对算力资源的优化和全栈管理过程是实现工程化落地、突破技术壁垒的关键。 AI智能体(AIAgent)的广泛实践落地进一步带动了用户端的巨大变革,深刻影响各行各业的创新格局。AI智能体作为承载技术、业务和人智能化融合形式,正逐渐渗透到各行各业⸺从智能客服到虚拟业务助手,从智能家居到自动驾驶,应用场景愈发丰富多样,技术边界不断拓展延伸。与此同时,市场对AI智能体的认知与应用仍存在诸多盲点,技术选型、产品选型及具体实践应用中的挑战也亟待解决。 多样化的应用场景也让用户对算力基础设施的质量、效率提出了更高要求。服务端和用户端均涉及模型训练优化以及推理流程拆解时的算力资源全栈整合与持续优化问题。在智能化推动行业转型升级的大背景下,生成式AI将持续成为算力规模化和多样化发展的有力推手。IDC认为在AI战略的影响下,����年将会有更多的企业致力于在算力资源软硬件协同、算网协同、精细化/一体化管理、算子及编译优化等方面开展创新实践。 IDC的数据显示,中国智算服务市场规模增速显著。����年上半年,中国智算服务整体市场同比增长��.�%,市场规模达到���.�亿元人民币。其中,智算集成服务市场同比增长���.�%,市场规模达��.�亿元人民币;面向生成式AI的智算服务市场(GenAI IaaS)同比增长���.�%,市场规模达��.�亿元人民币;而其他AI IaaS市场则同比缩减��.�%,市场规模为��.�亿元人民币。 生成式AI的发展是带动算力市场快速增长的主要动力源。与传统AI领域的图像识别、语音识别和自然语言处理等相比,深度学习模型和通用AI旨在构建更加广泛的理解能力,面向复杂的行业业务,持续提升感知、认知和决策水平,推动更大范围的流程自动化、智能化。这意味着需要提供远超传统时代的大规模算力,用以支撑大模型的训练、精调、推理部署以及优化迭代。 生成式AI向行业纵深快速挺进,也会进一步对算力服务提出更加全面、更具效能、更精细化的要求。一方面,在算力需求旺盛的泛互联网、自动驾驶、智能制造以及科研教育等领域,大模型正在加速融入业务流程,大幅提升智能化服务水平和效率。在泛互联网领域,大量AI应用被快速开发和推广,通过交互式软件形态持续改变B端、C端用户的使用习惯。在自动驾驶领域,端到端大模型已经成为主流应用形态,让智驾系统快速适应更多、更复杂的路况;在智能制造领域,AI通过分析海量数据,优化生产工艺流程,预测设备故障,全面检测产品质量并持续提升生产效率。另一方面,生成式AI也在传统行业转型升级的过程体现出极大的应用价值。在农业领域,AI被越来越多的用于农情监测、病虫害防治以及作物生长周期管理;在医疗健康领域,AI持续学习海量医学影像资料,用于辅助诊断和治疗方案设计等。随着行业应用的不断深入,用户需要快速增强大模型的行业深度,通过模型精调、RLHF、Prompt等手段,强化大模型的专业理解力和决策力,因此,在未来一段时间里,各行业的算力需求仍会持续加速。 �.� 算力场景需求持续深化 为了应对行业发展的需要,一大批行业大模型、行业智能体正在不断迈向深化场景。IDC与宁畅联合研究发现,伴随垂直场景的发展,算力的使用需求日益呈现出多样化、定制化、精细化特征,如图�所示。 算力需求的多样化 首先是类型需求多样化,例如生成式AI的大模型训练和推理工作需要足够的计算密度,同时支持高效的内存访问和数据传输;科研、气象等领域的高性能计算(HPC)更关注强大的并行计算能力和高精度浮点运算;而交通、应急等行业在构建中心化算力的同时,还需要大量使用边缘算力设备。其次是性能需求多样化,例如互联网行业普遍看重算力设施的高效数据吞吐能力和低延迟响应,金融行业更关注算力的稳定性和实时性,而传统行业则更加需要算力设施具备自动化运维监控能力,以及对IoT、边缘算力设备的一体化集成能力。此外,一些行业对算力的成本、能效方面还有特殊要求。 算力需求的定制化 各行业应用场景将越来越复杂,传统的标准化算力服务模式愈发显得简单和粗放,无法满足企业用户的个性化需求。为了保证足够的经济性和适配能力,用户需具备对算力的灵活定制和优化能力。在定制化算力模式下,用户可以按照具体需求,灵活配置软硬件资源,搭建更加高效、经济的算力服务。例如,影像分析场景,可以增加高性能的数据并行存储和处理设备;行业推理场景,可以通过算力和网络的协同优化,使算力服务更加高可靠、低延迟。 算力需求的精细化 行业场景的持续深化过程,需要对算力资源进行更细致、更精准的管理和调度。例如多场景融合应用使算力规模和复杂度成倍增加,资源的使用效率和协同水平将显著影响综合成本和用户体验。算力的精细化管理包含了对算力资源的实时监控、算网协同以及动态优化回收机制等,保障算力资源在不同的业务场景下都能够得到合理的分配和高效的利用,从而帮助企业提升整体运营效益。 PART第二章 新挑战:传统算力基础设施效率低下,企业亟需升级服务 �.� 算力粗放建设带来供需脱节�.� 企业算力建设面临五大挑战 �.� 算力粗放建设带来供需脱节 IDC的调研数据显示:全球几乎所有地区、行业和企业的生成式AI资源投入都在快速增长。至����年��月,已经有��.�%的企业将若干生成式AI应用引入到生产中,并致力于持续进行扩展,这一数字比年初增长了一倍多。 值得注意的是,规模中小型的企业对于生成式AI的投资增幅更大,这也印证了大模型应用门槛降低所带来的加速渗透效应。 生成式AI的需求高涨引发了企业对算力服务市场的高度关注,但过去几年间建设的大量算力中心却常常无法与企业需求顺利对接,从而出现大量的供需脱节现象。目前,传统算力基础设施在技术架构、投资回报、使用效率等方面正在陆续显现出问题,随着规模和需求复杂度的增长,这些问题所带来的影响还将持续放大,阻滞行业发展和企业智能化升级过程。 盲目高投入推升算力投资风险:算力建设中的机房建设、软硬件采购和长期运维都涉及到大量资金的投入。在算力投资热潮中,很多算力中心单纯追求规模和性能参数,盲目做大设备规模。随着技术的快速进步和需求的频繁变化,算力基础设施的更新换代速度也会加快,使后续投入居高不下,一些地方已经出现过度投资和设施闲置的情况。 规划和设计能力不足导致供需对接不畅:很多算力中心在规划和建设时,没有进行相关的需求调研,盲目采购热门算力设备,并随意确定规模和技术指标,导致资源布局不合理、组件规模不匹配、内容缺项等严重问题。事实上,传统模式下建设的大量算力中心往往以采购硬件设备为主,大量的算力只能以裸金属形式交付给用户,使很多中小企业无法有效得到算力赋能。 算力中心综合运营效率亟待提升:由于算力资源管理和调度方面的技术能力严重不足,算力设施整体利用率和使用效率不高,设备闲置比例过大。很多算力基于整机进行分配,算力浪费现象十分严重,给用户带来额外的经济负担。更值得关注的是,算力市场的整体服务机制不健全,应用推广力度普遍不足,导致算力方面的投资没有给企业带来降本增效的成果,不能充分体现出智能化升级带来的效益提升。此外,在算力使用过程中还可能存在恶意入侵、数据泄露、应用中断等安全风险,进一步带来直接和间接经济损失。 �.� 企业算力建设面临五大挑战 随着行业算力场景的深化和日趋复杂,大量传统算力基础设施逐渐难以满