HeterogeneousComputingPowerCoordinationWhite Paper 编写单位 中国信息通信研究院科大讯飞股份有限公司上海壁仞科技股份有限公司 中国电信股份有限公司 编写组成员(排名不分先后) 陆钢、黄志兰、孙梦宇、王亚森、朱泽亚、王子潇、林显成、苏昱臻、刘圆、郭雪芳、陈映、傅德基、任佳伟、师春雨、朱元瑞、栗蔚、刘如明、王润岩、敖玉龙、常韬、李志宇、秦亚庆、施晶峰、周明耀,陈龙,臧路、丁云帆、李志、奚林兴、申有志 版权声明 本研究报告版权属于全球计算联盟。 使用说明:未经全球计算联盟事先的书面授权,不得以任何方式复制、抄袭、影印、翻译本文档的任何部分。凡转载或引用本文的观点、数据,请注明“来源:全球计算联盟”。 序 当前,人工智能技术正以前所未有的速度重塑着世界,从ChatGPT引发的大模型热潮,到多模态AI应用的蓬勃发展,再到各类智能体的不断涌现,每一次智能技术的突破都推动算力需求呈现百倍级增长,需要不同芯片商、不同代际的各类异构算力芯片齐头并进。 然而,因芯片架构不同、通信协议不统一、算存传能力差异而导致的异构算力碎片化、生态割裂及协同效率不足等问题日益显现。构建统一计算、统一通信、统一调度和统一评测的异构算力协同体系,实现异构算力间的无感知计算、无阻碍通信协作、资源的高效调度和自动化测评,是推动异构算力基础设施迈向新阶段的关键路径。 本白皮书通过系统性梳理算力产业发展现状、异构算力协同体系架构、关键技术、解决方案与实践和未来技术展望,促进产业界对异构算力协同领域的深入理解,加速技术成果的产业化应用。全球计算联盟智能计算产业发展委员会将与产学研各界合作伙伴携手共进,推动国产算力底座性能持续跃升、异构算力协同生态日趋繁荣,为人工智能时代的到来铺设更加坚实的算力基石! 全球计算联盟智能计算产业发展委员会2025年7月 目录 第一章算力产业发展现状..............................................................................................................31.1算力发展趋势.....................................................................................................................31.2算力发展现状.....................................................................................................................41.3异构算力的定义与内涵.....................................................................................................51.4异构算力协同挑战..............................................................................................................6第二章算力协同体系架构..............................................................................................................8第三章异构算力协同关键技术....................................................................................................103.1统一计算技术...................................................................................................................103.2统一互联技术...................................................................................................................123.3统一调度技术...................................................................................................................153.4统一评测体系...................................................................................................................18第四章异构算力协同解决方案与实践........................................................................................204.1“一模多芯”异构混池训练............................................................................................204.2低成本异构混合推理.......................................................................................................22第五章未来技术展望....................................................................................................................255.1芯片级:新计算范式芯片...............................................................................................255.2主机级:超节点算力异构...............................................................................................255.3集群级:跨域异构算力协同...........................................................................................255.4场景融合:四算一体.......................................................................................................26第六章结论与展望........................................................................................................................27 第一章算力产业发展现状 1.1算力发展趋势 在政策与需求的双重引擎驱动下,中国算力产业已驶入高速发展的快车道。一方面,政策端持续加码,自2017年7月以来,《新一代人工智能发展规划》率先提出“建设高效能计算基础设施,强化超级计算中心对人工智能应用的服务能力”,为算力发展奠定基调;2020年4月,“新基建”战略进一步把数据中心、智能计算中心列为核心,全面鼓励产业高质量跃升;随后,《“十四五”数字经济发展规划》、《数字中国建设整体布局规划》和《关于推动新型信息基础设施协调发展有关事项的通知》等政策密集出台,系统优化全国算力布局,引导智算中心有序落地、协同发展。另一方面,需求端爆发式增长,人工智能大模型迭代进入“多模态+AI(ArtificialIntelligence)智能体”阶段,对高并发、高能效、低延时提出新的要求,持续倒逼芯片、架构与系统级创新,需求与政策同频共振,正将中国算力产业推向新一轮技术革命。 通用算力、智能算力、超算算力均保持高速增长,智能算力在增长竞赛中跑出“超级加速度”。2025年,全球总算力已攀升至约3300EFLOPS,在三大主流形态中,通用算力约为1150EFLOPS,占比首次跌破35%,降至34.8%;智能算力则因大模型和AI智能体应用的持续井喷,规模激增至1980EFLOPS,占比已高达60%,成为拉动全球算力增长的核心引擎;超算算力虽然绝对值较小,但也扩张至约170EFLOPS,稳居5%左右的份额,继续在尖端科研与工程仿真中扮演“重器”角色。聚焦中国,智能算力已无可争议地成为中国算力版图的中坚力量,国务院新闻办公室举行新闻发布会宣布,截至2025年3月底,我国智能算力规模达到748EFLOPS,为海量数据计算提供智能底座。随着更多用户和场景加入,大模型的普及与应用落地带动了数据中心、边缘及端侧算力建设,从而驱动了算力需求的增长。预计到2026年,中国智能算力规模将进一步增长至1460.3EFLOPS,并在2028年达到2781.9EFLOPS。智能算力已不仅是技术底座,更是产业跃迁的“主引擎”,也将持续向千行百业渗透,成为撬动数字经济下一轮爆发式增长的核心支点。 1.2算力发展现状 国外以英伟达、AMD为首的两大芯片巨头凭借其技术优势,在算力领域长期占据领先地位,在全球范围内,两大芯片巨头占据全球算力市场34%的份额: (1)英伟达采用“单封装双芯粒”路线,把算力密度和内存带宽推到极致,也带来高耗电和高昂的成本,2025年推出BlackwellB200,并抛出2026–2027路线图,VeraRubin与RubinUltra已在路上,Rubin推理峰值50PFLOPS、HBM4内存288GB,FP4稀疏算力是B200的2.5倍。 (2)AMD把Chiplet思路发挥到极致,多颗小Die通过InfinityFabric灵活组合,用更低功耗拼出同级算力,MI350已支持FP4/FP6低精度格式,MI400将延续“多芯粒+大内存”策略,试图以性价比和能效比撕开英伟达的生态护城河。2025年6月的AdvancingAI大会上,AMD发布MI350系列(MI350X/MI355X),采用CDNA4架构、台积电第二代3nm、1850亿晶体管、288GBHBM3E、峰值2.3PFLOPS,与B200针尖对麦芒,2026年的MI400更将迈入2nm,432GBHBM4+19.6TB/s带宽,目标直指Rubin。 国内算力芯片起步晚但发展迅速,逐渐呈现“一超多强”的国产芯片产业格局,以下列国产芯片为例: (1)昇腾在AI算力基础软硬件产业格局中继续扮演“头雁”角色,搭建开放生态,形成“芯片一框架一集群一应用”的四级闭环,已支持建造多个万卡级集群,2025年推出384卡超节点新形态,最大算力可达300PFLOPS,48TB高速内存,配备创新的高速互联总线,实现384卡一台计算机运行,大幅提升大模型训推效率。 (2)昆仑芯三代XPU-R,自研XPU-Link全互联架构,搭建“芯片—XPU-Lite框架—千卡1.2TB/sXPU-Link集群—百度文心大模型”四级闭环,已在百度内部提供90%以上文心系列训练算力,日均稳态负载85%+。 (3)壁仞科技采用Chiplet架构设计大算力芯片,其首款GPGPU(Gene