北京金融科技产业联盟2026年2月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、摘编或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 黄程林翁晓俊 编写组成员: 马超裴凯洋吴建波于淼郭振宇张林李银凤周炜昕张硕姚远朱佑虹杨志涌陈文王勇梁佳荣蒋钢李伟波方宏宽汪尔敏齐璇战茅许高峰杨景瑞李一昂陈理想崔雨萍王滢武耀文穆文楷方如利齐贝贝左麟黄承伟曹竞男张淮声陶中玉 编审: 黄本涛周豫齐 参编单位 北京金融科技产业联盟秘书处中国工商银行股份有限公司中国光大银行股份有限公司中国人民保险集团股份有限公司浪潮电子信息产业股份有限公司中兴通讯股份有限公司麒麟软件有限公司飞腾信息技术有限公司海光信息技术股份有限公司中国移动通信集团有限公司政企客户分公司格兰菲智能科技股份有限公司 前言 近年来,人工智能与各行业各领域广泛融合,工信部、网信办等部门陆续出台多项关于算力等信息基础设施的文件,提出优化算力布局、提升智能算力占比、推动绿色低碳发展,鼓励算网协同与普惠性算力服务等。2025年,国务院《关于深入实施“人工智能+”行动的意见》进一步强调构建全国一体化算力网与智算资源协同。这些政策共同形成顶层设计,为金融业AI基础设施建设指明方向。 当前,人工智能技术与金融业务深度融合,金融机构已广泛开展AI基础设施建设。为及时总结金融业AI基础设施建设的发展经验和创新思路,推动AI基础设施向高效、绿色、安全、协同的方向发展,特编制此报告,以期为金融机构AI基础设施建设提供前瞻性、可操作性参考。 本报告第一部分从政策、行业和技术3方面阐述了金融业AI基础设施的发展背景,分析了国内外AI芯片产业格局与金融业应用情况,提出“助力绿色数据中心建设”与“优化AI算力平台能力”两大研究目标。第二部分聚焦“推进AI基础设施建设优化”,系统论述绿色环保、存网算协同、云数智融合及安全可靠4个关键方向,并提供了具体技术路径与实施方案。第三部分选取中国工商银行、中国光大银行、中国人保三家机构,展示其在千卡规模AI算力云、GPU资源池化与弹性调度、液冷实验室建设等方面的创新实践。第四部分直面当前存在问题,指出AI芯片选型难、 异构芯片兼容性不足、传统机房改造挑战等现实困境。第五部分“发展展望”提出应围绕能效提升、供应链稳定与安全可控持续发力,并建议开展量子计算等前沿技术探索,为行业长远发展储备能力。 关键词:算力基础设施、绿色环保、存网算协同、云数智融合、安全可靠 目录 一、总述.............................................................................................................1 (一)研究背景.............................................1(二)现状分析.............................................7(三)研究目标.............................................9 二、推进AI基础设施建设优化....................................................................11 (一)绿色环保............................................11(二)存网算协同..........................................17(三)云数智融合..........................................21(四)安全可靠............................................23 三、金融业AI基础设施建设优秀案例分析................................................28 (一)中国工商银行千卡规模AI算力云建设...................29(二)中国光大银行云平台AI算力创新实践...................29(三)中国人保大模型智算液冷实验室建设....................30 四、存在问题...................................................................................................31 一、总述 (一)研究背景 2024年3月,“人工智能+”行动首次被写入政府工作报告。作为人工智能三大关键要素之一的算力是其中核心要素,是推动人工智能发展的基石。IDC最新预测结果显示,2025年中国智能算力规模将达到1,037.3EFLOPS,并在2028年达到2,781.9EFLOPS,2023—2028年中国智能算力规模五年年复合增长率达46.2%。中国人工智能算力基础设施发展呈现出多元化、服务化、场景化、绿色化等特征。如何绿色、便捷、高效地使用智能算力资源,将成为AI基础设施建设的一项重要任务。 1.政策背景 2024年8月,工信部等十一部门联合印发《关于推动新型信息基础设施协调发展有关事项的通知》。其中算力基础设施作为新型信息基础设施的重要组成部分,被重点提及。文件中具体强调,要优化布局算力基础设施、鼓励网络与算力设施协同发展、推进数据中心等重点设施绿色低碳发展等。国家在优化算力布局、推动算网融合发展、构建绿色低碳算力基础设施等方面进行了充分全面的战略顶层设计,以加速我国构建覆盖广泛、安全可靠、绿色高效的算力基础设施体系。 从2018年至今,工信部、发改委、中国科学院等多部门相继发布了指导类或支持类政策文件,如表1所示。尤其是近几年,我国在政策层面对算力基础设施的发展持续加码,如2023年10 月发布的《算力基础设施高质量发展行动计划》提出,到2025年,我国智能算力占比达到35%,东西部算力平衡协调发展。密集的政策表明国家层面正在不断加大投入力度,促进算力基础设施建设,优化布局结构,满足经济社会各领域对算力的旺盛需求。 2.行业背景 随着AI技术的飞速发展,AI应用已经渗透到金融行业的方方面面。OCR、指纹识别、语音识别等传统识别类AI技术早已和金融业务深度融合。 近几年,新兴的生成式AI技术也如雨后春笋般在金融行业落地,广泛应用到营销、风控、运营等多种关键业务中,极大提升了金融行业的服务水平。业界普遍认为,高质量的数据是AI发挥 价值的关键,而先进的数据基础设施则是汇聚高质量数据的先决条件。因此,构建可价值变现、可持续演进、具有业务韧性的金融数据基础设施,是金融行业在AI时代的必然选择,专业存储汇聚海量、高质量的数据,助力AI应用价值释放。在AI大模型掀起的浪潮之下,巨大的算力需求应运而生。因此,支撑算力能力提升的基础设施建设也备受行业关注。 3.技术背景 2025年,金融应用创新工作步入深水区,依托开源技术展开数字基础设施自主创新为金融行业新型数字基础设施建设提供了重要技术途径。当前,以芯片、一般业务系统和办公软件为代表的核心品类正加速释放,并逐步深入到核心关键业务系统。部分金融机构也实现了核心系统等关键应用从专有机型到通用服务器集群的迁移,部分大型金融机构基于开源技术开展自主研发,基本实现可以支撑自身要求的新型数字基础设施。 但是金融领域AI基础设施建设不是简单的替换,在打造金融行业新型数字基础设施的过程中,除了投研及人才不足,还存在技术路线分散、关键技术难度大、技术体系标准缺失和安全基础不牢靠等缺陷。因此需要积极探索新技术、新领域,不断推进金融行业信息化、数字化、智能化的改造。通过制定金融业AI基础设施建设的标准,一方面规范AI芯片厂商的设计标准,满足金融业对AI芯片的便捷性使用和灵活部署的需求;另一方面为广大金融企业提供参考建议,未来的AI基础设施建设既能满足金融企业 的实际应用需求、又能满足绿色环保低碳要求。 (二)现状分析 1.国内外发展现状 (1)国外 英伟达是人工智能主力芯片供应商,是GPGPU领域的龙头企业,在技术上保持着绝对领先,平均每两年推出新一代芯片架构,每代产品性能始终能够保持稳定的提升和强大的产品竞争力。目前,英伟达的产品矩阵已覆盖数据中心、专业图形图像、消费级游戏和汽车等多业务场景。其中,面向数据中心场景,英伟达先后发布了V100、A100、H100,以及基于最新的Blackwell架构的B200和B300芯片,依托成熟的CUDA软件生态体系,并结合持续迭代升级的NVLink高速互连技术与NV Switch高性能交换架构,英伟达构筑了坚实的技术壁垒,奠定了其在全球市场的领导地位。公司最新推出的基于B300 GPU打造的NVL72智算超级节点,旨在为万亿参数级超大模型训练提供足够的算力支撑,其创新的超节点架构已成为引领智能计算领域的行业标杆。 AMD是高性能计算(High Performance Computing,HPC)主力芯片供应商,全球领先的半导体技术提供商,产品覆盖GPU、APU(Accelerated ProcessingUnit)及FPGA等多个领域。AMDEPYC(霄龙)处理器面向云计算、HPC等高性能计算工作场景,凭借多核优势以及优异性能,在服务器领域始终保持着较高的市场份额。同时,AMD也是少数可以和英伟达可以在全球范围内 GPGPU领域展开竞争的企业,AMD Instinct系列加速器结合ROCm生态,可以满足Exascale级(百亿亿次级)工作负载需求,加速大规模HPC和AI训练任务。 (2)国内 目前,国内AI加速卡主要采用GPGPU和DSA架构路线,国内主要的AI芯片包括海光、天数智芯、华为昇腾、昆仑芯、寒武纪等。其中,海光、天数智芯等采用的是GPGPU技术架构,而华为昇腾、昆仑芯、寒武纪等则是采用了DSA类芯片架构。 GPGPU是通用架构设计,拥有大量的计算核心和并行处理单元,擅长处理大规模的并行计算。其架构相对较为通用,具有较高的可编程性,开发者可以使用通用的编程语言进行编程,方便将现有的通用计算代码迁移到GPGPU平台上。 DSA架构则通常是针对特定领域的需求进行定制化设计,其目的是针对特定任务或领域进行高度优化,具有高度的专用性。它可能会采用特定的计算单元、存储结构和数据通路等,以更好地适应目标领域的计算特点。作为国内AI芯片领域的领军企业,华为依托自主研发的昇腾AI处理器及灵衢网络高性能互联架构,率先推出业界领先的384液冷智算超级节点。该节点不仅是国内首个实现商用的智算超节点解决方案,其峰值INT8算力性能更超越国际同类标杆产品(如NVL72),为万亿参数级超大模型的训练任务提供了坚实的算力底座。 2.金融业应用情况 目前,各大金融机构主要采用英伟达GPU为主的技术路线,初步完成AI基础设施的建设,为AI服务提供算力保障,赋能各种业务场景,在业务上实现降本增效。 随着政策的不断变化和技术的不断迭代更新,目前金融机构已建成的AI基础设施正不断地遇到新的挑战:首先,在政策方面要求优化布局算力基础设施、满足绿色低碳发展要求,因此要求机房需支持高密服务器、液冷服务器的部署策略,降低基础设施的PUE,提升基础设施的能效比和能算比。其次,随着芯片工艺技术的不断更迭,未来基础设施的发展将趋向于高密算力的部署方式。由于已建成的AI基础设施与传统的以CPU为主的基础设施共用一个机房,因此机房将无法满足用于AI大模型训练的高密算力基础设施的高能耗和高散热需求。最后,随着AI芯片技术的不断发展,目前市场上已涌现出不同厂商的AI芯片,未来AI基础设施的部署策略将从以英伟达GPU为主的技术路线向多个AI芯片组合部署的技术路线转移。如何简单、高效地完成