AI智能总结
国家数据局发布数据观整理 前言 8月28日,国家数据局在2024中国国际大数据产业博览会“数算一体,驱动未来”交流活动上发布《全国一体化算力网应用优秀案例集》。 为充分展示全国一体化算力网建设领域取得的应用成效,国家数据局前期组织开展了“全国一体化算力网应用优秀案例”征集遴选工作。各地方积极响应、踊跃参加,共推荐报送案例221个,涵盖多元算力一体化布局、东中西部算力的一体化协同、算力与数据算法一体化应用、算力与绿色电力一体化融合、算力发展与安全保障一体化推进等五个方向。 首批遴选出25个优秀案例,旨在展现这一领域的探索成果和创新突破,加快推动全国一体化算力网建设,赋能经济社会发展。 目录 一、多元算力一体化布局.......................................................................................................................1 案例1.构建算力基础设施铸就多元算力一体化布局................................................................1案例2.异构融合、应用引领、促进数据互联互通的超算互联平台..........................................2案例3.临港算力创新实践提升枢纽节点集约化成效................................................................4案例4.打造智算算力网AI开发平台助力人工智能基础设施发展..........................................6案例5.构建算网融合平台赋能行业场景应用............................................................................8案例6.以算力赋能人工智能产业发展打造东数西算成渝枢纽新引擎..................................10案例7.贵州枢纽节点算力调度平台实践融入全国一体化算力网规划..................................12案例8.绿色智能算力“铁三角”赋能千行万业........................................................................14案例9.构建算力调度服务体系提升算力资源服务效能..........................................................16案例10.算力跨域试验场开源互联新生态................................................................................18 二、东中西部算力的一体化协同.........................................................................................................20 案例11.“三重网络三重算”构建园区新质生产力..................................................................20案例12.打造国家枢纽节点公共传输通道服务能力有效提升“东数西算”网络传输效能................22案例13.长三角枢纽芜湖集群算力公共服务平台提供一站式算力服务................................25案例14.东西联动、融合创新助力东西部数字经济融合发展................................................27案例15.打造算力网实验场加速融入全国一体化算力网........................................................29案例16.国产V2V自主可控协议体系支撑东西部算力一体化协同........................................31 三、算力与数据算法一体化应用.........................................................................................................33 案例17.“东数西算”实现“算力数据算法”融合构建智驾行业数字化竞争力................33案例18.基于算力、数据与算法一体的跨主体数据多方安全计算实践..................................36案例19.构建基于“东数西渲”的渲染云基础设施底座..........................................................38 四、算力与绿色电力一体化融合.........................................................................................................40 案例20.探索“绿电聚合供应”模式实现京津冀枢纽张家口集群算电高效协同................40案例21.内蒙古枢纽打造绿色可溯源和林格尔集群推进算电协同发展................................42案例22.甘肃枢纽庆阳集群源网荷储一体化建设推进算电协同深度融合............................45案例23.建设“零碳数据中心”助力算力与绿色电力一体化融合..........................................48 五、算力发展与安全保障一体化推进.................................................................................................50 案例24.粤港澳枢纽韶关集群打造一体化安全体系,保障数据中心集群可控......................50案例25.打造宁夏枢纽节点云安全运营管理平台,有效保障网络与数据安全......................51 一、多元算力一体化布局 案例1.构建算力基础设施铸就多元算力一体化布局 推荐单位:北京市政务服务和数据管理局、北京市通信管理局 申报单位:中国电信股份有限公司北京分公司、天翼云科技有限公司 随着人工智能大模型应用蓬勃发展,大模型训练存在的计算显存限制、风冷算力密度较低、智算资源利用率较低等问题日益突出。中国电信不断优化算力设施建设布局,加快研发落地息壤算力调度平台,显著提升算力协同调度能力,实现多元算力一体化布局。 一是建设超大规模高性能智算中心,赋能行业数字化转型。建设业内领先的液冷高性能公共智算中心,提供4000PFlops总算力供给,可满足万亿参数模型训练。采用基于全栈AI软硬件平台方案,实现算、存、网、电、冷一体化设计,实现电能利用上的增效,依托超大规模智算集群强大计算能力,赋能千行百业数字化、智能化转型。 二是打造智算服务平台,满足多场景需求。依托天翼云自主研发的“慧聚”“云骁”“息壤”三大平台,提供高算力、高吞吐、高兼容性训练能力,支持第三方算力以算力插件模式实现标准化接入,支持主流框架及芯片,有效满足大规模、高性能、多样化异构算力跨区域调度需求。 三大平台实现通算、超算、智算的统一资源注册接入, 算网一体化调度,算力交易等核心功能,通过“算力调度服务”相关认证,不仅可以促进跨主体、跨地区、跨架构的算力互联互通,而且能够优化算力资源配置效率、增强多场景适应能力。目前,息壤已接入智算算力22EFlops,纳管适配多种智算芯片,支撑北京区域近200家企事业单位数字化、智能化转型升级,产生了良好的经济社会效益。 案例2.异构融合、应用引领、促进数据互联互通的超算互联平台 推荐单位:天津市数据局 申报单位:国家高性能计算机工程技术研究中心 国家高性能计算机工程技术研究中心以应用引领、实现算力高效利用为目标,构建了国产软硬件协同、跨区域算力调度的超算互联平台。平台以互联网模式运营算力设施,实现了对分布式算力资源的统筹调度,形成了互利共惠的算力生态圈,促进了我国算力资源的高效利用。超算互联平台实现了三方面的技术和模式突破: 一是构建了多元异构算力资源池。通过应用封装、算力标准化等方式,连接“东数西算”工程西部(重庆)科学城先进数据中心等多种形态的算力资源,实现了全国14省20余城市100余家算力联合体成员的全面入网,统筹异构算力,完成多元算力高效组网。 二是打造了支撑算力互联服务的软件生态。通过建立共 性工具库、数据集、应用软件库等,实现了连接上游270余家各类应用服务商、下游100余个行业的软件生态构建,支撑了1000余个应用场景的算力需求,促进算力供需方的高效对接,推动算力广泛应用。 三是支撑了算力应用领域的标准化体系建设。规范算力的接入、调度、服务和运营等,发布《超算互联网白皮书》,完成多项国家标准、团体标准的立项和研制,积极推动我国算力服务标准化发展。 截至目前,超算互联平台发布算力商品6000余款,服务用户超10万个,形成算力多元、领域全面、高效运行的服务平台,促进我国算力资源的网络化、普惠化、标准化发展,支撑构建全国一体化算力网建设。 案例3.临港算力创新实践提升枢纽节点集约化成效 推荐单位:上海市数据局 申报单位:临港算力(上海)科技有限公司 针对当前国内算力供给存在多元组合算力交付周期长、算力资源分散难以被集中调用等问题,临港算力(上海)科技有限公司与长三角国家枢纽节点上海青浦集群加强业务协同,通过一系列工程和技术创新实践,提升枢纽节点集约化成效。 一是建设创新型的“两弹一优”基础设施。临港算力网通过弹性供电、弹性供冷、机房气流组织优化的“两弹一优”,实现多元算力组合快速交付。弹性供电方面,通过机柜设备的“小母线+弹性方舱”配电系统,一舱解决不同客户集群部署模式带来的机柜功率变化需求。弹性供冷方面,采用冷冻水系统、热管多联系统、液冷系统等多种数据中心冷却手段,统筹预留基础设施管井及接口,实现制冷技术弹性应用。机房气流组织优化方面,通过流体动力学模拟计算机架和机房的气流组织,精细化设计冷热通道,开展建设性设计和周期性优化,综合提升供冷效率。 二是通过创新性研究解决行业难点问题。通过使用中距离跨区RDMA(远程直接内存访问)进行市内算力组网,解决算力资源分散无法被集中调用的问题。通过使用跨区RDMA协议和广域拓扑感知并行策略,对跨数据中心大模型训练提出针对性模型训练策略建议,为客户提供合适的解决方案,提升训练效率。联合国内算力上下游生态合作伙伴为客户提供适配测试服务。 自2023年9月投入运营以来,建设大规模商用液冷资源池,通过“两弹一优”实践创新解决机柜功率的变化需求,支持单列机柜功率密度从8kW到48kW之间灵活适配。目前,跨区RDMA组网已完成128、512卡30KM对比验证,训练效率可达单集群的95%以上,完成5家大模型训练性能测试,支撑星辰115B等基础大模型平稳训练,集群可用率达到90%以上。 案例4.打造智算算力网AI开发平台助力人工智能基础设施发展 推荐单位:江苏省数据局 申报单位:中科南京信息高铁研究院 当前,人工智能基础设施存在技术标准不统一、算力使用门槛高等问题。中科南京信息高铁研究院研发智算算力网AI开发平台,统筹纳管异构异属异域的智算资源,实现全局能用、好用。