您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国家市场监督管理总局&国家标准化管理委员会]:信息技术 云计算 云超算通用要求 - 发现报告

信息技术 云计算 云超算通用要求

AI智能总结
查看更多
信息技术 云计算 云超算通用要求

GB/T45400—2025 信息技术云计算云超算通用要求 Informationtechnology—Cloudcomputing—GeneralrequirementsofHPCincloud 国 家 市 场 监 督 管 理 总 局国 家 标 准 化 管 理 委 员 会发布 目次 前言Ⅲ…………………………………………………………………………………………………………引言Ⅳ…………………………………………………………………………………………………………1范围1………………………………………………………………………………………………………2规范性引用文件1…………………………………………………………………………………………3术语和定义1………………………………………………………………………………………………4缩略语2……………………………………………………………………………………………………5云超算参考架构2…………………………………………………………………………………………6基础资源要求3……………………………………………………………………………………………6.1计算3…………………………………………………………………………………………………6.2存储3…………………………………………………………………………………………………6.3网络4…………………………………………………………………………………………………7资源管理要求4……………………………………………………………………………………………7.1计算资源管理4………………………………………………………………………………………7.2存储资源管理4………………………………………………………………………………………7.3网络资源管理4………………………………………………………………………………………8数据管理要求5……………………………………………………………………………………………8.1传输管理5……………………………………………………………………………………………8.2数据备份与存储5……………………………………………………………………………………9运行时软件栈要求5………………………………………………………………………………………10作业管理与调度要求5……………………………………………………………………………………10.1作业编辑与提交5……………………………………………………………………………………10.2作业并行调度6………………………………………………………………………………………10.3作业弹性伸缩6………………………………………………………………………………………10.4作业工作流编排6……………………………………………………………………………………11可视化要求6………………………………………………………………………………………………11.1管理可视化6…………………………………………………………………………………………11.2性能可视化7…………………………………………………………………………………………12运维与监控要求7…………………………………………………………………………………………13安全要求7…………………………………………………………………………………………………14 API要求7…………………………………………………………………………………………………参考文献9……………………………………………………………………………………………………… 前言 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:阿里云计算有限公司、深圳赛西信息技术有限公司、中国电子技术标准化研究院、荣联科技集团股份有限公司、中国电子技术标准化研究院华东分院、济 南 浪 潮 数 据 技 术 有 限 公 司、华 为云计算技术有限公司、江苏博云科技股 份 有 限 公 司、浪 潮 云 信 息 技 术 股 份 公 司、新 华 三 技 术 有 限 公 司、北京华胜天成科技股份有限公司、北京百度网讯科技有限公司、腾讯云 计 算(北 京)有 限 责 任 公 司、广 州市品高软件股份有限公司、天翼云科技有限公司、中移(杭州)信息技术有 限 公 司、中 国 人 民 解 放 军 国 防科技大学、中国邮电器材集团有限公司、深圳市奥思网络科技有限公司、湖南智擎科技有限公司、天固信息安全系统(深圳)有限公司、深圳鼎信通达股份有限公司。 本文件主要 起 草 人:杨 广 贺、游 亮、杨 丽 蕴、陈 行、王 向 东、张 东、吕 文 文、赵 华、张 振 华、张 敏、李 萌、罗森、万晓兰、梁钢、查丽、刘增志、王永霞、陈煜东、邱洋、吴思洪、胡松乔、喻涵、位明扬、史佩昌、杨尚之、陈志峰、王泽胜、丁天 舒、梁 力 晨、李 智 琪、高 岩、钱 涛、朱 松、贺 荣 徽、吴 涛、何 万 青、尹 刚、李 艳、周 扬、刘文斌、刘虎、徐晔。 引言 高性能计算(HighPerformanceComputing,HPC)是指将计算能力积聚,用并行计算方式满足个人电脑无法处理的大资料量与高速运算需求,在科学研究、仿真计算、工程 模 型 和 影 视 渲 染 等 领 域 得 到 广泛应用。 云超算是一种新型的高性能计算方式,可以解决传统HPC在使用过程中易遇扩展性不佳、遭 遇 性能瓶颈、管理维 护 难 等 实 际 问 题。云 超 算 服 务 是 基 于HPC集 群、云 超 算SaaS增 值 服 务 和 云 超 算PaaS商用系统建立的新型业务生态,利用云基础设施向云服务客户提供弹性、可拓展、多租户的高性能计算服务,满足客户利用云超算服务快 速、便 捷 地 构 建 和 管 理HPC集 群,运 行 计 算 密 集 型 的 工 作 负 载(HPC应用),并根据工作负载增加和缩减所需资源的需求。 通过本文件规范云超算服务的产品能力和建设部署等,有利于促进云超算技术发展和生态建设。 信息技术云计算云超算通用要求 1范围 本文件给出了云超算服务的参考架构,规定了云超算的通用要求。 本文件适用于为云超算服务产品设计、规划、建设、部署和运营等方面提供参考,为第三方机构实施云超算服务能力评估提供依据。 2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必 不 可 少 的 条 款。其 中,注 日 期 的 引 用 文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包 括 所 有 的 修 改 单)适 用 于本文件。 GB/T32399—2015信息技术云计算参考架构GB/T32400—2015信息技术云计算概览与词汇 3术语和定义 GB/T32399—2015和GB/T32400—2015界定的以及下列术语和定义适用于本文件。 3.1高性能计算highperformancecomputing为满足高性能、深度学习或人工智能应用要求而设计、运行、销售和优化的计算系统。[来源:ISO/IEC21836:2020,3.1.24] 3.2云超算HPCincloud利用云基础设施提供弹性、可扩展、多租户的高性能计算云服务。 3.3集群cluster一组相互独立的、通过高速网络互联、以单一系统的模式加以管理的计算机。 3.4作业job使用并行计算方法对预先设定的输入数据进行数值求解、获得计算结果的过程。 3.5云服务器cloudserver根据用户需求进行配置、实现快速供应和灵活部署的服务器。 3.6裸金属服务器baremetalserver用于云计算的具备弹性、灵活性、高性能等特点物理服务器。 4缩略语 下列缩略语适用于本文件。ACL:访问控制列表(AccessControlLists)API:应用程序编程接口(ApplicationProgrammingInterface)APP:应用程序(Application)ARM:高级精简指令集机器(AdvancedRISC Machine)CPU:中央处理器(CentralProcessingUnit)FPGA:现场可编程门阵列(FieldProgrammableGateArray)GPFS:通用并行文件系统(GeneralParallelFileSystem)GPU:图形处理器(GraphicsProcessingUnit)GRE:通用路由封装(GeneralRoutingEncapsulation)HPC:高性能计算(HighPerformanceComputing)IP:互联网协议(InternetProtocol)I/O:输入/输出(Input/Output)MPI:信息传递接口(MessagePassingInterface)NFS:网络文件系统(NetworkFileSystem)RDMA:远程直接内存访问(RemoteDirectMemoryAccess)VNC:虚拟网络控制台(VirtualNetworkConsole)VRF:虚拟路由转发(VirtualRoutingForwarding)VXLAN:虚拟可扩展局域网(VirtualeXtensibleLocalAreaNetwork)Web:全球广域网(Worldwideweb) 5云超算参考架构 云超算参考架构见图1,包括基础资源、资源管理、数据管理、运行时软件栈、作业管理与调度、可视化、运维与监控、安全以及API等。客户可以利用云超算服务快速、便捷地构建和管理HPC集群,运行计算密集型的工作负载(HPC应用),并根据工作负载增加和缩减所需资源。 6基础资源要求 6.1计算 计算基础资源要求包括: a)应提供虚拟机;b)应提供裸金属服务器;c)应支持云服务器性能提升的功能设置,如超线程、非统一内存访问等;d)应支持使用异构计算资源,如GPU、CPU、FPGA等;e)宜支持使用容器;f)应支持使用异构处理器架构,如X86、ARM。 6.2存储 存储基础资源要求包括: a)应提供并行文件系统;b)应支持HPC集群直接挂载并行文件系统;c)应支持弹性可扩展功能,支持在线扩容,并提供I/O自动负载均衡能力;d)应具备故障检测能力,并能自动恢复故障;e)宜支持使用对象存储和块存储;f)宜具备故障隔离能力,当计算资源故障迁移后,能够使用原有的系统盘和数据盘;g)应支持数据冗余保护;h)应支持文件管理,包括但不限于配额、用户隔离和ACL等; GB/T45400—2025 i)宜支持存储加速技术。 6.3网络 网络基础资源要求包括: a)应提供低时延网络,如RDMA;b)应支持多用户网络隔离,如VXLAN组网、GRE隧道、VRF隔离等;c)应提供网络流量检测、调度等能力;d)宜支持使用专线网络;e)宜支持网络加速技术;f)宜支持高速网络互联技术。 7资源管理要求 7.1计算资源管理 计算资源管理要求包括: a)应支持并行计算,多机多核并行完成计算作业;b)应支持将并行计算的过程数据和结果数据保存到高性能并行文件系统;c)应支持多HPC集群管理;d)应提供远程登录服务、HPC调度器服务和域账号服务;e)应支持对HPC集群计算节点的增加、查询、删除、停机、启动、重启等操作;f)应支持磁盘挂载和卸载;g)应支持不同的CPU和内存配比;h)宜支持同一HPC集群对2种及以上架构的计算处理器的统一管理,如X86、ARM;i)应支持在HPC集 群 运 行 过 程 中 新 增 节 点,将 新 增 节 点 自 动 加 入 到HPC调 度 器 和 域 账 号服务;j)应支持在HPC集群运行过程中删除空闲节点,将被删除节点从HPC调度器和域账号服务中自动删除;k)宜支持对现有计算资源划分队列,并对队列资源进行配额管理和用户权限管理