先进计算产业发展联盟2023年12月 版权声明 本研究报告版权属于先进计算产业发展联盟,并受法律保护。转载、摘编或利用其它方式使用本研究报告文字或者观点的,应注明“来源:先进计算产业发展联盟”。违反上述声明者,将追究其相关法律责任。 前言 汽车开发是一项复杂的系统工程,涉及众多的零部件开发和多学科方面的研究。传统的开发方式不能满足企业对汽车开发周期更高要求,而 CAD/CAE 技术应用到汽车开发中,可大幅度提升汽车开发设计的能力,指导新产品开发设计,优化产品结构与性能,降低设计和制造成本增加效益,从而提升汽车生产企业的市场竞争力。随着仿真模型越来越复杂,仿真精度提高,计算划分的网格数量越来越多,对仿真计算的设备要求也越来越高,采用高性能计算提供的算力才能支撑庞大的计算。汽车行业在从传统制造向智能制造转型,汽车行业研发也在向智能化转型,借助于科学计算手段使用 CAD/CAE 工具加速研发过程。 联想采用先进的技术和软硬件产品,构建高可用性、高稳定性、高安全性、高可靠性、高兼容性和高扩展性的新一代高性能计算中心,应用高性能计算帮助中国汽车头部制造企业,建设大型数据算力平台,支持整车仿真业务,赋能项目快速开发,提升企业竞争力。 建设的吉利星睿智算中心·智能仿真平台算力位居中国榜上制造业第一,使中国车企首次登上全球算力 500 强榜单。智能数据平台与智能仿真平台两大算力底座共同赋能,将进一步加速吉利汽车集团智能新能源转型,实现吉利在智算领域领先行业 2-3 年的代际优势,真正迎来属于吉利的“智算时代”。 编制单位:先进计算产业发展联盟参编单位:联想(北京)信息技术有限公司参编人员:郝常杰、崔吉顺、陈齐旺、田亚宇 目录 一、汽车制造行业的研发仿真 ........................... 1 (一)前处理 ....................................... 2(二)模拟(求解/计算) ............................ 3(三)后期处理 ..................................... 5 二、算力在汽车制造行业的数字化转型应用案例 ........... 6 (一)联想XCLOUD算力平台架构 ....................... 61、 平台整体功能架构 ............................. 62、 多租户管理与运营关键功能 ..................... 73、 算力资源管理 ................................. 94、 集群运维管理关键功能 ........................ 135、 资源运维和监控 .............................. 156、 新一代温水水冷基础架构 ...................... 19(二)应用案例效果 ................................ 221、 吉利智能仿真平台居中国上榜制造业第一 ........ 222、 吉利星睿智算中心智能仿真平台 ................ 223、 仿真平台构建智能研发新生态 .................. 234、 智能仿真平台进入全球算力 500 强 .............. 25 图目录 图 1 典型 CFD/显式 FEA 和隐式 FEA 模拟的文件 I/O 速率 ........ 5 图 2 算力平台整体功能架构图 .............................. 7图 3关键功能示意截图 ................................... 8图 4 统一运维入口 ........................................ 8图 5多租户管理 ......................................... 9图 6 资源数量查看 ....................................... 10图 7 算力资源申请 ....................................... 10图 8 计量计费功能 ....................................... 11图 9 消费概览 ........................................... 11图 10 业务运行状态大屏 .................................. 12图 11 自定义大屏 ........................................ 13图 12 集群资源管理 ...................................... 13图 13 裸金属资源管控 .................................... 14图 14 服务器管理 ........................................ 15图 15 集群资源自动化运维 ................................ 16图 16 自动化运维模块 .................................... 17图 17 统一告警能力 ...................................... 18图 18 算力平台资源监控 .................................. 19 图 19 计算集群 .......................................... 20图 20 吉利星睿智算中心 .................................. 23图 21 汽车设计仿真 ...................................... 24图 22吉利智能仿真平台入全球算力 500 强榜单 ............. 26 一、汽车制造行业的研发仿真 汽车开发是一项复杂的系统工程,不仅零件众多而且结构复杂,在整车开发过程中,涉及到流体、结构、温度、电磁、噪音、振动、平稳及车辆动力学等多方面的研究。 随着工业技术的迅速发展和消费质量的提高,人们对车辆要求也越来越高,企业对汽车开发周期有了更高的要求。传统的开发方式已经不能满足要求,而CAD/CAE技术应用到汽车开发中,可大幅度提升汽车开发设计的能力,指导新产品开发设计,优化产品结构与性能,降低设计和制造成本增加效益,从而提升汽车生产企业的市场竞争力。 CAE技术在汽车设计中主要应用于结构强度分析、NVH(噪音、振动、平稳)分析、疲劳耐久分析、碰撞安全分析、空气动力学分析等方面。汽车结构强度分析是保证汽车安全性、可靠性的重要指标,是CAE技术在汽车工程中应用最广泛的方面。汽车结构强度分析一般都是应用有限元法对汽车的结构进行数值计算。NVH(噪音、振动、平稳)分析涉及车汽车产品的舒适性,直接关系到消费者的体验。疲劳耐久性能分析是评价汽车各主要结构部件在功能失效前所经历的时间。采用CAE方法是利用仿真的方式,采用道路试验载荷,计算车身及关键部件连接处载荷与疲劳寿命,减少道路模拟试验,缩短成本和时间。碰撞安全分析中,使用CAE技术对汽车碰撞过程进行仿真模拟,解决碰撞大变形的非线性问题,减少实车模拟碰撞高试验成本。汽车空气动力学主要是研究汽车行驶时,即与空气产生相对运动 时,汽车周围的空气流动情况和空气对汽车的作用力(称为空气动力),以及汽车的各种外部形状对空气流动和空气动力的影响。 随着CAE仿真的模型越来越复杂,仿真精度提高,计算划分的网格数量越来越多,对仿真计算的设备要求也越来越高,采用高性能计算提供的算力才能支撑庞大的计算。汽车行业在从传统制造向智能制造转型,汽车行业研发也在向智能化转型,借助于科学计算手段使用CAD/CAE工具加速研发过程。在新车型的研发阶段,要用多种CAD/CAE工具软件,典型的CAD/CAE工作流程有三个阶段:前处理、模拟(求解/计算)、后处理。 (一)前处理 在前处理(预处理)阶段,对设计模型定义/设计几何结构或工艺,通过计算机辅助设计CAD软件通常用于对底层几何结构或过程进行建模,将设计的物理属性以及环境和物理约束和载荷应用于计算模型。在CFD和FEA分析的情况下,必须使用网格将基本几何结构划分为较小的离散域(单元);通常称为网格生成或网格化。 笔记本电脑、工作站和远程可视化服务器通常用于大多数预处理CAD/CAE工作和网格生成。这些解决方案通常具有更高端的图形卡以加速可视化,并且可能需要大量的内存,具体取决于计算模型的大小。更大的CFD和FEA网格生成可以“卸载”到具有更多计算或内存资源的服务器上。在一些应用中,网格生成可以使用到并行处理技术。 (二)模拟(求解/计算) 在模拟阶段,使用基础物理的适当数学公式来模拟(求解/计算)模型或过程。此阶段通常有大量的计算工作负载,需要完整的高性能解决方案来运行大多数情况下也是非常必要的。计算工作量取决于计算模型的大小,小型计算模型可以在工作站和笔记本电脑上运行,而大型计算模型通常在高性能计算解决方案上运行,以利用多个服务器、GPU加速、高速互连网络和并行存储系统等来加速求解/计算过程,提高生产效率。 在模拟阶段,通常使用显式和隐式两种数值方法来求解基本数学方程: 显式法 在显式方法中,当前物理值仅取决于先前的时间步长/迭代数据,因此可以通过计算表达式在网格中的任何位置求解方程。这需要更多的计算,但占用的内存相对较少。 隐式法 在隐式方法中,物理值不依赖于先前的时间步长/迭代;必须对网格中的所有单元同时求解方程。此方法更占用内存,因为所有需要计算的内容都必须提交到内存中,因此需要占用更多的内存,同时也需要适量的计算。 不同的方法具有不同的计算特点和性能要求,通常CFD和显式FEA模拟具有相同的计算和存储特性,比如可以很好地扩展到多个核心和服务器(支持MPI跨节点并行);计算对内存和计算敏感(需要 更多的内存和CPU核心);计算期间的小量的文件输入/输出(I/O)操作;模拟开始时的大量文件I/O操作,以便将网格从存储系统读入内存(存储系统的单流的能力)。模拟结束时的大量文件I/O操作,以便写入存储系统。这些文件通常是由网格和相关物理值组成的最终输出文件(存储系统的单流的能力)。用户可以指定在模拟过程中以不同的时间间隔写入检查点(checkpoint)输出文件,这可能会导致短暂的重要文件I/O操作(配合作业调度系统支持checkpoint)。计算所需要的内存的数量取决于计算模型的大小,ANSYS Fluent和Mechanical、Dassault Systèmes ABAQUS/Explicit、LSTC LSDYNA、OpenFOAM和Siemens STAR-CCM+等应用程序都属于上述类别。 而通常隐式FEA模拟具有以下计算和存储特性:不能很好地扩展到多个核心和服务器(在SMP上的性能更突出);计算对比内存来讲,内存比计算更敏感(同时兼具计算敏感和内存敏感);计算时进行大量的文件I/O操作;通常需要大量的内存;数据在内存中计算可用于减少文件I/O操作的数量;可以从GPU加速中获益(部分应用)。ANSYSMechanical、Dassault Systèmes ABAQUS/Standard和MSC Nastran等应用程序都属于上述类别。 下图描述了典型CFD/显式FEA模拟与典型隐式FEA模拟的文件I/O速率。 在CFD/Explicit FEA模拟的开始和结束时,有大量频繁的文件I/O操作,但这些事件是简短的。在计算期间,存在最小的文件I/O操作。然而,对于隐式FEA模拟,在整个模拟过程中存在大量的