演讲人:赵荣星云Clustar产品总监 目录Contents 业界首个FPGA隐私计算高性能算力加速卡 效率产品—异构加速算子层API 效率产品—算子层算子模式及数据格式 •struct fpga_config{uint8_toperate_mode; //指定本次任务的操作模式size_t batch_size;//指定本次任务中每批数据个数size_t para_data_size; //指定本次任务参数数据量大小size_t data1_size;//指定本次任务data1数据量大小size_t data2_size;//指定本次任务data2数据量大小size_t data3_size;//指定本次任务data3数据量大小uint8_t para_bitlen;//指定本次任务中参数的数据位宽uint8_t data1_bitlen; //指定本次任务中data1的数据位宽uint8_t data2_bitlen; //指定本次任务中data2的数据位宽uint8_t data3_bitlen; //指定本次任务中data3的数据位宽uint32_t task_space_size_req; //指定本次任务请求的task spacesizeuint32_t pisum_block_num; //pisum模式数据拆分成多少个blockuint32_t pisum_cfg;//pisum模式数据拆分后每块数据size固定否}; 效率产品—底层算子功能支持说明 产品展示1-1:自研FPGA硬件加速卡-外观 产品展示1-3-a:CPI系列硬件配置 产品展示1-3-b:CXH系列硬件配置 产品展示1-3-c:隐私计算一体机-CXK系列 超强性能 •强算力:鲲鹏920处理器,最高集成64核,内置多种硬件加速引擎,SPECint®_rate_base2006评估跑分930+,比业界原纪录高出25%•大内存容量:支持最多32个DDR4内存插槽,提供最高8TB内存 信创CXK系列 领先的吞吐 •内存带宽高:内存通道数量从6通道提升到8通道,内存速率从2666MHz提升至2933MHz,,总带宽从1.02T提升到1.5T比特每秒,带宽提升46%•IO带宽高:PCIe 3.0升级到PCIe 4.0,速率翻番,提供40个lanes,每个lane速率提升至16Gbps,总带宽为640Gbps,IO总带宽比业界主流提升66%•网络带宽高:集成100G RoCE以太网卡功能,从业界主流的25G提升至100G,网络带宽提升4倍 开箱即用、软硬结合、安全合规、灵活配置的国产化一站式软硬件结合产品 可靠的隐私安全保护 •应用端支持点对点分布式安全计算,具备底层技术、架构设计、算法、异构算力和产品功能和多层级流程管理,完全可控•安全、可供应:采用华为全自研计算芯片,整机器件全国产化•-可靠与质量保障:减振、散热等高可靠设计 基于主流国产化服务器厂商,集成隐私计算平台,主要面向政府、金融、能源、运营商、电力、医疗等行业打造,促进多源数据安全、高效协同、数据要素价值的激活的软硬一体解决方案。 超强的集成能力 CXK系列 •-单颗芯片集成了CPU、南桥、网卡、SAS存储控制器等4颗芯片的功能,业界集成度第一,能够释放出服务器更多槽位,用于扩展更多加速部件功能,大幅提高系统的集成度 灵活部署/拓展 •一站式解决平台的软硬兼容问题,支持高密、存储和高性能等机型,覆盖数据中心需求•支持采取自动化与统一化管理,简化运维•节点间资源动态调度,集群化管理、运维,集成管理模块能够持续监控系统参数,故障自动告警•根据业务量变化,灵活便捷调整集群规模,水平线性扩容缩容 高效能 在相同功耗下性能可以提高30%,较业界主流高30%(基于SPECint2006) 产品展示1-3-c:CXK系列硬件配置 产品展示1-4:隐私计算一体机-支持列表 •Intel(R) Xeon(R) Silver 4114 CPU @2.20GHz 隐私计算ARM一体机—加速端到端性能 •搭载华为鲲鹏920处理器 *平台基于搭载华为鲲鹏920芯片服务器(性能可比Intel至强8180),大幅提高系统的集成度,提升算力能力*网络带宽从业界主流的25G提升至100G,IO带宽让每个lane速率提升至16Gbps,单颗芯片4颗芯片的功能 930+25% 性能提升比较 关于星云Clustar 业务落地实践(一) 业务落地实践(二) —THANKS—