AI智能总结
1、会议信息 时间:10月13日参会人:无参会人信息 2、全文摘要 即将举行的OCP开放机构大会聚焦于AI算力、算力产业链、开发者大会及战略合作,展现了互联技术的最新进展,特别是Skillup、Skillout和Skillacross三个层次的互联技术,及其在提高AI算力硬件设计统一性、优化服务器和互联架构设计中的作用。大会还涵盖了CPU的最新技术发展,如优达和博通在CPU技术上的竞争与合作,以及相关的开放协议如SUE和UAlink的应用。博通与OKI的新的战略合作和Oracle的分析日也是会议亮点。OCP大会的重要日程安排强调了对互联、CPU等领域的未来发展的期待,预示着技术领域的深入探索和合作。 3、问答回顾 OCP开放机构大会有哪些主要看点? 发言人:这次OCP大会从13号开始,持续四天,由开放计算联盟举办,汇集了全球主流的芯片厂商、服务器厂商、互联链上厂商、CSP厂商和互联网厂商等。大会将分享关于服务器架构、互联架构、电源线和散热等AI集群架构的新设计思路,以及重点探讨开源软件思想在硬件设计中的应用,推动AI算力硬件设计的统一。 当前各家厂商在推进这些技术方面的具体动作有哪些? 发言人:博通展示了几款覆盖AI互联三个场景的产品,包括用于机柜内拓展的toultra产品,以及应用于start领域的汤姆克系列(time5和top6)产品,带宽逐级翻倍以拓展应用。而Able的产品天蝎座X7目前基于PIE总线互联,下 一代预计会在27年底推出基于UVlink协议的交换机产品。 在此次大会上,关于AI互联方面有哪些关注点? 发言人:AI互联方面,重点关注三层互联技术Skill up,skill out和skillacross的进展,特别是Skillup的开放协议如UAlink和SUE的应用情况。大会中可能会有关于这些协议的新参考信息,并且也会讨论机架设计,比如基于GB200架构的机架设计及其最新进展。 硅光技术和CPU进展在大会中会有何表现? 发言人:大会中将涵盖硅光技术的演进以及CPU的最新进展。针对博通CPU的进度,最近发布的实验结果论文有望增强市场信心,同时也会有关于光在互联场景更大应用的信息披露。此外,针对大规模数据中心互联方案的设计也可能成为关注焦点。 台北OCP大会的主要议题是什么? 发言人:台北OCP大会重点放在了Skill up领域,尤其是对UA link和SUE这两个最受关注的开放协议在SCP领域的对比情况进行深入讨论。大会详细介绍了各自的互联战略,如MDR推动的Skillout领域的UE联盟以及UI link部署,同时MD也组建团队致力于将Ulink交换机芯片引入下一代产品中。 在即将召开的OCP大会上,有哪些值得关注的产品发布和设计更新? 发言人:杰瑞克四这个产品将在大会上发布,同时有很多厂商会更新他们的设计方案并推出新品。这次大会是获取增量信息的好时机,特别是关于OCP大会当天发布的具体细节。 A.Lab在大会上做了哪些主旨演讲,并分享了哪些业务进展? 发言人:A.Lab在大会上围绕其两方面业务进行了主旨演讲:一是关于对AWS、TTPS和TenTaMax基建机柜订单的承接情况,以及基于PIE进行互联的规划;二是提到后端网络互联市场的规模预计将在28年超过300亿美元,并讨论了相 关趋势和技术要求。 大会中关于数据中心建设和互联技术有哪些新的发展趋势? 发言人:数据中心集群规模的数量级正在指数级扩大,从千卡集群发展到目前的万卡甚至几十万卡集群。这将对互联、机架和整个集群的设计带来新要求。同时,各厂商如OKI的数据中心建设速度较快,CSP的集群信息也会在大会上更新。此外,还有关于机柜架构、液冷设计、网络结构等方面的最新进展。 在互联技术方面,大会有哪些重点讨论内容? 发言人:大会将有大量论坛和圆桌讨论聚焦于不同层次的互联方案,包括英伟达提出的still up(fusion)互联方案。同时也会关注IB、以太网等不同互联协议及架构的优缺点,以及CPU产品节奏、技能跨集群互联解决方案Skillacross的发展动态,例如博通、A.Lab、AMD等厂商的产品布局和市场动态。 schoolup的核心技术优势是什么? 发言人:schoolup网络的核心优势在于其低延迟高带宽的传输特性,它旨在实现整个系统内存池化以进行高速率访问。相较于scareup,schoolup通过RDMA(远程直接内存访问)技术进行跨节点的高效内存操作,从而显著提升了数据传输效率。 为什么需要school up技术? 发言人:需要schoolup技术的原因主要有两点。首先,随着推理负载的激增,对内存卡的需求催生了显存池化的需求,以应对大量profile计算后的存储需求,这要求调用外部内存资源,包括GPU内存和CPU内存,因此需要将整个系统内存池化。其次,推理放量后,为了满足多种并行策略的需求,在硬件中执行推理任务时,需要通过CPU和GPU等不同部件间的高效互联,而这部分需求促使了支持高带宽低延迟信息传输的schoolup网络的发展。 目前主流的互联协议如NVlink、UVlink以及SOE等支持的最大连接数量及性 能表现如何? 发言人:目前,这些协议的最大支持连接数量都已经提升到了1024张卡,并且在带宽和延迟方面达到了相当水平。例如,SOE的规格也已接近成熟,各个协议间的产品代表包括PCIE的B系列产品、SOE的Contra产品以及links的Xswitch产品等。 关于未来大会中可能展示的scp互联架构有哪些预期? 发言人:在即将召开的大会上,可以期待看到更多关于scp互联架构的信息更新,特别是CLP厂商的ASIC互联架构可能会有新的进展和突破。同时,已知的互联方案主要包括两种路线:一种是全链接架构,如MD架构和NL72架构,它们均采用switch进行互联;另一种是OtoO方案,如ARAWS的TTL机柜及其相关产品,这类方案利用switchtree架构实现全连接,并结合卡间直连方案来构建高效稳定的网络环境。 卡间直连方案的典型架构是什么?卡间直连方案存在什么弊端? 发言人:卡间直连方案的典型架构包括英伟达的AC版八卡服务器和即将发布的米350架构,它们都是通过在一个机构内组合GPU卡,再将机柜连接起来形成卡间直连方案。此外,Google提出的3dmax方案也是采用卡间直连的方式。卡间直连方案的一个主要弊端在于并非凹凸连接,当需要在4乘4立方体结构中的对角线上两张卡之间传输数据时,信号需要经过较长通道,这相比传统卡间直连设计而言连接距离更长。 关于SCA架构的最新进展如何? 发言人:目前有关SCA架构的信息有所增加,预计在即将召开的大会上会有更多关于SCA架构及其对产业发展催化作用的新信息被公布。 CPU方面有哪些最新的进展和信息?此次大会上关于CPU部分还有哪些关注点?发言人:在CPU领域,优达和博通均有新进展。优达在八月份的hotchip上发布了1.6T的CPU产品以及基于CQ产品的交换机,并计划于2026年上市。而博 通在九月份与曼塔集群进行了少量CPU部署试点,实验结果超过100万个小时,尽管存在关于维修成本的担忧,但整体进展较为顺利。博通在CPU方面的最新信息可能将在大会上进一步披露。本次大会上,除了已知的优达和博通CPU方案进展外,还将关注两家公司在CPU方面的对比表现,尤其是博通在测试结果发布后的表现。同时,整个互联领域将是会议讨论焦点,特别是最近美股市场的波动以及相关企业如OKI在与博通合作方面的最新动态。