您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:存算一体独角兽锋行科技解读AI存算加速系统大机遇20260324 - 发现报告

存算一体独角兽锋行科技解读AI存算加速系统大机遇20260324

2026-03-24未知机构郭***
存算一体独角兽锋行科技解读AI存算加速系统大机遇20260324

2026年03月26日09:17 关键词 存算一体冯诺依曼架构存储墙大模型推理英伟达ROCE IWAP数据直通分布式存储计算中心国产化AI芯片存储系统计算网络数据中心存储加速智能存储大模型GPU计算能力 全文摘要 国联民生证券研究所举行线上分享会,邀请了某科技公司的CTO深入讨论AI存算加速系统的发展机遇。孙总指出,存算一体已成为大模型推理端的重要趋势,传统冯诺依曼架构面临性能瓶颈和存储墙问题,而其所在公司研发的AI原生存算加速系统有效解决了这些问题,为客户提供降本增效的能力。此外,孙总分享了公司与多家合作伙伴的关系及未来发展方向,回应了参会者关于与竞争对手的区别、产品形态及交付方案等问题,展现了公司在存算一体化领域的技术创新和市场定位,以及推动国产AI算力和加速应用发展的积极愿景。 存算一体独角兽锋行科技解读AI存算加速系统大机遇-20260324_导读 2026年03月26日09:17 关键词 存算一体冯诺依曼架构存储墙大模型推理英伟达ROCE IWAP数据直通分布式存储计算中心国产化AI芯片存储系统计算网络数据中心存储加速智能存储大模型GPU计算能力 全文摘要 国联民生证券研究所举行线上分享会,邀请了某科技公司的CTO深入讨论AI存算加速系统的发展机遇。孙总指出,存算一体已成为大模型推理端的重要趋势,传统冯诺依曼架构面临性能瓶颈和存储墙问题,而其所在公司研发的AI原生存算加速系统有效解决了这些问题,为客户提供降本增效的能力。此外,孙总分享了公司与多家合作伙伴的关系及未来发展方向,回应了参会者关于与竞争对手的区别、产品形态及交付方案等问题,展现了公司在存算一体化领域的技术创新和市场定位,以及推动国产AI算力和加速应用发展的积极愿景。 章节速览 00:00风行科技存算一体技术:AI加速系统的未来机遇 本次电话会议解读了存算一体独角兽风行科技在AI存算加速系统领域的重大机遇,强调了其解决存储墙瓶颈的前景。公司产品兼容主流存储技术,与多家AI芯片和国资云巨头合作,CTO将深入讲解存算一体技术的发展趋势与应用前景。 03:34风行致远:国产AI算力与存储系统解决方案 风行致远致力于成为国产AI算力和加速应用的领航者,通过从加速模组到AI加速系统,再到GPU互联产品矩阵的布局,解决大模型时代存储短板问题,提升存储系统能力,为AI市场奠定良好基础设施。公司具备良好产业技术基础,拥有自主原创硬件芯片,专注于降本增效,服务于大模型训练与推理全流程。 07:31 AI发展瓶颈:存储与网络互联挑战 当前人工智能领域,网络和计算已非主要瓶颈,GPU计算速度和网络带宽均大幅提升。然而,数据存储成为新挑战,尤其是SSD的存取速度与GPU计算速度不匹配,CPU调度能力受限。为解决跨机器GPU高效互联,英伟达提出Infinity Band方案,但成本高昂。国内采用ROCE技术,面临协议兼容性难题,需优化数据传输效率与稳定性。 12:16存储与计算技术革新:从IWAP到AISC的发展 对话讨论了存储与计算技术的演进,包括IWAP方案、GPU Direct Storage、以及海外存储加速2.0阶段的公司案例。重点介绍了三星、海力士和英伟达的3.0时代智能存储开发,以及风行作为2.5时代成熟产品的特点。技术革新旨在提升数据吞吐效率,减少能耗,支持未来计算中心扩展。 17:14大模型训练与推理中的存储与计算优化策略 讨论了大模型训练中GPU故障率高、数据搬运耗时长的问题,以及推理阶段存储需求激增对成本的影响。介绍了英伟达的3.5层存储概念和deep seek的MOE多专家系统等软件优化方案,以及HBM内存升级、DDR封装、存算一体化等硬件趋势。最后,概述了风行方案的存算直通、边存边算和以存代算技术,旨在降低大模型的访存成本和能 耗,提高数据处理效率。 24:13存算一体化技术提升大模型训练效率 对话介绍了存算一体化技术,通过硬盘内的算力替代主机CPU和显卡进行数据协处理,降低访存成本,提升业务效率。该技术应用于加速模组和存储池系统,支持GPU友好存储,实现存储到计算的直通,减少数据搬运次数,提高大模型预处理效率。此外,针对GPU故障的快照系统,提出内存缓冲方案,但因内存成本高昂,需探索更可持续的解决方案。 29:58智能硬盘技术提升AI算力与能效 对话介绍了通过智能硬盘技术实现显卡故障隔离、数据增量更新和算力优化,显著降低AI训练和推理中的访存成本与能耗,同时支持数据中心改造和私有化大模型部署,展现了与多家企业合作的成果与未来发展方向。 36:04存算一体技术与英伟达LPU的对比分析 对话讨论了存算一体技术与英伟达LPU的不同之处,指出LPU属于近存计算,通过物理上靠近计算单元与存储单元来减少延迟,但容量有限,主要用于加速推理输出。而存算融合加速技术旨在解决数据存储与快速检索问题,通过与GPU协同工作,处理LPU无法容纳的中间结果,优化整体计算效率。 39:11存储芯片成本与供应链风险及投资机遇探讨 对话围绕存储芯片的成本上涨对供应链的影响及潜在投资机遇展开。指出HBM等高端存储芯片成本上升可能促使AI芯片公司转向SRAM工艺,同时英伟达提出存算融合方案以降低成本和功耗。此外,讨论了市场竞争格局,强调与国内领先企业合作推进国产化,以及在新建和存量数据中心的高效AI替换策略。 44:28行业竞争态势与技术发展探讨 对话围绕行业竞争及技术前沿展开,指出在国内暂无直接竞争对手,但存在协同合作机会;提及国外已有公司在3.0阶段初期取得进展,如DDN与VASTDAT,估值显著增长,吸引英伟达和谷歌投资意向。参会者提问与回答环节强调了网络与电话端提问方式。 47:25数据中心改造与智能加速模组采购讨论 会议讨论了数据中心改造及新建时需采购的并非DDR颗粒,而是具备智能化加速能力的加速模组,该模组集成了存储、安全及AI加速功能。公司交付的产品结合了硬件改造与软件加载,旨在提升大模型效率,无需额外硬件投入,同时在新建数据中心中实现算力系统加速,节省内存与CPU资源。针对不同算力场景,提供多样化的产品形态,包括内置算法与开源模型的一体机产品,覆盖多种市场应用。 发言总结 发言人1 他,即国联民生计算机的吕伟,着重介绍了存算一体技术在AI领域的应用及其关键性。他指出,市场上30%的AI原生存算加速系统投资被视为解决处理器与存储性能鸿沟的稀缺方案,这是限制模型训练算力增长的主要瓶颈。吕伟还强调了风擎科技作为独角兽企业在该领域的潜力及合作进展,提及与三星、海力士等国际存储巨头及多家国内AI芯片和国资云巨头的紧密合作。他提到,孙总,一位拥有丰富GPU和AI加速体系经验的专家,将分享存算一体的发展机遇。此外,吕伟鼓励与会者通过进门APP参加活动,并对竞争对手、数据中心建设和解决方案交付等问题进行了回应。 发言人3 他,孙腾,代表风行致远,感谢李总与国安民生的邀请,强调公司旨在成为国产AI算力及加速应用的领军企业。在大模型时代背景下,孙腾指出存储成为关键瓶颈,风行致远通过自主研发核心技术,构建从存储到计算的智能化系统,旨在提高大模型训练与推理效率,同时降低成本。公司依托强大的产业和技术基础,自主研发硬件与芯片,实现软硬一体化的协同加速。孙腾分享了公司在存储技术方面的优势和市场策略,表达了对AI大模型市场变化的深刻理解与前瞻性思考,深入分析了存算一体化趋势下的技术发展与商业机遇。 发言人2 他首先对与会者参加由风行科技主办的国联民生计算机存算一体AI存算加速系统解读会议表示欢迎,并强调当前所有参会者都处于静音状态。随后,他播报了重要声明,指出根据证券期货投资者适当性管理办法,本次电话会议仅为国联民生证券研究所白名单客户服务,所分享的内容不构成投资建议,与会者需要自主决策并承担相应风险,国联、民生证券不承担任何责任。他还特别提醒,未经许可,不得复制、转载会议内容,否则将依法追究法律责任。最后,他说明了提问的方式,并预祝与会者工作顺利。 发言人4 他首先对孙唐总的详细介绍表示了感谢,对会议期间的讨论内容给予了高度评价,认为收获丰富。接着,他提出了几个关键问题,涉及供给侧与市场需求侧的平衡、产品与SMHBM的关联性、供应链成本上涨可能带来的风险,以及竞争对手对公司可能造成的影响。此外,他也关注公司的拓客战略,并对孙总的汇报表示赞赏。尽管提问环节问题不多,但他依然积极提问至结束,展现了对公司战略和前景的看好,并对会议的顺利进行表示感谢。 问答回顾 发言人1问:风行科技的AI原生存算加速系统在解决当前模型训练算力瓶颈方面有何独特优势? 发言人1答:风行科技的AI原生存算加速系统通过创新性技术解决了冯诺依曼架构下处理器和存储之间的性能鸿沟,即“存储墙”问题,该问题消耗了高达90%的系统功耗与执行时间。风行的解决方案能够有效提升AI模型训练和推理的算力,并且已经获得多家知名合作伙伴的认可和合作,包括国内AI芯片龙头和国资云巨头,以及全球科技巨头正在前期导入合作。 发言人3问:风行科技的产品定位是什么? 发言人3答:风行科技致力于成为国产AI算力和加速应用的领航者,针对大模型时代存储成为最短板的问题,通过构建从单一加速模组到AI加速系统的全产品矩阵,提供从存储到计算的智能化解决方案,以满足大模型训练到推理整个业务流程的降本增效需求。 发言人3问:风行科技在技术和产业基础方面有何优势? 发言人3答:风行科技拥有良好的产业和技术背景,由来自讯飞、AMD等人工智能和芯片领域的资深人士创立,具备自主原创的硬件和芯片能力,可实现软硬一体协同加速。此外,风行科技已经成功研发出具有颠覆性核心能力的产品,并在存算一体化领域取得显著成果。 发言人3问:风行科技的主要管理团队有哪些背景? 发言人3答:风行科技的董事和投资人胡运曾是科大讯飞联创,并投资过多家知名AI公司;CEO潘晓路总曾担任讯飞新疆总经理、西北区总裁,也是科大讯飞EMD成员;孙腾本人在AMD负责GPU SOC集成和系统验证,拥有丰富的GPU图像数据存储芯片工作经验。 发言人3问:目前存储系统在数据中心中的占比情况及其发展趋势如何? 发言人3答:随着人工智能的发展,存储系统容量和带宽需求呈迅猛增长态势,目前存储系统的KPAX已占整个数据中心的10%至15%。预计未来将有更多创新技术提升存储系统的整体能力,以适应AI市场发展的需求,奠定坚实基础设施。 发言人3问:在当前技术环境下,数据的载体成为瓶颈的原因是什么? 发言人3答:数据的载体成为瓶颈是因为目前市场上主流的NVMESSD存取速度有限,一张盘只有7个GB左右,无法满足大规模数据调度需求。为了保证显卡满速计算,需要配备上千个硬盘,而CPU已无法有效管理众多SSD的数据调度和业务吞吐,导致存储带宽受限,成为最短的短板。 发言人3问:戴尔提出如何最大化GPU效率,以解决存储系统中的问题? 发言人3答:要最大化GPU效率,需要实现计算网络和存储各项性能的均衡。由于CPU调度能力的限制,GPU获取的带宽受限,因此有新的架构方向来突破这一瓶颈。 发言人3问:英伟达提出的解决跨机器高效互联方案是什么? 发言人3答:英伟达提出的解决方案是采用名为infinity band的技术,它能提供跨主机GPU间的高速互联,实现如同一台机器内的高效数据交互。但该方案成本高昂,单个交换机成本是传统光交换机的三倍以上,功耗也较高,并且要求支持英伟达专有协议。 发言人3问:国内在解决类似问题时采用的技术和面临的挑战是什么? 发言人3答:国内采用的是ROCE rocky技术,已发展到第二代,属于有损互联互通协议,传输数据可能出错,需要进行恢复和重传,导致各家协议兼容性存在较大挑战。 发言人3问:英伟达在研究GPU手拉手时发现了什么更大瓶颈? 发言人3答:英伟达发现存储侧——固态硬盘成为数据基础来源和瓶颈,并为此推动了GPU direct storage协议,让显卡直接与硬盘进行数据吞吐,减少了CPU