AI智能总结
新型人工智能存储研究报告(2025年) 中国信息通信研究院人工智能研究所中国人工智能产业发展联盟2025年4月 版权声明 本报告版权属于中国信息通信研究院、中国人工智能产业发展联盟,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院、中国人工智能产业发展联盟”。违反上述声明者,编者将追究其相关法律责任。 前言 2022年科技部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,提出加速人工智能技术攻关、产品开发和产业培育,探索人工智能发展新模式新路径,以人工智能高水平应用促进经济高质量发展。2023年工信部等六部门印发《算力基础设施高质量发展行动计划》,提出强化存力高效灵活保障,加速存力技术研发应用,持续提升存储产业能力,推动存算网协同发展。 大模型时代,数据决定人工智能的高度,更多的训练数据是大模型迭代升级的前提,更高的数据质量也决定着大模型训练的效果。当前,大模型技术全面推动底层基础设施的发展,算力需求不断攀升,海量数据的存储和处理需求不断增长,对人工智能存储的性能、扩展性、数据安全、数据范式等都提出更高要求。 本报告重点对新型人工智能存储的概念范围、面临挑战、关键技术和最佳实践进行了梳理和分析。概念范围上,梳理了新型人工智能存储的基本概念,分析了全球人工智能存储战略。面临挑战上,点明了新型人工智能存储是发力大模型的基础,但同时在海量数据归集、训练数据访问效率、推理实时性等方面存在诸多挑战。关键技术上,阐明了新型人工智能存储需要从存储介质、系统、架构、数据编织、数据范式和数据安全等方面发力。最佳实践上,介绍了医疗、金融、云服务商、AI企业等在新型人工智能存储的实践案例。最后,本报告针对当前人工智能存储发展的挑战,提出了未来我国 新型人工智能存储发展建议。 新型人工智能存储相关产业、技术正处于高速发展阶段,新技术生态瞬息万变。报告仍有诸多不足,恳请各界批评指正。 目录 一、 新型人工智能存储概况..................................................................................... 1(一) 新型人工智能存储基本概念................................................................. 1(二) 全球人工智能存储战略分析................................................................. 2二、人工智能存储重要性........................................................................................... 4(一) 人工智能存储是发力大模型的基础..................................................... 4(二) 人工智能存储面临的挑战..................................................................... 7三、新型人工智能存储关键技术............................................................................... 9(一) 长记忆存储范式为推理提质增效........................................................11(二) 数据编织加强全局数据高效处理....................................................... 12(三) 超节点存储架构持续支撑扩展法则................................................... 14(四) 高性能并行文件系统以存强算........................................................... 15(五) 全闪存存储技术为数据提速降耗....................................................... 16(六) 存储内生安全保护企业数据资产....................................................... 17四、人工智能存储建设最佳实践............................................................................. 18(一) 医疗行业:长记忆存储助力智能辅助诊断....................................... 18(二) 金融行业:高性能AI存储赋能智慧金融......................................... 20(三)AI企业:AI数据湖支撑大模型训推平台......................................... 22(四) 运营商:构筑领先智算中心云数据底座........................................... 23(五) 制造业:一体化集成加速智能客服场景创新与实践....................... 26五、人工智能存储发展建议..................................................................................... 27(一) 加强AI存储设施统筹部署................................................................. 28(二) 增强AI存储自主创新能力................................................................. 28(三) 推动AI存储产业协同发展................................................................. 28(四) 构建AI存储能力评价体系................................................................. 29 图 目 录 图1AI基础架构............................................................................................. 2图2数据是大模型的核心要素....................................................................... 6图3算力中心架构到存储中心架构............................................................... 9图4新型AI存储特征................................................................................... 10图5AI存储结构分层.....................................................................................11图6长记忆存储架构..................................................................................... 12图7统一数据底座......................................................................................... 14图8医疗行业KV Cache长记忆存储应用实践...........................................19图9金融高性能AI存储应用实践............................................................... 21图10外置AI数据湖存储底座应用实践..................................................... 23图11某运营商智能存储盘框应用实践........................................................25图12制造企业超融合一体机应用实践....................................................... 27 表 目 录 表1国外人工智能存储战略布局................................................................... 3 表2国内人工智能存储战略布局................................................................... 4 一、新型人工智能存储概况 (一)新型人工智能存储基本概念 人工智能(Artificial Intelligence)起源于20世纪五六十年代,历经符号主义、连接主义和行为主义三次浪潮的相互交织发展,如今作为一项新兴的通用技术,正推动着社会生活与各行各业的巨变。随着大模型的爆发式增长和持续迭代,模型参数量从几万跃升至数千亿甚至更大,模型层数从开始的个位数逐步发展到成百上千,原始数据集也达到PB级,对以数据存储为代表的多领域产生了根本性的影响。 2024年2月16日,OpenAI再度引领风潮,发布了首款文生视频大模型Sora,大模型由单模态的NLP领域向文生视频等多模态方向迅速演进,标志着AI技术正迈向一个全新的高峰。相较于传统的NLP语言大模型,视频大模型所需的训练数据量极为庞大,原始数据体量相较于NLP能达到几百甚至上千PB级以上,2025年2月,Grok3发布,其多模态能力获得全球瞩目,Grok 3所用数据量比Grok 2增加了3倍,通过增加数据量而不是模型参数的方式实现了大模型能力的倍增。这些都对人工智能基础设施的数据存储和处理能力提出了极高的挑战。 来源:中国信息通信研究院 新型AI存储是指专为人工智能应用和服务设计的数据存储系统,具备超高性能、超大容量、极致安全、数据编织等特征,可以有效支撑海量数据的分析和学习,是AI基础架构不可或缺的组成部分,如图1。作为大模型的数据载体,新型AI存储与大模型数据归集、预处理、训练、推理等全生命周期流程紧密相关,且逐步成为AI数据全生命周期服务与管理平台的重要组成部分。当今在不同行业和组织内部具备形成多元化数据集的条件下,新型AI存储正在成为数据资源的统一管理平台,并以此为基础构成跨域跨部门的AI数据湖,为数据赋能提供关键的技术支撑。 (二)全球人工智能存储战略分析 国外较早布局人工智能战略,AI存储逐步成为战略关键技术竞争力的重要体现。欧盟委员会在2020年2月发布《人工智能白皮书》,确保对计算和数据基础设施的访问安全,同时提出改善数据访问和管理是根本。英国政府在2021年9月发布《国家人工智能战略》,AI 系统中的数据基础和使用将提高专业人工智能、软件和数据技术的能力,并支持关键的新型数据基础设施的发展。美国国防部在2023年11月的《数据、分析和人工智能采用战略》中,提出推进数据、分析和人工智能生态系统,同时改善




