您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[赛迪]:智库:中国分布式存储市场研究报告(2023年) - 发现报告
当前位置:首页/行业研究/报告详情/

智库:中国分布式存储市场研究报告(2023年)

信息技术2023-06-16赛迪S***
智库:中国分布式存储市场研究报告(2023年)

CCID赛迪顾问股票代码:HK02176思维创造世界中国分布式存储市场研究报告(2023) 满天星满天星数据报告政策满天星数据报告政策专营满天星满天星数据报告 政策专家满天星数据 报告 政策专营满天星满天星满天星数据报告政策专家满天星满天星数据报告政策专满天星数据报告改策数据 报告政策专家满天星满天星数据报告政装专满天星数据报告政策专家 满天星CONTENTS满天星目报告概览01满天星满天星满天星第一章厘清概念,把握分布式存储的核心要点一、分布式存储是什么04二、分布式存储的分类06天星三、分布式存储的优势08四、分布式存储的应用领域09满满天星数据报告政策专第二章量化研究,明确分布式存储的发展现状满天二、2020-2022年中国分布式存储市场结构三、2022年中国分布式存储主要场景市场四、2022年中国分布式存储区域市场18满天星满天星数据报告政装专满天星 满天星CONTENTS满天星目录第三章瞄准企业,洞察分布式存储的厂商动态满一、2022年中国分布式存储市场重大事件满天20二、2022年中国分布式存储厂商竞争力情况21数据报告三、2022年中国分布式存储部分厂商发展情况23四、2022年中国分布式存储部分细分市场情况24满天星第四章满夫谋篇布局,预测分布式存储的未来发展满天星一、2023-2025年中国分布式存储市场规模预测27数据报告政二、驱动及阻碍因素分析29三、分布式存储的发展趋势31满天星满第五章满天星数据建言献策,助力分布式存储的全面跃升企业:根植应用个性化需求投资机构:关注自研路线厂商政府及第三方协会:细化多维度标准星满天星 满天星满天星满天星报告概览分布式存储指基于分布式架构,通过软硬件协同,1010依托高效网络连接多个节点来实现存储功能的IT产满1010品和服务。在传统存储面临拓展性有限、结构化/非结构化数据兼容性不佳、I/O性能与成本不经济、可分布式存储与集中式靠性不高和面向新应用(如容器)支持能力有待提存储相互配合,满足了多个场景用户的个升、用户体验不佳等问题的背景下,分布式存储一性化需求定程度上与传统存储实现了较好配合相比传统的集中式存储,分布式存储在以下领域表现突出:满云原生:指“生在云上、长在云上”的政企业务场景,典型的有容器和微服务等高性能计算(HPC):支撑每秒百亿亿次浮点计算2022年,分布式存储在云原生、高性能计(EFLOPS)场景的分布式存储算(HPC)等领域表融媒体:指文件大且/O延迟要求低的元宇宙、虚拟现突出数字人和虚拟现实等场景智能备份:指视频监控、医疗影像和智能制造等场景满天星从规模看,近三年中国分布式存储市场规模均保持30%以上的高速增长,2022年市场规模达104.2亿元从结构看,2022年,文件存储占比最高,一体机、分布式混闪、虚拟化融合在各自领域占比较高2020-2022年,中国从场景看,HPC在2022年中国分布式存储主要场景市分布式存储市场规模场中居于重要地位快速发展;2022年文从区域看,2022年华北、华东地区占据半壁江山,京件存储占比最大津冀、长三角市场领跑满天星I01 满天星满天星满天星报告概览2022年中国分布式存储市场中,领导者有华为、中科曙光、浪潮、新华三满天挑战者有XSKY、SmartX、NetApp、Dell&EMC、焱融科技中国分布式存储厂商数据报告跟随者有同有、杉岩和中国电子云加快构筑自身竞争力可期待者有深信服和联想中科曙光在分布式存储教育科研和气象市场份额居首位,SmartX在分布式块存储金融市场居首位满天星满驱动因素:数据爆发式增长、可靠性要求提升、硬inin件性能提升、云原生加速业务创新阻碍因素:资金人才支撑不足、标准滞后缺失主要发展趋势:分布式块、文件和对象存储快速发预计到2025年,中国式存储市场规模有望展,分布式全闪存适用范围扩展,在云环境、云原达到211.4亿元生场景普及,自研线路具有较好发展前景满大重满天星企业:根植应用个性化需求,根据不同应用对存储性能的要求,提供高适配性产品投资机构:关注自研路线厂商,建议关注具备面向应用需求的架构自研、技术自研的厂商企业、投资机构和政政府部门:细化多维度标准,统筹产学研用各方力量,府部门需形成合力推动相关评测认证体系的推广宣贯和评测结果的发布满天星满天星102 满天星满天星数据报告政策满天星满天星数据报告政策第一章满天星满天厘清概念,把握分布式存储的核心要点满天星数据报告改筑满天星满天星01 满天星满天星随着数字中国加速落地,数据作为数字经济的核心部分,具有基础战略资源和关键生产要素的双重作用,对于建设网络强国、科技强国、质量强国都具有重要意义。在新一代信息技术不断迭代升级的背景下,全球数据量呈现爆发式增长。作为全球数据生产大国,中国数据量也面临急剧增长的态势。数据量的急剧扩展,愈发凸显了数据存储及管理的重要性。数据存储作为数据管理的必要手段,其发展迎来了新机遇。传统存储面临拓展性有限、结构化/非结构化数据兼容性不佳、数据读写任务(/O)性能与成本不经济、可靠性不高和面向新应用(如容器)支持能力有待提升等问题,用户体验不佳。在此背景下,分布式存储近年来迅速发展,一定程度上与传统存储实现了较好配合,满足了多个场景用户的个性化需求。分布式存储指基于分布式架构,通过软硬件协同,依托高效网络连接多个节点来实现存储功能的IT产品和服务。口占古占分布式架构:与集中式架构不同,分布式架构没有负责所有业务的中心节点,而是由多个可相互通信、协调的普通节点构成集群,对外提供服务。图1集中式架构与分布式架构中心节点满天星普通节点1普通节点2普通节点3众多可通信、协调的普通节点集中式架构分布式架构软硬件协同:硬件主要由存储控制系统(CPU、缓存)、硬盘/闪存盘和网络等构成,软件则是与硬件适配的存储操作系统,以及存储服满天务软件、管理软件、状态监控软件等应用软件。满天星04 满天星满天星表1常见的分布式存储软硬件类型名称特点CPU相比服务器的CPU,侧重计算数据存放位置、备份功能缓存常规操作无需更多内存,但在执行恢复操作时,内存负载大硬件硬盘/闪存盘考虑需求和成本,配置硬盘和闪存盘的数量网络每个存储节点至少2个千兆网卡;PB级集群则多为一个10G网卡操作系统调度硬件资源构成灵活的存储资源池软件服务软件提供副本、纠删码(EC)、远程复制、缓存加速等功能其他软件资源、硬件状态监控;简化配置、在线扩容等功能高效网络:并不是传统的TCP/IP网络,而是采用存算分离的设计思路不通过CPU,直接由内存传输到智能网卡完成I/O的远程直接地址访问网络(RDMA)0图3分布式存储架构图解决方案层虚拟化人工智能可靠存储医疗影像云原生自动驾驶智慧城市融合媒体应用服务层虚拟机云原生文件共享大数据应用程序存储协议层块存储文件存储大数据存储(HDFS)对象存储操作系统层自研/开源分布式存储系统存储资源层全闪存硬盘1混合闪存硬盘1混合闪存硬盘3全闪存硬盘2全闪存硬盘3混合闪存硬盘2混合闪存硬盘3通用存储节点可扩展节点存储节点1存储节点2存储节点3存储节点4...105 满天星二、分布式存储的分类满天星根据场景特点和需求,2022年中国分布式存储产品共有四种主要的分类方式:按存储对象,可分为分布式块存储、分布式文件存储、分布式对象存储、分布式统一存储;;按产品形态,可分为一体机、纯硬件和纯软件;按存储介质,可分为分布式全闪存、分布式混闪;按部署方式,可分为虚拟化融合方式、容器融合方式和分离方式。(一)按存储对象分类分布式块存储:指将各存储节点的硬盘、闪存盘等存储硬件资源通过划分逻辑卷(LVM)、创建独立余存储阵列(Raid)、逻辑分区等方式,由物理存储资源转化为面向需求的逻辑块,提高使用效率。图4分布式块存储示意图LVM1 LVM2Raid逻辑分区硬盘、闪存盘等分布式存储物理资源三类典型的分布式存储逻辑块分布式文件存储:指基于文件系统对各存储节点的数据进行存储,形成目录、子目录、文件,常见的分布式文件存储应用有Ceph、HDFS、GFS、FastDFS、GridFS、mogileFS、TFS等。图5分布式文件存储示意图天日F:/root/a/data1 F:/root/a/data2 F:/root/a/data3F:/root/a数据F:/rootF:/root/b/data1F:/root/b/data2F:/root/b/data3F:/root/b分布式对象存储:指各存储节点由标识符、数据和元数据的对象数据构成。其中标识符在该存储系统中唯一,用于区分不同存储区域;元数据将提取数据特征,便于快速检索。分布式对象存储相比块存储和文件存储,数据查找和提取的效率大大提升,适用于文本、音频、视频等非结构化数据。满天星106 满天星分布式统一存储:指各存储节点同时支持块、文件和对象三大类型数据,满足虚拟化、云平台和容器平台等新兴存储需求,为用户提供服务典型应用和计算平台的统一存储资源池。(二)按产品形态分类一体机:从设备层面将各节点存储资源进行融合优化,同时软硬件为同一厂商生产,一体交付,适配度高,可有效缓解单个节点或设备短板导致整体系统功能受影响等问题。扩展能力较强,且可在线增加节点,对前段业务完全透明。不足之处是价格偏高。纯硬件:指交付形态为磁盘阵列、闪存盘集群等硬件资源的分布式存储产品,适配的软件分为自研和开源二次开发两种路线。纯硬件交付模式成本高,但可靠性较高,适用于重要敏感数据存储场景。纯软件:指交付形态为定制化应用软件、平台授权码等的分布式存储产品,一般应用于优化存储硬件的场景,如老旧数据中心改扩建等。纯软件交付定制化空间大、成本低、交付周期短,但扩容及存储硬件兼容性问题一定程度上也会影响运行效率。满天星(三)按存储介质分类分布式全闪存:指各存储节点完全由固态硬盘(SSD)构成,主流的适配接口为NVNe,每秒读写次数(IOPS)可跃升至百万级别,相比传统的机械硬盘(HDD)提升了近千倍。缺点是价格高昂,且受限于系统总线协议和其他部件,分布式全闪存性能较难完全发挥。分布式混闪:指各存储节点由SSD、HDD等构成。尽管性能不及分布式全闪存,但可针对场景需求进行个性化定制,从而最大程度上均衡成本和性能,是目前主流的分布式存储产品。满天星(四)按部署方式分类天宝虚拟化融合:指在分布式存储(块存储为主)的架构基础上,利用服务器虚拟化的隔离机制,实现存储和服务器虚拟化在同一硬件节点上的部署。这种架构的优势在于整体架构更为简单,并且节省了硬件成本,缺点是计算和存储需要同时扩展,不适用于计算和存储应用不均衡的场景。容器融合:面对容器化持久化存储日益增长的需求和Kubernetes特有的管理架构,专门针对此类场景的分布式存储产品也开始涌现。容器融合的分布式存储产品对K8s集群内的存储资源进行整合与管理,不仅可以通过与容器融合部署降低成本,简化系统架构,还可以无缝融入K8s原生的开发和运维体系,更加符合K8s运维团队的使用习惯。107 满天星图6分布式存储容器融合部署方式满天星Kubernetes RancherMySQL厂商自研OpenshiftMesos容器管理Spark平台NomadI TensorFlowIDockerSwarm分布式存储物理资源容器插件开源/自研容器管理平台基于容器的各类应用分离:指各存储节点资源与应用分离,虽然架构更加复杂并需要更多的硬件节点,但方案更为灵活,并适用更多场景,尤其适合大容量的数据存储,以及从裸金属、虚拟化到容器的不同计算节点的混合资源池。三、分布式存储的优势高可靠性:分布式存储的数据采取存放在多个存储节点中的全几余部署,通过多时间点快照、周期增量复制两大核心技术,可实现在一定时间间隔内,对各版本数据的保存,并且同时进行恢复,可帮助分析和研究,避免类似灾难的再次发生。图7多时间点快照、周期增量复制技术原理写入/再写入满天星在T2时间,仍可恢复TO时间的数据版本形成存校验储块/文件/对象读取文件1的I/O周期版本1版本2版本3版本4复制TOT1T2同步文件1其他文件满天星多时间点快照技术周期增量复制技术