您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[沙利文]:2023年中国关系型数据库产业发展和行业应用 - 发现报告
当前位置:首页/行业研究/报告详情/

2023年中国关系型数据库产业发展和行业应用

信息技术2024-02-01沙利文苏***
2023年中国关系型数据库产业发展和行业应用

中国关系型数据库产业发展和行业应用(2023)中国关系型数据库产业发展和行业应用(2023)——国产数据库助推产业创新,塑造数字化未来新格局 中国关系型数据库产业发展和行业应用(2023)目录1u数据库产业概况---------2•数据库的概念及主要类型•数据库技术发展趋势u中国关系型数据库市场现状---------9•国产数据库品牌逐渐崛起及采取多种技术路线•国内开源数据库根社区和根生态初步形成u中国关系型数据库市场重点行业应用场景与特点---------15•金融及电信行业数据库应用场景与特点•政府及制造行业数据库应用场景与特点u国产数据库在重点行业应用态势分析---------20•数字化创新转型由一般系统转向核心•集中式数据库在OLTP核心系统的作用不容忽视•分布式数据库成为金融、电信等行业的新选择•应用更关注数据安全•兼容性、迁移适配方法论逐步成熟u国产数据库行业应用深化面临的问题---------27•关键核心技术能力不足;行业应用迁移替代难度大•产业生态力量布局分散;产业链风险问题急需解决•数据库专业研发人才短缺u对策建议---------32•强化原创性技术创新;深化行业应用牵引机制•优化产业发展环境;保障产业链韧性安全•加大研发人才培养力度 中国关系型数据库产业发展和行业应用(2023)关键发现数据库的概念与分类关系型数据库(SQL),采用了关系模型来组织数据,以行和列的形式存储数据。关系型数据库的行和列的集合被称为表,表的集合则组成数据库。其诞生40多年,已形成较为成熟的产品体系,代表产品如Oracle、DB2、SQLSever、MySQL、PostgreSQL、openGauss等,其优点是事务的一致性,在金融等行业要求数据完整性、一致性较高的领域中广泛应用。非关系型数据库(NoSQL),泛指除关系型以外的数据库,是对关系型数据库的一种补充。非关系型数据库的产生是为了解决大规模数据集合多重数据种类带来的诸多挑战,尤其是大数据应用难题,其包括:键值存储数据库(Key-value),典型产品有Memcached、Redis和Ehcache;列存储数据库,典型产品有Cassandra和HBase;面向文档数据库,典型产品有MongoDB和CouchDB;图数据库,典型产品如Neo4J、InforGrid;时序数据库,典型产品如InfluxDB。非关系型数据库具有扩展性强、高并发读写、灵活的数据模型等特点,广泛应用于数据量大的业务系统。但是也存在明显的短板,如,种类多、需要兼顾各类非关系型数据难度较大、无法对传统的数据类型(关系型)的应用进行升级等。•数据库(Database)是按照数据结构来组织、存储、管理,并且可共享的数据集合软件,是IT系统存储与计算的基础,与芯片、操作系统共同组成IT系统的核心,广泛服务于各类行业应用,是软件产业生态体系构建的重要枢纽•按照不同的维度,数据库有不同划分(1)按数据结构模型可分为关系型数据库和非关系型数据库;(2)按网络架构可分为单机型数据库、存算分离性、集中式数据库和分布式数据库;(3)云数据库,是指被优化或部署到一个虚拟计算环境中的数据库按数据结构模型可分为关系型数据库和非关系型数据库章节一数据库产业概况2来源:沙利文整理数据库的分类非关系型数据库关系型数据库NoSQLNewSQL分布式数据库Lotus NotesCouchDBMongoDBSequoiaDBDynamoRiakRedisVoldemortBerkeleyDBHypertableHbaseHypertableSimpleDBNeo4JGraphDBInfiniteGraphOrientDBOracl IBM Db2 SQL Server MySQL openGauss PostgreSQL EnterpriseDB IngresGaussDBGbase-8AOceanBasePolarDB-XGoldenDBDragonBase键值文档图列储存即服务aaSAmazon RDSSQL AzureTDSQLTiDBSimpleDBApp EngineDatastoreHadoop BriskMcObject DryadHadaptCouchbaseCassandraCloudantMySQL ClusterVoltDBScaleBaseTranslatticeNimbusDBFoundationDBGreenplumProgressObjectivityMapReduceMarkLogicVersant 中国关系型数据库产业发展和行业应用(2023)数据库按结构模型分类3来源:沙利文整理名称定义典型应用场景关系型数据库支持关系数据模型,由库、表、数据类型,记录组成,按元素关系组织的数据库。事务型为主非关系型数据库键值数据库只能存储键和值,满足高性能需求。嵌入式系统或高性能进程需求列存数据库能容纳大量动态列。由于列名和记录键不是固定的,并且由于记录可能有数十亿列,因此宽列存储可以看作是二维键值存储。查找速度快;支持分布横向扩展;数据压缩率高分析型业务场景文档数据库面向文档的数据库系统,其特征在于它们的无模式数据组织文件管理等图数据库面向图的数据库,将图结构中的数据表示为节点和边缘,表达节点之间关系。社交、零售、金融风险、公共安全时序数据库时序数据库是一个针对处理时间序列数据进行了优化:每个条目都与一个时间戳相关联的数据库管理系统。物联网实时数据库结合实时处理技术,直接实时采集系统运行过程中的数据的数据库系统。流控制、工业控制关系型数据库与非关系型数据库特点类型关系数据库非关系数据库优点容易理解、使用方便、易于维护无需经过SQL层的解析,读写性能很高、数据容易扩展、存储数据的格式多样化缺点处理高并发读写性能较差、表结构较为固定、不便于更改扩展处理多种非关系型数据库具有挑战性、难以对传统关系型应用进行升级代表产品Oracle、MySQL、SQLSeverMongoDB 、CouchDB关系型数据库与非关系型数据库优缺点关系型数据库优点在于数据结构清晰、提供ACID事务特性和丰富的管理工具,但在高并发读写和数据扩展方面表现较差。非关系型数据库具有高读写性能、灵活的数据结构和扩展性强的优点,但处理多种数据库和升级传统关系型应用方面存在挑战。 中国关系型数据库产业发展和行业应用(2023)数据库按网络架构分类4来源:沙利文整理单机型数据库、存算分离性、集中式数据库和分布式数据库特点分类应用介质数据存储应用场景单机型单机PC服务器,小型机,或大型机本地硬盘小规模企业存算分离型多个PC服务器,小型机,大型机高速网络技术,整合存储外挂,磁盘阵列,分布式存储中等规模数据应用集中式数据库多个PC服务器,小型机,大型机共享磁盘,磁盘阵列,全局资源管理数据是共享,主要用在企业级核心业务,满足高可用和性能要求分布式数据库多台服务器无共享架构(Shared Nothing),不对其中的磁盘和内存进行实时同步数据是分散存储的,面向互联网、电商等业务场景,关注点在于横向扩展能力、高可用和性能要求单机数据库即是传统意义上的数据库,又称为完全共享型(SharedEverything)数据库。数据库管理软件部署于单台服务器上(PC服务器,小型机,大型机等),使用本地磁盘存放数据。存算分离型数据库是指数据库管理软件依旧部署到单台服务器上,但是存储部分利用高速网络技术,将存储外挂,利用磁盘阵列,分布式存储等设备将单台服务器的有限存储进行拓展。集中式数据库是指采用集中式架构,将数据存储在大型主机或小型机上进行集中管理,其操作系统,中间件,数据库等“基础软件”多为闭源商用系统,典型的集中式架构是IOE(IBM, Oracle,EMC)提供的计算设备、数据库技术和存储设备共同组成的系统,同时也是目前银行、电信等行业的主流应用模式。分布式数据库是由若干个节点集合而成,它们通过网络联接在一起,每个节点都是一个独立的数据库系统,它们都拥有各自的数据库、中央处理机、存储,以及各自的局部数据库管理系统。分布式数据库具有高可用、高可靠、可扩展的特性,在Google、Amazon、Facebook、阿里巴巴、腾讯等互联网公司广泛应用。随着数据量大幅增长以及高并发环境下对数据处理能力的要求越来越高,分布式数据库也逐渐被金融行业关注和应用。 中国关系型数据库产业发展和行业应用(2023)集中式数据库分布式数据库定义仅在一个位置上储存、定位和维护的数据库分布于计算机网络且逻辑上统一的数据库可扩展性横向扩展受限,支持纵向扩展支持横向扩展扩容弹性大变更需停机快速迭代、小时级投产、分钟级在线扩容成本扩展需要高配置硬件,集中式存储系统成本较高利用廉价PCServer组建集群,成本相对较低,但Server数量需求较多兼容性无法进行非结构化大数据处理,硬件兼容能力弱支持非结构化大数据处理,硬件兼容能力强高并发能力可以支持单表千万级数据量的存储,但是难以支撑密集的并发读写,存在容量与性能瓶颈关联多个节点,减少单个节点数据量;实现并行计算,支持PB级数据量访问,以及百万级高并发事务性遵循ACID遵循CAP、BASE,少数提供ACID能力自治性集中式控制、厂商标准、封闭局部DBMS自治性、产业标准、开放可用性系统监控与发布部署有架构优势容灾机制和故障恢复有架构优势分布式数据库与传统数据库的区别5来源:沙利文整理集中式数据库 vs 分布式数据库集中式与分布式数据库各有优缺点。近年来、分布式数据库架构发展比较迅速,首选,在经济性方面,分布式架构通常能够更有效地利用计算资源,通过水平扩展来降低成本,而集中式数据库往往需要昂贵的硬件和基础设施来支持其运行;其次,在安全自主性方面,分布式数据库往往设计有更严格的权限控制和数据隔离机制,能够更好地保护用户数据的安全和隐私;此外,分布式架构在灵活性和可伸缩性方面也具有显著优势,能够轻松应对不断变化的业务需求和数据量增长。虽然集中式架构在可维护性和一致性方面可能更具优势,但分布式系统通过采用先进的分布式中间件和运维平台,也可以达到甚至超过集中式数据库的性能和可靠性水平。分布式中间件可以帮助管理和协调分布式系统中的各个节点,提供统一的服务接口和数据处理能力,从而简化开发和运维的复杂性。同时,运维平台可以对分布式系统进行全面的监控和管理,确保系统的稳定性和高效运行。 中国关系型数据库产业发展和行业应用(2023)云数据库6来源:沙利文整理云数据库是指被优化或部署到一个虚拟计算环境中的数据库,可以实现按需付费、按需扩展、高可用性以及存储整合等优势,其本质是将各类数据库技术与云平台技术结合,通过虚拟化、容器化或者裸金属等方式将数据库进行云化管理,以服务的形式对用户进行交付,而非传统的License交付。云数据库不仅提供WEB界面进行配置、操作数据库实例,还提供可靠的数据备份和恢复、完备的安全管理、完善的监控、轻松扩展等功能支持。相对于用户自建数据库,云数据库具有更经济、更专业、更高效、更可靠、简单易用等特点,使用户能更专注于核心业务。数据库不同分类维度之间,可以互有交叉。一个数据库产品可同时是“关系型-决策型-分布式”,如Greenplum数据库、DMMPP数据库等。同一个分类维度之间也不是“非黑即白”,存在“跨界”产品。如混合事务-分析处理数据库(HTAP)同时具备事务型数据库和分析型数据库的能力,多类型数据库是可同时管理关系型、键值型、文档型等模型的数据库。由于中国数据库产品呈现以关系型为主,非关系型数据库为辅的局面,关系型数据库在中国数据库总体市场中的占比超过60%,成为中国数据库创新发展的“主战场”,本报告的分析集中于关系型数据库领域。云数据库特点•云数据库可弹性扩展,快速提供存储和计算资源,适应业务增长,无需大量人力和硬件投入弹性拓展高可用可信赖灵活可定制•云数据库具备高可用和可靠性,通过分布式架构和冗余备份,确保故障时的数据安全和系统可用性,保障业务连续性•云数据库灵活可定制,提供丰富配置选