您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[墨天轮]:2022年4月中国数据库行业分析报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2022年4月中国数据库行业分析报告

信息技术2022-04-20-墨天轮笑***
2022年4月中国数据库行业分析报告

modb.pro2022年4月中国 数据库行业分析报告墨天轮行业分析研究中心2022年04月 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济摘要www.modb.pro2022年4月共有205个数据库参与排行,整体分数都有上涨,排行榜上前十被关系型数据库霸占,同时,键值、图形以及时序等类型的 NoSQL 数据库也在悄然崛起。TiDB 四月得分上涨37.31,总分616.84,稳夺桂冠。openGauss 4月得分上涨6.1%,总分567.42,夺得榜眼。OceanBase 本月分数543.22,相较于上月分数上涨53.28,得分涨幅10.8%,位居榜单第三。华为GaussDB挺进前四,榜单前八得分扶摇直上,人大金仓排名上升一位,TDSQL名次连续下降至第九。AnalyticDB 本月得分虽然下跌了8.87,但是仍居第十名,并且半年内分数涨幅28.6%。TDengine 位列时序数据库榜单第一,TGDB 获得四月排行榜图形数据库第一。随着数据库应用市场蓬勃发展,需求和产品多样化,用户选择合适的数据库变得越来越难。如何能够客观全面评价数据库产品,成为研发和使用数据库的重要内容之一,数据库竞争力维度也备受关注。关系型数据库仍是主流,当前部署形态主要分为两种,分别是本地部署和云原生数据库。按照架构分类主要有三类:单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。此外NoSQL、NewSQL、多模数据库等细分领域数据库市场份额也在不断扩大。据估计中国数据库市场规模2025年有望接近7百亿元,从2019年开始资本大量进入中国数据库行业,其中2021年来更是井喷式爆发,融资次数达到了20多次,融资额度超过30亿人民币。近期俄乌战局日益焦灼,西方各国相继宣布制裁俄罗斯,Oracle、IBM、微软、SAP等科技巨头相继宣布暂停对俄罗斯服务,这一系列制裁动作让技术人认识到“科技无国界”是个伪命题。俄罗斯的前车之鉴无疑给中国的数据库人敲响了警钟,开源有国界吗?国内数据库以及相关从业者该走向何方?国产数据库的替代化之路还有多远呢? 这些问题的解决迫在眉睫。当前,国内数据库产业呈现出百花齐放、百家争鸣的局面,新型硬件、新型交叉学科技术、新型数据模型、安全隐私等因素对数据库技术的发展起到了至关重要的作用,产生了很多的新型数据处理技术,主要包括基于新型硬件的数据管理、智能数据管理、多模数据管理、数据安全和隐私保护。但无论是产业规模,还是产品能力,跟国外主流公司和产品还有不小的差距,在政策体系、标准统一、产品能力提升、关键技术攻关、服务体系建立、企业管理规范等方面问题亟待解决,数据库产业化中的战略、人才、生态、知识产权保护与竞争等问题依旧严峻。 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济目录 content一、中国数据库流行度排行二、数据库基本概念及分类三、发展面临的挑战和趋势四、中国数据库典型案例 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济中国数据库最新流行度排行来源:墨天轮 www.modb.pro/dbRank中国数据库流行度排行是墨天轮于2019年推出聚焦国产数据库的名录和榜单,通过搜索引擎、趋势指数、三方评测、专利论文、招聘岗位等近50个维度的数据来考察当月国产数据库的流行度,每月更新一次,当前已经有205个数据库参与排行。模型分类开源占比分布式占比中国数据库厂商登记专利+论文数TOP10中国数据库概览四月暖阳至,行业春风来,整体分数都有上涨,TOP10基本稳定不变。TiDB 四月得分上涨37.31,总分616.84,稳夺桂冠。openGauss 4月得分上涨6.1%,总分567.42,夺得榜眼。OceanBase 本月分数543.22,相较于上月分数上涨53.28,得分涨幅10.8%,位居榜单第三。华为GaussDB 挺进前四,榜单前八得分扶摇直上,人大金仓排名上升一位,TDSQL名次连续下降至第九。AnalyticDB 本月得分虽然下跌了8.87,但是仍居第十名,并且半年内分数涨幅28.6%。 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济NoSQL数据库最新流行度排行排行榜上前十被关系型数据库霸占,当所有目光聚焦在这类数据库时,键值、图形以及时序等类型的 NoSQL 数据库也在悄然崛起,奋力向前。根据 DB-Engines 的数据,在过去的几年中,图形和时序数据库成为增长趋势最快的数据库类型。 墨天轮排行榜上 NoSQL 数据库排名的 TOP 10,几乎被图形和时序数据库“瓜分”。在本月排行榜中, TDengine 位列时序数据库榜单第一,这是涛思数据推出的一款开源的专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台。TGDB 获得四月排行榜图形数据库第一名,这是腾讯云推出的一款原生的分布式并行图数据库,其也凭借自身强劲的产品优势,正在各领域不断落地并塑造标杆。来源:墨天轮 DB-Engines 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济中国数据库魔力象限墨天轮参考 Gartner 的魔力象限模型,选取2021年年度平均分排行前40的数据库产品,通过2021年平均分、最新得分、三方评测、生态以及论文和专利数量综合评定。最后将数据汇总到两个维度上 — Ability to Execute 和 Completeness of Vision ,根据各家数据库产品的表现,将其划分入如下四个象限中:领导者象限:TiDB、OceanBase、PolarDB、达梦、GaussDB、openGauss、TDSQL;挑战者象限:Gbase、人大金仓;远见者象限:AnalyticDB、SequoiaDB;特定领域象限:GoldenDB、TcaplusDB、Goldilocks、UXDB、TDengine、MogDB、EsgynDB、神舟通用。2021年度数据库奖项最具影响力数据库奖TiDBOceanBase达梦卓越表现数据库奖openGauss人大金仓GaussDB最具潜力数据库奖StarDBMatrixDBMogDB年度云原生数据库PolarDBGaussDBTDSQL2021年中国数据库魔力象限年度图数据库Alibaba GDB年度时序数据库 TDengine年度内存数据库TcaplusDB墨天轮通过客观中立的指标遴选,长期的跟踪分析,得以从一个侧面呈现出国产数据库的发展和繁荣,共有14家国产数据库厂商获得2021年度数据库奖项荣誉。来源:墨天轮 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济一、中国数据库流行度排行二、数据库基本概念及分类三、发展面临的挑战和趋势四、中国数据库典型案例 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济数据库基本概念来源:墨天轮广义的数据库通常指数据库系统(DBS),其包含数据库与数据库管理系统两部分,向上通过数据库管理系统支撑应用引擎,向下以数据库承接文本、图像、声音等数据源,调动计算、网络、存储等基础资源。数据库(Database, DB)是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合,是按照一定的逻辑结构组织、存储、管理数据的大容量电子文件柜。数据库管理系统(Database Management System, DBMS)是对数据库进行统一管理和控制的大型软件,主要由内核组件集和驱动组件构成,其中内核组件集按照功能模块划分为管理组件、存储组件、计算组件和网络组件。应用系统整体架构数据库系统(DBS)数据库管理系统(DBMS) 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济关系型数据库基本概念来源:墨天轮、维基百科关系型数据库的基础是关系数据模型,由关系数据集、完整性约束规则和关系运算三部分构成。 通常情况下,关系数据集用多个表格作为数据结构来表示。用户可以定义表之间的关联。表中的列可以进行连接、并、交、差等关系代数运算。按业务负载特征进行分类,关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足处理在线的实时交易事务场景,而分析型数据库满足分析业务场景,混合负载数据库目标是同时处理简单交易和复杂分析场景。随着数据库应用市场蓬勃发展,需求和产品多样化,用户选择合适的数据库变得越来越难。如何能够客观全面评价数据库产品,成为研发和使用数据库的重要内容之一,数据库竞争力维度也备受关注。TPOLTP (Online Transaction Processing):OLTP是能够提供实时在线处理事务,同时保证实时强一致性的关系型数据库。APOLAP (Online Analytical Processing):OLAP是指支持对大规模数据进行较为复杂的联机分析处理的关系型数据库。HPHTAP (Hybrid Transactional/Analytical Processing): HTAP是指能够同时支持在线事务处理和复杂数据分析的关系型数据库。事务处理事务必须作为一个单元完成并写入数据库,否则事务的各个组成部分都不应执行。SQLSQL(结构化查询语言)用于与关系数据库通信的接口。数据完整性数据完整性指的是数据的整体完整性、准确性和一致性。ACID 所有数据库事务都必须遵守 ACID,即必须是原子的、一致的、隔离的和持久的,以确保数据的完整性。关系型数据库重要特性数据库竞争力高可用扩展性混合负载安全性高性能智能化关系型数据库分类 乐 / 知 / 乐 / 享 同 / 心 / 共 / 济关系型数据库架构分类来源:墨天轮、官网当前部署形态主要分为两种,分别是本地部署和云原生数据库。按照架构分类主要有三类:单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。本地部署在本地的硬件、网络和其他基础设施上,安装的软件服务。它在真正被使用前,需要大量软硬件开发成本,并且产生很多费用;后期使用时也需要专门人员升级维护,并且需要大量维护成本。集中式多台机器联合管理数据,一般不对数据进行分片。单机一般都是 shared everthing 架构,即共享所有计算资源(CPU、RAM、Disk)和数据。集群一主多备单台主机模式部署,其他备机为主机备份数据且不可读,并且可以在主机宕机的情况下,代替主机提供服务。一写多读多个计算节点一写多读服务,其中一个节点提供写服务,其他多个节点提供读服务。写节点宕机时,读节点可以代替写节点来提供服务。多写多读多个计算节点共享存储,每个节点都提供读写服务。为了解决写冲突一般采用分布式锁或者集中式锁的方式来实现。分布式将数据从物理上分割,并分配给多台服务器或多个实例,每台服务器可以独立工作。分布式中间件基于单机数据库、分库分表中间件划分数据,实现数据的划分、查询下发、结果收集,进而实现数据库的可扩展性。适合数据能够完美分片到各个节点,节点间没有数据交互的场景。分布式数据库对数据进行分片(sharding),通过全局事务处理模块和分布式查询处理模块支持原生支持分布式事务和全局复杂查询。云原生云计算技术的持续创新和成熟商用,也为分布式数据库云化部署提供了便利和可能。云原生数据库以虚拟化、分布式化和运维自动化为基本原则的云计算技术,采用通用硬件平台,提供资源快速发放、快速回收复用的弹性能力。基础架构具备“跨AZ、跨域”分布式高可用和容灾能力。分布式数据库在架构层面天然具有与云平台的高度亲和力,基于底层虚拟化技术,可以实现分布式数据库弹性伸缩,副本冗余高可用,以及跨AZ、跨“地域(region)”的容灾能力。借助云平台成熟统一的自动化运维工具,可以大幅降低数据库运维管理成本,利用云平台运维监控数据实现机器学习精准训练,未来将实现基