您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:数据库专题系列一:挑战与机遇并存,数据库行业渐成百家争鸣之势 - 发现报告

数据库专题系列一:挑战与机遇并存,数据库行业渐成百家争鸣之势

信息技术2024-09-06闻学臣、苏仪、王雪晴中泰证券�***
AI智能总结
查看更多
数据库专题系列一:挑战与机遇并存,数据库行业渐成百家争鸣之势

数据库专题系列一:挑战与机遇并存,数据库行业渐成百家争鸣之势 2 0 2 4.9.6 分析师:闻学臣执业证书编号:S0740519090007 分析师:苏仪执业证书编号:S0740520060001 研究助理:王雪晴Email:wangxq03@zts.com.cn 摘要 ◼从全球视角来看,目前全球数据库产品数量整体分布以非关系型及混合型数据库为主;在流行程度方面,关系型数据库占据主导地位,根据DB-engines的数据显示,Oracle、MySQL、Microsoft SQL Server稳居前三,同时随着业务的多样化,多模数据库将成为新趋势;在市场份额方面,“云+数据库”战略成为技术发展新趋势,AWS以及微软占领市场前二。 ◼从国内视角来看,我国数据库产品数量呈现以关系型为主,非关系型数据库为辅的局面;在流行程度方面,PolarDB、OceanBase、openGauss热度持续攀升,排名前三;在市场份额方面,国内数据库市场仍被Oracle、Microsoft等国外厂商占据较多市场份额。 ◼挑战孕育着机遇。预计到2025年中国数据总量预计将跃居全球第一,占比有望达到27%以上,数据量的爆发式增长意味着将拉动数据库行业的需求空间。在本地部署模式下,国内关系型数据库市场格局中,海外厂商仍占据较多市场份额,在政策、新技术等因素的推动下,国内数据库厂商的市场规模及竞争力有望快速攀升。 ◼投资建议:数据库作为计算机系统的核心基础软件,同时也是信创产业的关键环节,我们认为在政策、新技术等因素的扶持下,国内数据库产业有望持续受益。当前时点,我们持续看好国内数据库产业的投资机遇,建议关注达梦数据、星环科技、太极股份(人大金仓)。 ◼风险提示:技术发展不及预期;行业竞争加剧风险;政策落地不及预期;研究报告使用的公开资料可能存在信息滞后或更新不及时的风险等。 CCONTE数据库:管理数据资源的基础软件 1.1数据库系统:数据、管理/应用软件与终端用户的统称 ◼数据库(Database,DB)数据库是结构化信息或数据的有序集合,一般以电子形式存储在计算机系统中。由数据库管理系统(Database Management System,DBMS)控制。DBMS能够与最终用户、应用程序和数据库本身进行交互以捕获和分析数据。广义上可将数据、数据库管理系统、应用软件以及对应的普通用户和管理用户统称为数据库系统(Database System,DBS)。 图表:数据库系统结构示意 资料来源:TowardsDataScience,Collidu,中泰证券研究所 1.2数据库软件的定位:计算机系统的核心基础软件 ◼数据库作为沟通企业应用软件和底层存储计算资源的纽带: ◼数据库为上层应用提供高效的数据管理和操作功能。数据库提供了易于使用的接口和查询语言,使得应用程序可以轻松地与数据库进行交互。通过数据库连接,上层应用可以实现数据的存储、查询、更新、检索和删除工作,满足应用程序对数据的需求。数据库为底层基础资源提供统一的数据访问接口。通过连接底层基础资源,数据库能够直接与存储设备、网络通信和系统资源进行交互。这种连接能力使得数据库能够有效地管理数据的物理存储,实现数据的持久性和可靠性,同时也为应用程序提供了高度的可扩展性和可定制性。 资料来源:信通院云计算开源产业联盟,中泰证券研究所 资料来源:《数据库系统概念》,中泰证券研究所 1.3数据库发展历史:主要分为三个阶段 ◼数据库发展历程主要可以分为前关系型阶段、关系型阶段和后关系型阶段。 资料来源:信通院,中泰证券研究所 1.3.1前关系型阶段(1960-1970):网状、层次数据库出现 ◼为解决“阿波罗登月”计划处理庞大数据量的需求,北美航空公司(NAA)开发出GUAM(Generalized Update AccessMethod)软件。其设计思想是将多个小组件构成较大组件,最终组成完整产品。这是一种倒置树的结构,也被称之为层次结构。随后IBM加入NAA,将GUAM发展成为IMS(Information Management System)系统并发布于1968年,成为最早商品化的层次DBMS。 ◼1963年,通用电气公司的Charles Bachman等人开发出世界上第一个数据库管理系统(以下简称DBMS)也是第一个网状DBMS——集成数据存储(Integrated Data Store,IDS)。 资料来源:信通院,中泰证券研究所 资料来源:信通院,中泰证券研究所 1.3.2关系型数据库阶段(1970-2008):SQL成为主流语言,RDB大规模应用 ◼1974年,Ingres原型诞生,为后续大量基于其源码开发的PostgreSQL、Sybase、Informix和Tandem等著名产品打下坚实基础。1977年,Oracle前身SDL成立。1978年,SDL发布Oracle第一个版本。 20世纪80年代,关系型数据库进入商业化时代。1980年,关系型数据库公司RTI成立并销售Ingres。1983年,IBM发布Database2(DB2) for MVS,标志DB2正式诞生。1984年,Sybase公司成立。1985年,Informix发布第一款产品。1986年,美国国家标准局(ANSI)数据库委员会批准SQL作为数据库语言的美国标准并公布标准SQL文本。 ◼1987年,国际标准化组织(ISO)也做出了同样决定,对SQL进行标准化规范并不断更新,使得SQL成为关系型数据库的主流语言。20世纪90年代,Access、PostgreSQL和MySQL相继发布。关系型数据库理论得到了充分的完善、扩展和应用。 图表:SQL支持关系型数据库 资料来源:数据库标准语言SQL,中泰证券研究所 1.3.3后关系型阶段(2008至今):模型拓展与架构解耦并存 ◼随着信息技术及互联网不断进步,数据量呈现爆发式增长,各行业领域对数据库技术提出了更多需求,数据模型不断丰富、技术架构逐渐解耦,一部分数据库走向分布式、多模处理、存算分离的方向演进。 ◼为了解决大规模数据集合和多种数据类型带来的挑战,NoSQL数据库应运而生,其访问速度快,适宜处理互联网时代容量大、多样性高、流动性强的数据。 资料来源:CSDN,中泰证券研究所 1.4.1根据数据模型分类:关系型Vs非关系型 ◼关系型数据库(Relational Database,RDB)以预定义的关系组织数据,将数据存储在一个或多个由列和行构成的表(tables)中,表之间通过特定的关系相互连接。截止2024年6月,全球关系型数据库共有330款,占比46%。 ◼非关系型数据库(Not Only SQL,NoSQL)与传统的关系型数据库不同,数据库不使用固定的表结构、主键和外键关系,而是提供更灵活的数据模型以适应不同的应用场景。其类型包括文档数据库(Document Store)、键值数据库(Key-Value Store)、列族数据库(Column Family Store)、图数据库(Graph Database)等。截止2024年6月,全球非关系型数据库产品共有383款,占比54%。 资料来源:Github,中泰证券研究所 资料来源:CCSATC601,中泰证券研究所 1.4.1关系型数据库:依靠关系建立二维表格,满足ACID规则要求 ◼关系型数据库以行和列的形式存储数据。关系型数据库这一系列的行和列被称为表,一组表组成了数据库。表是以行(元组Tuple)和列(属性Attribute)的形式组织起来的数据的集合。 ◼关系型数据库采用结构化查询语言(即SQL)来对数据库进行查询,也称SQL数据库。能够支持数据库的CRUD(增加,查询,更新,删除)操作。强调ACID规则:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability),可以满足对事务性要求较高或者需要进行复杂数据查询的数据操作,而且可以充分满足数据库操作的高性能和操作稳定性的要求。 图表:关系型数据库的一对一关系示意 资料来源:Wikipedia,中泰证券研究所 资料来源:《SQL查询:从入门到实践(第四版)》,中泰证券研究所 1.4.1非关系型数据库:适用于大数据量场景,较灵活、易扩展 ◼非关系型数据库(NoSQL)不保证关系数据的ACID特性,一般支持BASE原则(基本可用、最终一致性等),适用于大数据量、高性能的场景。代表性的数据库有文档数据库、键值数据库、列式数据库和图数据库四种类型,代表性的MongoDB、Redis、Cassandra和Neo4J等。 ◼大多数非关系型数据库具有灵活的数据模型,可以轻松地处理半结构化和非结构化数据;一般设计为分布式系统,能够处理大规模数据和高并发访问,较容易进行水平扩展。 1.4.2根据业务负载特性分类:OLTP、OLAP和HTAP数据库 ◼OLAP(On-Line Analytical Processing):联机分析处理,OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。系统性能与每秒执行的Transaction以及Execute SQL的数量等有关。它的主要功能包括查询、分析、预测、数据挖掘等,为用户提供灵活的数据分析和快速决策支持。 ◼OLTP(on-line transaction processing):联机事务处理,传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。OLTP系统通常用于处理企业的日常交易数据,例如订单处理、库存管理、银行交易等。它的主要功能是支持事务和实时数据处理,为用户提供高效的交易处理服务。 ◼HTAP(Hybrid Transaction and Analytical Processing):也称混合型关系数据库,是能同时提供OLTP和OLAP支持的混合关系型数据库。 资料来源:SAP,中泰证券研究所 1.4.3根据架构分类:分布式和集中式 ◼按照部署方式,数据库可以分为集中式数据库和分布式数据库两类。 ◼集中式架构的数据库的软硬件价格昂贵,更适合传统的、对可靠性需求较高的业务;分布式架构硬件平台兼容性强,能适合互联网等行业公司灵活、高并发的业务场景,但在安全性上有一定隐患。 1.4.3分布式数据库实现方法:中间件分布式与原生分布式 ◼分布式数据库解决方案可以分为分布式数据库中间件和原生分布式数据库。 ◼分布式数据库中间件是架构在多个传统单点数据库系统上的中间层解决方案,通过将数据分拆到不同的数据库节点上,利用中间件来管理和访问各个数据库中的数据,通常需要用户参与到数据分拆和节点管理过程中。 ◼原生分布式数据库是指从架构设计、底层存储和查询处理均面向分布式数据管理需求,数据库集群作为一个整体对外提供服务,用户无需关注集群内部的实现细节。从实现方式来看,可以先进行分布式存储,再叠加数据库能力;也可以基于分布式数据库理论实现的原生分布式数据库,先部署TP单机数据库引擎,再叠加分布式能力。 资料来源:华为云,中泰证券研究所 1.4.4根据商业模式分类:开源数据库与商用(闭源)数据库 ◼数据库主要分为开源和商用(闭源)两种。截止2024年7月,关系型数据库产品中约有41.5%为开源数据库,58.5%为闭源商用数据库。空间数据库、时序数据库等模型架构的数据库中开源占比较多,多值数据库、面向对象数据库、关系型数据库等类别中闭源商用占比较多。 资料来源:DBEngines,中泰证券研究所 资料来源:DBEngines,中泰证券研究所 1.4.5根据部署方式分类:云数据库与本地数据库 ◼根据部署方式不同,数据库可以分为云数据库和本地数据库。 ◼云数据库是一种基于云计算平台提供的数据库服务,它允许用户在云端存储、管理和处理数据。传统的普通数据库通常需要在本地进行部署和维护,需要购买和管理