数据库行业分类 数据库系统按其储存数据的组织方式,可分为关系型数据库与非关系型数据库(HTML、图片、音频、视 频),其中关系型数据库典型代表为MySQL数据库,非关系型数据库如MongoDB、Redis;按其设计架构可分为集中式数据库(如达梦数据库、人大金仓数据库)和分布式数据库(如Cassandra数据库);按其数据存储方 式可分为列式数据库(如Google bigtable数据库)与行式数据库(如Oracle、SQL Server)。目前普遍应用的 分类方式为关系型与非关系型数据库。 关系型与非关系型数据库 关系型数据库作为广泛使用的数据库类型,基于关系模型存储和管理数据。通过多表储存、数据共享的方式相互关联。具备结构化、一致性数据的同时存储数据的灵活性受到结构化制约。该类型数据库更加适用于处理结构化数据和复杂查询的场景,例如金融系统、电子商务网站、在线零售商、教育机构和政府机构等。 关系型数据库 数据库分类 非关系型数据库不同于传统关系型数据库,不依赖于标准查询语言和预定义表格结构来存储和管理数据。可存储各种类型的数据,包括结构化、半结构化和非结构化数据。具备数据储存的灵活性与水平扩展性,以通过增加更多的服务器来处理更大的数据集。同时,非关系型数据库的数据模型和查询语言需学习新概念和操作技能。其技术相对较新,对比关系型数据,技术体系尚未完全成熟和稳定。 非关系型数据库 [3] 1:探索与观察期刊-《常用… 数据库行业特征 中国数据库行业具有海外厂商主导、非关系型数据库渗透以及政策驱动行业线上发展的趋势。数据库行业 中,中国数据库厂商成立时间主要集中于2013-2017年间,仍属于发展初期阶段,上世纪90年代海外成熟的数据 库进入中国市场取得先发优势,2012年在大数据国家战略背景的推动下国产数据库快速发展追赶,中国以数据库为主营业务的初创公司数量逐渐增多,根据中国信通院数据,2013-2017年间数据库初创企业为38家,占比 [6] 48%;根据大数据技术标准推进委员会统计数据,截止2023年6月,中国数据库供应商数量达到150家。 [7 海外厂商主导 海外数据库先发优势突出,国产数据库快速发展 相较海外厂商来说,中国数据库研究起步较晚,20世纪90年代改革开放以后才开始进入萌芽阶段,该阶段数据库服务主要以附属技能的形式由软件开发商和硬件服务商提供,缺乏实际的业务场景驱动,因此中国 数据库技术发展较为缓慢,由于前期云计算技术仍未发展成熟,直至2017年数据库本地化部署市场份额格 局保持稳定。根据中国信通院数据,以Oracle、IBM、Microsoft、Teradata 等为代表的产品占据数据库传统部署模式市场份额90%以上,以达梦、人大金仓、南大通用、神舟通用为代表的国产数据库整体市场 份额较小。 非关系型数据库渗透 中国数据库产品呈现关系型数据库为主,非关系型数据库为辅发展趋势 非关系型数据库以其数据存储的灵活性和强大的数据处理能力,适用于需处理大规模数据集、高性能查询 和灵活数据模型的场景(例如社交网络、实时分析、物联网和大数据处理等)。目前,中国数据库市场产品呈现关系型数据库为主,非关系型数据库为辅的特点。根据大数据技术标准推进委员会数据,关系型数 据库156个,非关系型数据库有82个,占比分别为65.5%和34.5%。 政策推动国产替代 国家信创政策推动数据库的线上发展模式 国家政策对以数据库为核心领域的鼓励态度促使数据库融合云计算产业,从数据库传统部署方式向云上部 署发展,例如《“十四五”数字经济发展规划》中明确云计算、大数据等高新技术的深层次融合。凭借云计算行业的快速发展,中国数据库厂商在线上业务方面取得优势。根据中国信通院数据,2020年中国公有 数据库发展历程 1940年至1970年为数据库发展的萌芽期,数据库的创建基于知识层面的创新,通过知识的不断更新迭代为数据库提供发展动力。标志性事件为1961年通用电气公司创造的世界第一个数据库管理系统,解决层次结构无 法建模更复杂数据关系的问题,同时,仍然存在数据独立性和抽象数据认知方面的缺陷。 1970年至2008年为(关系型数据库)高速发展阶段,数据库的发展开始基于技术创新。自从1972年IBM提 出关系型数据库模型,分离数据的逻辑结构与物理存储的新型观念成为现代数据库的标准原则。1980-1990期 间,数据库逐渐开始其商业化应用,Oracle、DB2及SQL Server出现。 2009年至今为(关系型数据库)成熟阶段,此阶段中,由于知识创新、数据量增长和数据多元化的呈现方 式不仅加速数据库产品类型多样化,还促使数据库与其他产业之间的深层次融合。例如阿里巴巴成立阿里云,开 始研发自己的数据库产品AliSQL;华为、腾讯等企业相继加入自主研发队伍,推出自有数据库产品。 [9 萌芽期 1940~1970 1961年通用电气公司创造的世界第一个数据库管理系统。 数据库模型主要为层次数据库和网络数据库,数据结构复杂,操作困难; 数据库技术不普及,主要应用于大型企业和政府;依赖于知识层面的创新。 高速发展期 1970~2008 SQL体系初建立,美国三巨头(Oracle,MySQL,SQL Server)统治全球市场。 1977年中国召开第一次数据库年会,改革开放引领浪潮,积极引入国外技术,以三大巨头为代表的海外数据库于90年代席卷中国。 1999年,中国首个数据库“人大金仓KingbaseES数据库系统”诞生,随后武汉达梦数据库、神通数 据库系统等国产数据库系统相继面世,打破Oracle、IBM的市场垄断格局。 成熟期 2009年,阿里巴巴成立阿里云,开始研发自己的数据库产品AliSQL;随后,华为、腾讯等企业相继 加入自主研发队伍,推出自有数据库产品; 2019-2022年,腾讯云发布多种关系型与非关系型云数据库; 2021年,华为联合数据企业布局分布式数据库的创新存储方案业务。 关系型数据库技术成熟,被广泛应用; 非关系型数据库得到大数据、云计算等应用空间; 数据库与其他产业融合。 产业链上游 生产制造端 硬件及数据服务 上游厂商 英特尔(中国)有限公司 海光信息技术股份有限公司 深圳市海思半导体有限公司 查看全部 产业链上游说明 数据库的上游为硬件及数据服务,其中硬件主要包含芯片和数据存储的DRAM、NAND存储技术;数 据服务主要包含数据库平台工具与数据库服务提供。 从供给端来看,全球芯片市场业务的主要参与者有英特尔、AMD与英伟达及中国厂商海思与联发 科。中国在芯片产业与西方发达国家仍有较大差距,存在技术、产业、产品三个方面的后发劣势,现阶段在芯片领域对海外依赖性较强。近年由于国际局势不稳定,中国的全球芯片供应链存在波动情 况。例如,美国自2018年开始,通过对华关税、限制贸易出口等措施试图将中国排除在全球芯片供应链外。由于中国自主研制芯片在技术性能方面不能匹配海外芯片,无法做到直接代替的效果。因此, 基于该情况,上游环节的供给收缩或提升上游产品价格从而影响中游数据库产品价格,根据海关数据 显示,2023上半年中国集成电路(IC)进口量同比下降18.5%。 从上游发展态势来看,一方面,随着大数据技术的不断推进,数据库对数据存储的需求呈现大幅增长 从而带动数据存储行业规模,根据《如何推动中国数据存储产业高质量发展》中研究数据,中国数据存储行业市场规模由2017年的3494亿元增长至2021年的5983亿元,年复合增长率达到14.4%。另一 方面,由于中美数字经济竞争,中国在数据存储器方面呈现国产化加速升级的趋势,根据论文研究数据,在低端数据存储器市场中,中国存储厂商总市场份额超过80%;中端存储领域达到60%。因此, 在数据存储国产化的进程中,中游数据库对数据存储的需求进一步释放,同时也在供应链稳定、保障数据库兼容、安全、合规等方面做出进一步巩固。 中 产业链中游 品牌端 数据库产品 中游厂商 武汉达梦数据库股份有限公司 北京人大金仓信息技术股份有限公司 华为云计算技术有限公司 查看全部 产业链中游说明 数据库中游环节为数据库产品。中国数据库厂商分为三类(1)传统数据库厂商,代表企业为达梦数据库、人大金仓等;(2)初创型数据库企业,例如迈识数据、皓扬云数据、巨杉数据库等;(3)互 联网厂商拓展数据库业务,例如阿里云、腾讯云、华为云、百度云、金山云等。传统数据库厂商具有较长的发展历史,具备成熟的产品和解决方案,但在接受新技术更新迭代方面没有初创企业灵活;初 创型数据库企业专注于特定的技术或市场领域,例如巨杉数据库专注于金融领域。因此,初创型企业 的数据库在特定领域的技术或领先于传统数据库厂商,但在稳定性、可扩展性、全面性方面较弱;互联网厂商拓展的数据库业务拥有初期庞大的互联网用户基础和丰富的数据处理经验,因此在云服务、 大数据分析、人工智能等方面有自己的产品和技术体系。通过充分利用云计算平台等先发优势,产品更能快速适应互联网行业的需求。 从技术路线分析,中国数据库市场中关系型数据库技术达到成熟标准并已广泛应用于市场。根据大数据技术标准推进委员会发布《2023年数据库发展研究报告》数据,中国关系型数据库共156个,非关 系型数据库82个,占比分别为65.5%与34.5%。以人大金仓KingBaseES企业级关系型数据库为例,具备安全性高、便于管理、维护、使用的特点,且支持所有海内外主流CPU、操作系统与云平台部 署。在性能方面达到多CPU并行处理数据;单机单实例情况下,BenchmarkSQL tpmc超175万。 从中游发展趋势分析,目前中国数据库市场发展呈现“开源”趋势。一方面,数据库厂商借助成熟的 关系型数据库技术开展开源数据库业务。根据《2023年数据库发展研究报告》数据,中国开源数据库 在数据库市场中占比较小,共42款,占比17.6%,但开源数据库中70%为关系型数据库。另一方面,借助云计算技术发展,云厂商在开源数据库基础上开发云原生数据库、图数据库等产品。例如阿里 云、腾讯云等厂商布局云原生数据库业务,为用户达到降本增效的目的。 下 产业链下游 渠道端及终端客户 数据库应用 渠道端 产业链下游说明 数据库的下游主要应用于互联网、政府、金融、电信、工业等领域。其中应用广泛的为集中式数据 库,分布式数据库应用占比较低。以金融行业为例,根据金融信息化研究所发布《金融业数据库供应链安全发展报告(2022)》数据,集中式数据库在金融业总体占比达89%,其中银行业80%,证券和保 险业占比均超过90%;分布式数据库在金融行业占比7%,在银行业占比17%。伴随近年科技发展而衍生出的多模态数据,数据库仍有拓展应用场景的空间。 [10]1:中国信通院 [11]1:中国信通院, 头豹研究… 预测未来5年内,数据库市场规模仍稳定增长,主要增长点或表现在以下技术革新层面。(1)向量数据库 +大语言模型,通过对向量的特征分组索引实现高效相似性搜索;(2)AIGC+数据库,完善数据库自身对多模态(如图像、音视频)数据的分析能力。随着ChatGPT问世,AI与数据库结合不仅在数据库开发、运维、分析等 层面简化工作,还有能力处理多模态数据存储。例如2023年Databricks将大语言模型引入SQL数据库,以其自动化和AI洞察能力达到简化查询和数据分析预测目的;此外,Qdrant等向量数据库基于大语言模型,进一步简化 [14] 数据查询、搜索、分析及可视化工作。 中国数据库市场规模(亿元) [13]1:中国信通院中国大数据… 政策内容 基于各部门数据资源,按照物理分散和逻辑集中相结合的原则,建立健全经济治理数据框架指标体系,构 建经济治理基础数据库。 此政策的提出为加快数字政府建设,推进政务信息系统资源整合共享