您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[-]:中国移动(王小玉):新一代云原生数据库分析型数据库架构设计和应用创新 - 发现报告

中国移动(王小玉):新一代云原生数据库分析型数据库架构设计和应用创新

信息技术2024-08-26王小玉-江***
AI智能总结
查看更多
中国移动(王小玉):新一代云原生数据库分析型数据库架构设计和应用创新

王小玉|中国移动信息技术中心 自主·创新·引领 目录Contents 产品架构01 关键技术02 场景案例03 第一部分产品架构 中国移动大数据发展历程 中国移动大数据资源禀赋 中国移动大数据平台演进 梧桐云原生分析型数据库 梧桐云原生分析型数据库是中国移动信息技术中心基于Greenplum自主研发的分布式分析型数据库产品。具备云原生、高并发、高性能、多模检索等特性,可帮助企业用户快速构建支撑全域数据管理,实现全视角数据分析的云原生数据仓库。 技术架构 梧桐云原生分析型数据库采用采用存算分离架构,实现了存算分离、服务和计算节点无状态的弹性扩展、多个异构存储同时接入、跨存储联合查询;在性能方面,通过内核优化实现了向量化执行引擎、C++原生HDFS接入、数据缓存、算子下推等技术;在生态方面,可以支持多种云基础设施,并支持云化、虚拟机、物理机等多种部署方式,成功适配多款国产服务器及操作系统。 Chapter02 第二部分关键技术 全栈云原生设计 梧桐云原生分析型数据库服务、计算和存储均可按需弹性扩展,完全的云原生设计,支持多种云基础设施和容器化、虚拟机、物理机等多种部署方式。 多模数据库全域数据分析 梧桐云原生分析型数据库依托PostgreSQL开源生态实现多模分析检索,提供全域数据管理和全场景数据分析能力。 高性能高并发计算 梧桐云原生分析型数据库的执行器基于SIMD(单指令多数据流)指令集进行向量化重构,大幅提升并行计算性能,同时具备弹性本地并行调度,可优化资源使用,合理进行SQL任务调度。性能比传统数据仓库快5-10倍,比传统SQLonHadoop引擎快几十倍: 向量化执行引擎 弹性并行化调度引擎 •基于AVX-256SIMD指令集优化,单指令多数据流•动态流水线处理架构,消除IO等待导致的CPU空置 •根据资源负载实时调整并行度,与数据分布、模式定义解耦•单query时,动态提升并行度,利用所有资源•多query时,动态降低并行度,提供并发量 优化器不再参考数据部分和模式定义来直接决定并行度,而是由资源管理模块在执行节点上动态调整并行度。 Chapter03 第三部分场景案例 湖仓一体融合分析 基于梧桐数据库的湖仓一体能力,实现数据仓库与数据湖的数据和模型互通,提升数据共享效率,解决数据孤岛问题,构建企业级湖仓融合分析大数据平台。 基于公有云按需付费 梧桐云原生分析型数据库支持主流公有云基础设施,并提供简单易用的云管理平台。云管理平台可以根据实时的业务负载,对计算资源进行自动的扩缩容,最大化节约客户的投资。 将公有云的云主机,根据不同的CPU/内存等配置,封装成云上不同的计算资源的型号。如:small,medium,large等,对应的是云平台上“某2核8GB内存配备云主机的2个节点”,“某8核32GB内存配备的云主机4个节点“,“某32核128GB内存配备的云主机8个节点“。每一种配备的资源型号都有具体的标价,以OCU计价。 梧桐数据库支持多虚拟计算集群架构,可实现租户间的计算资源的完全隔离。虚拟计算集群的实例(VCI)可在云上根据负载情况弹性扩缩容。算力弹性伸缩,可以解决大数据平台算力不足问题(分流算力波峰),按需动态调整算力,提高资源利用率。 大规模集群混合负载 传统数据仓库架构下,面对混合业务负载场景,不得不分库分集群,导致数据开发复杂度高、同时带来数据孤岛问题。梧桐云原生分析型数据库可以一库多用,满足实时查询、批处理、关联分析等混合业务负载,实现资源隔离,各业务互不影响,满足多用户、多业务、混合负载的业务需求。 THANKS 感谢聆听 自主·创新·引领