您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[-]:移动云(于巍):移动云海山数据库技术内幕 - 发现报告

移动云(于巍):移动云海山数据库技术内幕

信息技术2024-08-26于巍-福***
AI智能总结
查看更多
移动云(于巍):移动云海山数据库技术内幕

移动云海山数据库:算力网络时代的云原生数据库 于巍|移动云 自主·创新·引领 目录Contents 移动云数据库概述01 海山数据库架构演进02 典型案例03 Chapter01 第一部分移动云数据库概述 移动云和数据库团队简介 移动云数据库团队十年前正式诞生,以实现数据库核心技术自主可控为目标,目前已构建完整产品和市场体系,并实现大规模商用。 移动云立足云服务商第一阵营,入选国资委首批“创建世界一流专业领军示范企业”名单,开启“成为一流云服务商”新征程 顺应时代发展潮流,坚定自研数据库之路 n在国家自主可控、中国移动战略转型、云厂商引领数据库发展的多重因素驱动下,移动云将持续坚持自研数据库之路。 国家自主可控 云厂商引领 中国移动转型 n中国移动一二二五战略,即一个新定位、两个转变、两个新型、五个红利。 据IDC统计,中国关系型数据库云化部署规模已超传统部署方式,且增速领先 n党的二十大以实现“高水平科技自立自强”作为目标,“原创性、引领性科技攻关”等,是实现科技自立自强的重要途径。 一个新定位 n国资委〔2022〕79号文件要求所有央企、国企、地方国企圈定重要软件和设施等的替代策略。 n2023年12月工信部发布《数据库政府采购需求标准》正式版 nGartner2022年DBMS市场厂商排名: 1、亚马逊云2、微软3、Oracle4、谷歌云5、IBM6、SAP7、阿里巴巴8、华为9、Snowflake 数据库是基础软件皇冠的明珠,也是中国移动战略转型必不可少的一部分 云厂商领衔全球数据库市场 云原生数据库架构演进 内核云原生化 移动云数据库产品矩阵 移动云一站式云原生数据库服务 移动云基于K8s构建云原生数据库底座,全线产品达云原生L1级 自研海山数据库系列,采用存算分离架构,并全面向Serverless演进 在中国移动算力网络战略下,大力探索算力网络数据库,积极推进相关技术以及行业标准制定 *海山数据库MySQL版和分布式版公测中,即将上线 Chapter02 第二部分海山数据库架构演进 海山云原生数据库(He3DB)系列产品 海山分布式数据库 海山云原生关系型数据库PG/MySQL版 海山实时数仓 金融级要求:分布式事务强一致性,满足会计记账准则要求备份恢复:全局一致备份恢复,满足数据备份监管要求数据同步:高并发、高网络时延情况下保证同步性能,零丢失(RPO=0) 高度兼容:100%兼容PostgreSQL高性能:存算分离架构,冷热数据分离,为用户高性能和低成本快速弹性:可横向扩展至16个节点,支持最大容量100TB 简洁易用:大规模并行处理提供物化视图全场景统一分析能力低成本:弹性伸缩,兼容MySQL协议,为用户提供极具性价比的服务 海山数据库(He3DB)集中式版-整体架构 He3DB云原生版本采用存算分离数据共享架构。包含PostgreSQL、MySQL两个版本,100%兼容PostgreSQL、MySQL协议,支持1主15备读写分离底层共用一份数据,最大支持100TB数据量存储,RTO故障恢复时延可控制在30S以内,支持联邦内存池缓存命中率相对传统主备模式提升2倍以上,支持秒级在线新增实例,适合大数据量实时在线交易性业务 He3DB 计算引擎:提供SQL解析,计算能力。所有写请求转化为日志写,读请求从Page服务获取数据 He3Store 存储引擎:异步回放日志成Page数据,最终使用S3作为数据持久层,分为日志服务与Page服务 He3Proxy 智能中间件:能够感知业务负载,多维度负载均衡选择路由,提供读写一致性能力 生态工具 实现业务零感知的秒级备份/恢复能力,提供监控工具,迁移工具,Cluster管理工具 海山集中式V1.0关键技术-分层设计,实现高性能、底成本 分层实现高性能分层实现高性能 n实现联邦内存池,每个节点databuffer负责缓存不同表数据,通过智能中间件路由用户请求,保证大数据量场景下的内存命中率 n使用本地盘作为Page高速缓存,保证热数据在本地存储的高命中率 n实现logisdatabase,所有的写转化为日志写,通过对接分布式KV存储,提高写性能 n主备节点均无状态,可任意切换。 海山集中式V1.0关键技术-联邦缓存池技术 n问题:常规云原生数据库架构中,每个存储节点随机缓存数据页,消耗资源大且缓存利用率低; n思路:采用联邦缓存技术,将计算节点内存池化,设置数据分区策略,每个计算节点缓存部分数据,提高缓存利用率。 n成效:通过联邦缓存池,提高了缓存命中率,将磁盘读取次数减少一倍以上,整体使TPS、QPS等核心性能提升44%以上。 海山集中式V2.0关键技术-存算一体兼容技术 n成效:一套代码同时支持中小微客户需求,无需中断服务,实现数据共享与非共享访问模式的无感切换(专利3项) 海山集中式V2.0关键技术-基于数据切片的存储节点线性扩展 Ø解决大数据量场景下(10T),数据库性能波动问题,通过数据切片实现存储节点(DS)横向线性扩展,设置日志回放专用内存缓存提升本地缓存命中,增加对高性能云盘的支持。 存储节点线性扩展 通过range,table、hash分区策略,增加路由表管理数据切片,实现存储层缓存容量的线性扩展 日志分片回放 通过数据分片减少WAL回放数据,无需进行全量回放,实现日志回放速度线性提升 日志回放专用缓存 构建WAL日志回放专用内存缓存区,与热数据Page缓存隔离,减少内存轮询,提升缓存命中率与利用效率 支持高性能云盘 持久层增加对SSD高性能云盘的支持 海山集中式V2.0关键技术-日志并行解析、回放 Ø优化存储节点日志解析与应用为多线程,基于哈希队列统一编排解析、应用、清理等线程,实现日志高效的并行解析与回放,加快存储节点日志处理速度,实现QPS性能提升。 海山集中式V2.0关键技术-Serverless能力 Ø联合南京大学研发智能缓存调度策略,实现CPU、内存10秒弹性扩缩容,具备业内领先的Serverless能力 内核能力支持 Ø南京大学联合研究缓存智能调度策略 Ø全量内存纳入管理,支持内存在线扩缩能力Ø检测指标纳入管理,供外部工具采集,并能支持异常指标触发特定事件Ø存储节点高可用能力提升Ø并行弹性扩缩容Ø存储缩容支持Ø...... 云上能力支持 Ø云盘对接支持Ø流量监控指标支持Ø基于AI算法的智能化调优调参Ø计费能力对接,支持分钟级计费Ø监控指标项新增20+Ø实例自动启停能力支持Ø...... 海山集中式V2.0关键技术-HTAP设计 海山分布式版关键技术 百节点集群规模 Øshared-nothing去中心化架构Ø优化节点间链路,避免连接风暴Ø元数据管理组件合并优化,减少节点交互开销 集群性能tpmC达百万级 ØtpmC达百万级,全球TOP20水准Ø数据节点支持线程池,避免上下文频繁切换,减少动态内存使用Ø优化分布式事务,减少锁资源消耗 海山数仓版关键技术 云原生架构数仓 数仓实例n 数仓实例2 Ø存算分离架构,计算存储独立扩展,计算节点无状态,存储基于S3可无限扩展,支持多实例共享存储Ø云原生能力对齐云数仓标杆SnowFlake;相比传统MPP数仓资源利用率提升50% 数仓实例1 极致性能 计算层 Ø通过向量化引擎加速、物化视图、本地缓存等性能提升,达到数据秒级同步,亚秒级查询ØZero-ETL同步吞吐性能达50000条/s,对标AWSRedshift 高易用性 Ø实现Zero-ETL,支持RDS数据一键自动同步至数仓Ø支持整库同步(存量+增量)、多源合并能力 存储层 持久化(对象存储) 海山算力网络数据库核心理念 无需关注地域-GlobalDatabase 全域Regionless数据访问与处理就近接入多云、多云数据算力统一纳管 无需关注资源-Serverless、多模 依托算网大脑实现全网资源弹性(Serverless)供给,按需取用全域数据流通与治理,数据交换与交易 无需关注业务负载-一体化架构、智能化 无需考虑数据库负载和选型等,提交数据任务,交由算力网络数据库一个入口统一处理AI使能,自然语言交互与智能数据分析 Chapter03 第三部分典型案例 服务客户 n服务政务、汽车、医疗、金融、旅游等10多个行业,逾千家客户 视频业务上云 杭研家庭安防业务主要依托于和家亲APP,通过摄像头+APP的方式提供视频直播、回看、远程对话等功能。 n客户诉求 1、随着摄像头接入增多,云底座需要具备弹性伸缩能力,快速提供所需资源;2、客户视频过期清理后,需同步删除数据库存储的元数据信息,400w条/h。3、承载超1600w+摄像头,稳定性要求极强 n应用效果 1、视频流存储于对象存储中,将视频流的元数据(包括视频存放于对象存储的路径、时间等信息)存储2、提供主备+多从方案,实现业务高性能支撑;3、已在移动云16个资源池建设28个逻辑机房,支撑1600w摄像头。 THANKS 感谢聆听 自主·创新·引领