您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:存算分离:Apache Doris部署新范式 - 发现报告

存算分离:Apache Doris部署新范式

2024-04-25杨勇强未知机构
AI智能总结
查看更多
存算分离:Apache Doris部署新范式

存算分离技术特性01存算分离典型应用02 目录 存算分离架构 S3/OSS/Azure/GCP/HDFS 存算分离查询性能 多层Cache 完全命中:预热之后数据都在dorispagecache或者linuxpagecache DorisPageCache解压后的数据 LinuxPageCache压缩数据 部分命中:开始时三级cache都为空,顺序跑tpcds的查询,取第一遍的成绩 本地磁盘cache压缩数据 完全未命中:每个TPCDS的SQL开始时清空三级缓存 持久化存储 存算分离数据及时性 32并发flink写入,checkpoint周期5s。A:引入metaservice的存算分离实现;B:meta写入对象的存算分离实现。 存算分离小文件数目 32bucket表写入 A.引入metaservice的存算分离实现B.meta写入对象的存算分离实现 存算分离技术特性 低成本:成本最多可以降低超过90% SSDgp3$0.08/GB-Month*3HDDst1$0.045/GB-month*3 $0.023/GB-Monthcachewithgp3:$0.08/GB-Month 弹性:无状态的计算节点 存储和计算独立扩展 动态资源调度 快速调整计算资源应对业务高峰或者云上降本 1.计算和存储资源池化,提升资源利用率 2.存储共享公司运维和资源,大幅度降低Doris运维复杂度 负载隔离:多计算组隔离负载 •独立BE •共享FE •独立BE 存算分离典型应用 典型应用:在线业务降低成本 典型应用:历史数据降低成本 典型应用:快速扩缩容应对大促 典型应用:快速调整机型 典型应用:多业务线共享数据负载隔离 存算一体资源组 •数据副本数和业务线数目一致•受限于存储,每个业务需要同样数量的机器 存算分离资源组 •数据在对象存储,业务线数目可以任意扩展•各业务线计算资源可根据实际需求决定 典型应用:在离线负载隔离 典型应用:读写隔离 典型应用:新一代数据基座 关键能力