您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [浙江电信]:浙江电信Apache Doris实战之路 - 发现报告

浙江电信Apache Doris实战之路

信息技术 2025-01-14 喻志强 浙江电信 风与林
报告封面

浙江电信-大数据中心喻志强 分享嘉宾-中国电信浙江公司 喻志强 浙江电信大数据中心平台侧负责人,资深通信运营商数据仓库和大数据平台建设专家 大数据建设历程01ApacheDoris实践02湖仓一体实践03后续规划探讨04 目录 01大数据建设历程 浙江电信大数据平台建设历程 2021 2024 2004 建设内容:基于Teradata建设B域数据仓库与数据集市应用规模:20台支持存储:400TB 建设内容:构建数据中台能力,基于中台开展作业、模型、报表迁移,数据治理及培训推广工作,并实现开发运营模式优化。规模:20+台 规模:640+台 2016 2023 基于ApacheDoris湖仓一体架构演进 02ApacheDoris实践 实时数仓上线 2024年2月—至今 查询集市库上线 2024年8月9号—至今 使用haproxysql替换proxysql做链接负载均衡(已解决)在查询条件中多or,出现访问Iceberg用老优化器执行(待解决)split_by_string函数处理之后的值,无法法再用array相关函数处理,会报错(已解决)FE节点元数据同步异常,导致事务偶发性报tablet版本不一致的问题(已解决)MySQLCatalog的连接释放机制问题,导致进行堆积,达到上限侯引起访问异常,2.1.5版本改造为Hikari连接池(已解决) 改造实施开展 改造优化效益提升 前期产品更倾向在大量新的核心功能以及底层的优化重构,导致了稳定性受到了影响。在2.1版本开始逐步进行稳定性打磨的倾斜和平衡。 数据数仓改造完成,实时类任务效率提升3-5倍 •更完备测试体系,积累了千万量级的sql测试用例,提升测试覆盖率和产品质量;•通过混沌测试模拟各种故障场景,复刻社区用户主动提供的场景,有几十个长期运行的仿生产测试场景的长稳测试场景;•更严格的PR准入和feature开发流程,Doris2.1的开源测试suite比2.0增加了150%。 2.0.4到2.1.2平均任务效率提升30% 2.1.2到2.1.5稳定性提升超30%,性能下降5%-10% 待探讨的问题 异构化运营管理跨源访问 03湖仓一体实践 湖仓一体实践经历的过程 湖仓一体架构介绍 湖仓核心组件 基于电信自研大数据PaaS产品,组成由HA3+iceberg+Amoro+Spark/Flink+Doris为主的湖仓一体架构 应用与引擎的选型 •基于FlinkCDC自研实时入湖平台,数据统一写入Iceberg,对存在compaction问题由Doris预处理,对实时数仓需求核心数据同步写入Doris•实时数仓汇聚、生产加工和应用整体采用Doris完成,构建实时库•离线数仓统一汇聚、生产加工采用Flink/Spark•采用Doris,完成对BI报表、营销等平台对接,构建数据集市 湖仓一体架构深入建设 计算资源使用不合理、不充分,对容器化弹性资源调度探索和应用(目前还只是针对Spark&Flink,Doris在探讨中) 业务系统原有的报表库、运维库从Oracle、PG、ES逐步改造到Doris,由此我们建了业务库的专区 Iceberg对实时湖仓能力不足的问题,探索Paimon是否得到了解决(目前还在验证,还未正式上线) 04后续规划探讨 Doris后续使用规划探讨 改造优化 存算分离 ThanksforWatching!