行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Apache Celeborn和数据湖计算引擎云原生实践

信息技术 2023-07-12 DataFunSummit2023：数据湖架构峰会 Leona

背景

传统 Shuffle 存在依赖大容量本地盘/云盘、IO 放大、高网络连接、磁盘随机读、单副本等缺陷，导致效率、稳定性和弹性不足。

Apache Celeborn

Celeborn 是一个大数据引擎统一中间数据服务，支持引擎无关的 Shuffle 和 Spilled Data，具有高性能、高稳定性和高弹性特点。

性能

核心设计：Partition 切分、支持 Spark AQE、Partition 合并 Join Strategy 切换、SkewJoin 优化、Map 范围读、1Split 切分、列式 Shuffle（行列转换开销低于 5%）
性能提升：ShuffleSize 缩减 40%

稳定

原地快速升级：向前兼容、优雅重启
流控：参考 TCP 拥塞控制（慢启动、拥塞避免、拥塞检测）
负载均衡：隔离坏盘、尽量分配给快盘/大盘

弹性

Spark on K8S：开源方案支持动态资源分配

典型场景

存算分离：
- 完全混部：提升性能和稳定性，计算、数据、临时数据分离，完全弹性
- 源数据和 Shuffle 数据分离：部分弹性
超大作业：
- 混部场景：大作业稳定性与性能显著提升（1000+ Celeborn Worker，压缩后 4PB Shuffle Data）
- 存算分离场景：100 台 Celeborn Worker，数万 Pods，极致弹性，性能和稳定性显著提升
TPCDS：3T TPCDS 性能提升 20%

Spark/Flink+Celeborn:更快，更稳，更弹性演讲人：一锤—阿里云背景传统Shuffle的问题传统Shuffle的缺陷 •依赖大容量本地盘/云盘•IO放大•高网络连接•磁盘随机读•单副本限制 •不够高效•不够稳定•不够弹性 ApacheCeleborn(Incubating) Celeborn:大数据引擎统一中间数据服务 •引擎无关•Shuffle+Spilleddata https://github.com/apache/incubator-celeborn •700+Commits•33Contributors, 7 Committers (3 in-coming)•370+ Stars 性能核心设计 Partition切分支持SparkAQE Partition合并Join Strategy切换SkewJoin优化 Map范围读 1Split切分列式Shuffle 行列转换: (Int, String, Decimal) •行列转换•代码生成 •解释执行 •代码生成 •ShuffleSize缩减40%，行列转换开销低于5% 多层存储 •内存/本地盘/OSS(HDFS)•可任选1/2/3层配置•让数据尽可能存在快存储稳定原地快速升级 •向前兼容•优雅重启流控参考TCP的拥塞控制 •慢启动•拥塞避免•拥塞检测其他实现:CreditBased•FlinkShuffleRead 负载均衡 •隔离坏盘•尽量分配给快盘/大盘弹性 SparkonK8S 开源方案:spark.dynamicAllocation.shuffleTracking.enabled=true 限制：几乎无法释放pod 典型场景存算分离完全混部 •提升性能&稳定性 •提升性能&稳定性•计算，数据，临时数据分离•完全弹性 •提升性能&稳定性•源数据和Shuffle数据分离•部分弹性超大作业 •混部场景：大作业稳定性&性能显著提升 •1000+CelebornWorker•压缩后4PBShuffleData 存算分离 •存算分离场景•100台CelebornWorker•数万pods，极致弹性•性能和稳定性显著提升 TPCDS •3TTPCDS20%性能提升感谢您的观看演讲人：一锤-阿里云

点击免费查看完整报告

Apache Celeborn和数据湖计算引擎云原生实践

背景

Apache Celeborn

性能

稳定

弹性

典型场景

你可能感兴趣

1-5 云原生开源分布式存储CubeFS在数据湖的探索与实践

云原生机密计算&商用密码技术最佳实践白皮书

2023云原生机密计算最佳实践白皮书

02-基于云原生Serverless和消息服务技术采集全球分布业务数据实践-马腾

云原生数据湖存储的架构发展和数据治理-程力

不仅仅是流计算：Apache Flink®实践

云原生技术体系在寿险行业的规划和落地实践-周建华

云原生应用管理在阿里云的实践和挑战_胡志广

孙勇福-云原生数据库管控探索和实践

3-1 Apache InLong 一站式海量数据集成框架原理和实践