您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[DataFunSummit2023:数据湖架构峰会]:字节基于HUDI的批流一体存储实践 - 发现报告

字节基于HUDI的批流一体存储实践

字节基于HUDI的批流一体存储实践

字节跳动批流一体存储实践 演讲人:耿筱喻—火山引擎—技术专家 背景与挑战 传统数仓架构 批流一体架构 •批流一体SQL •一套SQL同时流式执行用于实时构建及批式执行用于离线回溯•一套SQL同时支持数据构建与数据分析 •批流一体存储 •一份存储同时支持流式的增量读写以及批量读写•支持高效的OLAP查询•支持高效的维表Join LAS (Lakehouse Analysis Service) •统一元数据•ACID支持•企业级权限管控•极致弹性•引擎极致优化 经典实时数仓架构 经典实时数仓架构 批流一体存储 批式 流式 •分区并发更新•Hive表读写吞吐 •低延迟 •写入/消费RPS •一致性语义 多引擎支持 批流一体存储方案 湖仓一体架构 批流一体存储架构 批流一体存储架构 数据组织形式 批流一体存储架构 数据读写方式 BTS架构 落地场景 流式数据计算场景 多维分析场景 日志场景批流复用场景 飞书数仓 飞书实时数仓 未来规划 未来规划 •业务场景探索 •负载分离/均衡 •查询优化 •NativeEngine集成 感谢您的观看