您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [Flink Forward Asia]:Flink Forward Asia 2025:城市巡回:深圳站 - 发现报告

Flink Forward Asia 2025:城市巡回:深圳站

信息技术 2025-12-05 - Flink Forward Asia 大表哥
报告封面

Fluss介绍 Apache Fluss是什么? 面向分析型场景设计的实时流存储 Apache Fluss架构 Apache Fluss核心应用场景 湖流一体 实时数仓 Fluss + Flink,替代Kafka构建实时数仓新标准 Fluss + Paimon构建湖流一体秒级湖仓架构 Fluss + Flink实时数仓场景:核心特性 MergeEngine合并机制 流式查询下推 实时数仓分层化 实时宽表构建新范式 •毫秒级读写•实时更新•CDC订阅 •RoaringBitmap用户画像•Aggregate长周期聚合指标•Versioned事件时间去重 •列裁剪•分区裁剪•条件下推* •DeltaJoin•PartialUpdate•异步维表Join 湖流一体架构解析 Fluss + Paimon实时湖仓底座:湖流一体 湖流融合的业界趋势 为什么不是Tableflow? 为什么不基于Kafka? Kafka是为消息设计的,不是为分析设计的 不支持更新 数据模型不匹配 Fluss/Paimon/Kafka数据概念对比 Fluss数据概念与湖仓完全对齐,无缝融合Kafka与湖仓系统割裂 湖流同步/湖流一体开启方式对比 ALTER TABLE customersSET ('table.datalake.enabled'='true') Fluss如何构建湖原生的流存储? •FromTopics->Tables•Schemaas first-class ci8zen•Primary Key&Updatesupport•Data format fromAvro→The Columnar Stream(10x if 10% columns read) Fluss Lake Tiering Service 湖流一体:实时湖仓数据底座 Fluss + Paimon湖流一体优势 湖流一体优势(1):对比Lambda架构,流存储成本降低10倍 •Fluss只需维护超短周期实时数据,大幅降低成本(7day-> 6hour)•流批存储统一,一份视图,提升开发效率 湖流一体优势(2):流读高效数据回追(Union Read) 湖流一体优势(3):批查秒级新鲜度(Union Read) 湖流一体优势(4):湖仓分层新鲜度不受层级影响 •Paimon新鲜度依赖Flink Checkpoint,级联作业可导致新鲜度累加•Fluss实时入湖与Checkpoint解耦,可稳定保证湖仓分层新鲜度 湖流一体优势(5):更高效的CDC数据生成 •Lookup:时效好,但是耗费更多资源•Full Compaction:等待N * checkpoint,时效性差 •直接从Fluss Changelog生成PaimonChangelog•轻量的Arrow-> Parquet转换•兼顾时效性和性能 湖流一体优势(6):湖仓数据的实时接入层 •高性能实时数据接入层•轻客户端、多语言•简化湖仓数据接入•写缓冲,削峰填谷 Streaming + Lakehouse = Real-Time Lakehouse Fluss:面向实时分析场景的流表存储引擎 基于Fluss +Paimon的湖流一体数据底座 DLF:智能全模态湖仓管理平台 面向AI时代构建全模态数据统一存储、管控、开放平台 DLF钉钉交流群号:106575000021 存储管理与优化 数 据一 键 入 湖存 储,支 持 存 储自 适 应compaction,自 适 应 分bucket,自动冷热分层,生命周期管理,存储成本优化30% D L F智 能 全 模 态 湖 仓 管 理 平 台 元数据管理与开放 支持Paimon、Iceberg、Lance、各类Flie等湖表件格式,元数访问性能提升10倍,基于开源社区开放Tables与Files两层接口 企业级安全与管控 Catalog/Database/Table/列四级细粒度权限管控,一次授权、跨引擎共用,具备审计、日志、告警等企业级管控能力。 多引擎计算与加速 同时支持开源大数据引擎、阿里云自研大数据引擎、AI搜索引擎,统一存储管理实现引擎平权数据计算,查询性能提升50% Future Plan 查询引擎 支持更多查询引擎:StarRocks, Spark, Trino Paimon表原地一键升级成实时表 Union Read支持deleZon vector,大幅提升主键表性能 The End Goal of “Bringbetter analyticstodata streamsandbetterdata freshnesstodataLakehouses.” THANK YOU 谢 谢 观 看 THANK YOU 谢 谢 观 看 集群落地与稳定性 流存储的机遇和挑战 实际收费:3*「完整数据」费用+3*「Flink作业」费用Fluss:多级分区、过滤下推、列式存储(消费部分字段)降低读取数据量、降低读取字段、降低FlinkCU消耗 集群落地与稳定性 双11落地情况稳定性建设集群部署湖流一体 Fluss首次双11落地情况 阿里集团内淘天(含通天塔、阿里妈妈等)、集团数据公共层、饿了么、淘宝闪购、高德、阿里影业等多个业务已开始线上使用,核心场景主要集中在搜索、推荐、流量等。 集群部署-监控体系 稳定性建设-RebalanceFeature-集群扩缩容 ALTERTABLEcustomersSET('bucket.num'=‘1024’);稳定性建设-表扩缩容 稳定性建设-无感升级 K8s侧•支持灰度升级/滚动升级 Fluss Tablet Server无感升级:对业务正在运行的作业没有明显影响,读写延迟波动小于1minControlled Shutdown:支持升级过程中优雅切换Leader:容器收到升级命令后,先优雅迁移自身的Bucket Leader,然后再进行关闭,保证Leader持续在线。 •支持原地升级:升级镜像或者修改配置时,不需要kill和重建pod,只需要kill容器并秒级拉起 稳定性建设-Coordinator HA 稳定性建设-压缩率,网络传输 稳定性建设-上线前故障演练计划 CoordinatorServer l随机宕机l反复切换leaderl大量建表和分区 TableServer l随机宕机lRemote存储堆积lBuckect的Replica宕机 Client l读写流量压测l一致性测试l冷数据,追数据延迟 湖流一体 业务实践与收益 案例-淘宝数据平台 核心收益•降低实时数据使用门槛,搭建面向业务团队的数仓 •替代行式消息队列,降低成本40%以上•通过Fluss+Paimon搭建的湖仓系统支持流批一体的开发模式,降低开发运维成本•基于列更新特性,离线和实时数据更新回刷成本大大降低 案例-淘宝闪购场景 将流量实时DWD公共层写入Fluss,通过Fluss的Tiering Service,持久化到湖仓存储Paimon中,既保障了实时的时效性,又能及时提供OLAP分析。 灰度监控产出效率上,新的架构真正实现了实时监控,产出效率远远高于上一个版本的物化视图定时调度。 案例-AB实验分析平台-通天塔场景 通天塔是目前淘天集团的AB实验分析平台,主要专注于淘天内C端算法的AB数据,期望能用通天塔的AB数据能力建设,来促进科学决策活动 解决⽅案:•Fluss列裁剪能⼒,减少Flink算⼦消耗,同时降 痛点:•行式流存储不支持列裁剪,整行消费,资源消耗 低⽆⽤列的IO流量;(读FlussCPU占用减少59%,内存占用减少73%,IO减少20%) 高,以曝光表为例44个字段,平台仅需13个字段 •数据落地Paimon,通过StarRocks⾼效查询 •数据探查困难,随机抽样难以定位,导入MaxCompute查询延迟高、成本高 •KV表的Merge引擎完成数据的排序,通过Delta Join,解耦作业与状态,修改作业不需要重跑State,并将状态数据可查,提⾼灵活性 •大State作业运维困难,庞大的State,成本高,作业不稳定,Checkpoint超时,重启恢复慢 显著降低下游消费数据量下游FlinkCU消耗降低约35% 未来规划 未来规划 更高的性能 构建业界领先的Agent采集与评测一体化平台,用于支撑AIAgent在代码、电商、数据、内容生成等多场景下的效果评估、优化与产品化。 需要多端SDK研发、评测平台架构师,P6~P7 THANK YOU 谢 谢 观 看 实时AI推理 Flink Agents AI Function SQL流中实时调用LLM 结合Fluss构建端到端低延迟AI推理管道 用于构建事件驱动型智能体的开源框架 AIFunction SQL流中实时调用LLM 基于LLM的实时数据分析 AI Func(on⽀持在SQL流处理中直接调⽤⼤语⾔模型服务 实时RAG 智能分析 LLM实时调用 支持OpenAI兼容接口的大模型服务阿里云百炼人工智能平台PAI Embedding向量检索实时流 AI推理智能分类情感分析 AIFunctions Vector_Search向量搜索 ML_Predict智能推理 Create Model设置模型 企业级引擎VVR-11.3 CREATE MODELai_analyze_sentimentINPUT (`input` STRING)OUTPUT (`content` STRING)WITH ('provider'='bailian','endpoint'='','apiKey' = '','model'='qwen-turbo'); SELECTuser_keyword, topicFROMquery_table,LATERAL TABLE (VECTOR_SEARCH(TABLEvector_table,DESCRIPTOR(vector_index),query_table.embedding, 2)); SELECT id,movie_name, commentasbox_officeFROMML_PREDICT(TABLEmovie_comment,MODELai_analyze_sentiment,DESCRIPTOR(user_comment)); AI_Sentiment情感分析 AI_Classify智能分类 AI_Translate实时翻译 企业级引擎VVR-11.4 企业级引擎VVR-11.4 企业级引擎VVR-11.4 SELECTorder_id,complaint_text,category, confidenceFROMorder_complaints,LATERAL TABLE(AI_CLASSIFY(‘text_classifier’,complaint_text,‘商品质量,物流问题,客服态度,价格问题‘)); SELECTmessage_id,original_text,translated_text,detected_languageFROMcustomer_messages,LATERAL TABLE(AI_TRANSLATE('translator',original_text,'auto', 'zh’)); SELECTproduct_id,review_text,score, label, confidenceFROMproduct_reviews,LATERAL TABLE(AI_SENTIMENT('sentiment_analyzer’,review_text))WHERE score <-0.5