登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
4-2 实时数仓的场景剖析与架构搭建实战
交通运输
2022-07-19
DataFunSummit2022:大数据存储架构峰会
棋落
数仓架构演进
实时湖仓架构
:数据实时发送至Kafka(通过MSK或RDS CDC工具),Flink消费Kafka数据写入Hudi或Iceberg(底层存储S3),ADS层按需Sink数据至OpenSearch或Redshift,实现数仓各层OLAP查询(EMR提供算力支持)。
实时计算
轻量级服务需求
:探讨是否需要更轻的实时计算服务。
Amazon Analytics Serverless服务
无服务器实时湖仓架构
:整合Data Lake、JDBC/ODBC、Data API、Redshift Compute Cluster等组件,实现弹性计算与存储加速。
Redshift架构
核心组件
:包括Redshift Compute Cluster(Leader Node、Compute Nodes)、Amazon Nitro Compute、Storage Acceleration、Operational Databases、Query Live Data、Incremental MVs、Compilation Service、Global Cache、CaaS、Data sharing clusters、Auto-scaling clusters、Amazon SageMaker、Redshift ML、Redshift Managed Storage、AQUA、Parallel execution、Node、Spectrum等。
Redshift实时数据摄入能力
摄入方式
:
Kinesis Data Stream
:日志数据通过KPL或Kinesis Agent发送至KDS(Serverless服务,支持API扩缩容)。
Redshift Streaming Ingestion
:直接消费Kinesis(预计2022 Q2~Q3支持MSK)到Redshift,创建物化视图,秒级延迟,30W/S吞吐(2kb size),小于30秒延迟。
KDA(Flink Runtime)
:消费KDS数据,经流计算后结果Sink到RDS或KV,端到端秒级延迟。
DMS
:同步RDS Binlog到Redshift,支持Schema部分自动变更,同时支持全量同步。
其他CDC工具
:通过DMS或其他工具(如Debezium、Flink CDC)将CDC数据发送至Kinesis,再通过Redshift Streaming Ingestion+存储过程写入Redshift。
Redshift实时数仓+ML
Amazon Serverless预览版
:集成ML功能,提升实时数仓智能化水平。
你可能感兴趣
4-2 Hologres:阿里建设高吞吐、多负载的实时数仓平台
商贸零售
DataFunSummit2022:多维分析架构峰会
2022-07-18
京东实时数仓治理与实战
商贸零售
京东
2022-11-15
02-小红书云原生实时数仓的建设与实践-王成
商贸零售
ArchSummit北京2023|全球架构师峰会
2023-06-06
姜伟华(果贝)-阿里一站式实时数仓的建设经验分享
商贸零售
DataFunSummit2022:大数据计算架构峰会
2022-05-19
中通快递基于SelectDB实时数仓的应用实践
商贸零售
中通快递
2024-04-25