登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
顺丰大数据架构稳定性保障实践_林国强
信息技术
2022-07-19
ArchSummit深圳2022|全球架构师峰会
福***
AI智能总结
查看更多
大数据架构稳定性保障实践
一、大数据架构历史变迁
洪荒期(MR)
:以MapReduce模型解决海量数据分析问题,从传统数据库转向MR/HSQL架构,成立原始大数据团队。
远古期(MPP)
:采用MPP架构简化湖仓问题,适用于中小规模场景,成立专注MPP的团队。
近古期(Storm)
:引入Storm支持实时流处理,快速响应业务需求,成立实时数据团队。
近现代(Flink/Spark)
:Flink提升流处理性能,Spark提高离线计算速度,分别成立实时流处理和算法团队。
现如今(实时数据湖架构)
:采用Hudi实现增量处理,提升指标时效性,成立实时数据湖团队。
二、架构稳定的关键因素
扩展性
:通过纵向/横向扩容、存算分离、弹性伸缩等技术实现资源复用和成本优化。
可用性&容灾
:解决跨机房部署性能、带宽、数据一致性问题,实现双活和高可用。
自适性&自动化
:通过精细化运营、用户反馈、诊断项沉淀实现自动化评估和风险预警。
易用性&批流一体化
:提供统一SQL接口,支持实时批流融合,简化开发模式。
先进性&数据仓库实时化
:打造云原生实时数据湖,实现指标T+1到T+0的实时化。
三、未来大数据架构畅想
产业趋势
:传统厂商、公有云厂商、新兴科技公司分别以平台+定制化、云基础设施+生态、单品聚焦为主。
架构趋势
:从私有化数据湖到云原生实时数据湖,实现存算分离、实时数仓、湖仓一体。
关键能力
:
极致弹性
:通过存算分离复用容灾和公有云资源,优化成本。
实时数据湖
:基于Hudi提升数仓更新时效,实现T+0指标。
统一SQL
:提供跨云、跨引擎全局统一元数据管理,支持无感优化。
安全托管
:确保数据加密和权限控制,实现安全计算。
数据生态
:通过联邦学习构建隐私计算数据交易市场。
客户价值
:实现指标T+1到T+0的实时化,提升数据结果产出速度。
你可能感兴趣
货拉拉大数据 Doris 稳定性保障实践
信息技术
DataFunSummit2023:OLAP引擎架构峰会
2023-08-09
8-4 货拉拉大数据治理实践之稳定性保障 - 黎仁全
信息技术
DataFunSummit2022:数据治理在线峰会
2022-09-15
云卓越架构:云上网络稳定性建设最佳实践
信息技术
阿里巴巴
2024-09-20
卢旭 - 物流场景下的架构稳定性实践
交通运输
ArchSummit北京2022|全球架构师峰会
2022-11-02
见微知著:业务_技术双轮驱动的稳定性实践 - 林万境
信息技术
XOps 风向标!GOPS 全球运维大会暨研运数智化技术峰会 2024 · 上海站
2024-10-21