登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
顺丰大数据架构稳定性保障实践_林国强
信息技术
2022-07-19
ArchSummit深圳2022|全球架构师峰会
福肺尖
大数据架构稳定性保障实践
一、大数据架构历史变迁
洪荒期(MR)
:以MapReduce模型解决海量数据分析问题,从传统数据库转向MR/HSQL架构,成立原始大数据团队。
远古期(MPP)
:采用MPP架构简化湖仓问题,适用于中小规模场景,成立专注MPP的团队。
近古期(Storm)
:引入Storm支持实时流处理,快速响应业务需求,成立实时数据团队。
近现代(Flink/Spark)
:Flink提升流处理性能,Spark提高离线计算速度,分别成立实时流处理和算法团队。
现如今(实时数据湖架构)
:采用Hudi实现增量处理,提升指标时效性,成立实时数据湖团队。
二、架构稳定的关键因素
扩展性
:通过纵向/横向扩容、存算分离、弹性伸缩等技术实现资源复用和成本优化。
可用性&容灾
:解决跨机房部署性能、带宽、数据一致性问题,实现双活和高可用。
自适性&自动化
:通过精细化运营、用户反馈、诊断项沉淀实现自动化评估和风险预警。
易用性&批流一体化
:提供统一SQL接口,支持实时批流融合,简化开发模式。
先进性&数据仓库实时化
:打造云原生实时数据湖,实现指标T+1到T+0的实时化。
三、未来大数据架构畅想
产业趋势
:传统厂商、公有云厂商、新兴科技公司分别以平台+定制化、云基础设施+生态、单品聚焦为主。
架构趋势
:从私有化数据湖到云原生实时数据湖,实现存算分离、实时数仓、湖仓一体。
关键能力
:
极致弹性
:通过存算分离复用容灾和公有云资源,优化成本。
实时数据湖
:基于Hudi提升数仓更新时效,实现T+0指标。
统一SQL
:提供跨云、跨引擎全局统一元数据管理,支持无感优化。
安全托管
:确保数据加密和权限控制,实现安全计算。
数据生态
:通过联邦学习构建隐私计算数据交易市场。
客户价值
:实现指标T+1到T+0的实时化,提升数据结果产出速度。
你可能感兴趣
货拉拉大数据 Doris 稳定性保障实践
商贸零售
DataFunSummit2023:OLAP引擎架构峰会
2023-08-09
8-4 货拉拉大数据治理实践之稳定性保障 - 黎仁全
商贸零售
DataFunSummit2022:数据治理在线峰会
2022-09-15
卢旭 - 物流场景下的架构稳定性实践
商贸零售
ArchSummit北京2022|全球架构师峰会
2022-11-02
云卓越架构:云上网络稳定性建设最佳实践
商贸零售
阿里巴巴
2024-09-20
见微知著:业务_技术双轮驱动的稳定性实践 - 林万境
商贸零售
XOps 风向标!GOPS 全球运维大会暨研运数智化技术峰会 2024 · 上海站
2024-10-21