登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
1-1 阿里云大数据成本优化实践 - 杨伟
信息技术
2022-09-15
DataFunSummit2022:数据治理在线峰会
H***
AI智能总结
查看更多
阿里云大数据成本优化方案
阿里云大数据成本优化方案:云原生一体化数仓
背景
:Hadoop生态组件繁杂,集成、运维、迭代更新难度大,技术栈复杂,学习成本高,缺乏治理工具,人才培养难。
解决方案
:拥抱云原生一体化数仓,简化平台运维,提升服务能力,加速价值实现。
核心产品
:DataHub、DataWorks、Hologres、实时计算Flink版。
架构优势
:
离线实时一体
:MaxCompute和Hologres极简架构,提供离线实时一体化海量云数仓服务,10X性能高速原生互访,快速查询能力。
湖仓一体
:提升湖仓开发体验,支持非结构化数据管理,广泛支持开源生态对接。
分析服务一体
:数仓实时化、敏捷化、在线化、一体化,实现灵活探索式分析和高并发在线应用查询,减少数据割裂。
全链路数据治理
:面向业务视角建模,问题驱动可持续治理,DataWorks开放平台升级。
增效篇:云上大数据与开源对比
云原生一体化数仓VS开源组件方案
:
DataWorks
:全链路数据开发与治理平台,提供全域数据集成、可视化建模、任务编排运维、数据治理、数据服务等功能。
MaxCompute
:高性能存储计算引擎,五次突破世界记录,支持标准SQL,多分析场景支持,弹性与性能优势明显。
Hologres
:高性能实时数仓引擎,亿级数据亚秒级查询,高并发在线查询,实时存储和写入,PG生态兼容。
DataWorks
:提供统一的开发治理平台,规范设计数据开发,开放平台,开放接口,扩展点,与大数据引擎组合降本。
DataWorks智能数据建模
:为数仓建设提供规范化和标准化保障,支持数仓分层、数据域、业务过程定义,数据标准定义,可视化数仓维度建模,指标设计。
MaxCompute内置金融级数据安全能力
:保障企业数据和服务安全,提供系统安全访问控制、数据安全、存储加密、风险管控、实时审计日志、异地容灾与恢复等能力。
Hologres结合MaxCompute提供企业级安全能力
。
DataWorks安全能力
:成员管理、身份鉴别、授权管理、审计管理、风险管理、租户管理等。
降本篇:引擎与数据平台降本
MaxCompute
:
高性能存储引擎
:存储成本节约20%-33%,计算效率提升30%-40%,ZSTD高压缩算法,自动冷热分层存储,成本更低。
高性能计算引擎
:支持标准SQL,离线、近实时分析、交互式分析,TPC-H指标领先Spark3X以上。
MaxCompute提供多种灵活的资源使用方式
:带来TCO最低,不同业务场景下对资源不同的使用。
Hologres
:
高性能的实时数仓引擎
:10亿+/秒写入,亿级数据亚秒级查询,双11.45亿亚秒级查询,高并发在线查询QPS,高性能点查询1.3亿TPS。
共享存储多实例
:减少数据冗余,加速数据分析与服务,资源隔离,高可用,按需扩展。
DataWorks为大数据引擎提供统一的开发治理平台
:“好马配好鞍”,无木桶效应的降本组合。
DataWorks数据治理中心
:
功能
:数据治理量化评估模型,数据治理问题预防/检测,数据治理问题优化/解决。
量化评估
:基于阿里巴巴内部最佳实践,以问题驱动,事前预防、事后整治,形成治理闭环,构建数据治理健康度评分模型。
数据治理中心的正确降本方式
:量化评估,治理改进,长效运营。
数据治理中心的正确降本方式
:
内置检查项
:研发规范、数据治理、数据安全、计算资源、存储资源内置检查项,对于治理问题的新增引入自动预防拦截。
自定义数据治理
:基于DataWorks开放平台拓展新增自定义检查项,允许自有系统与DataWorks进行深度对接,对处理流程进行自定义拓展。
DataWorks数据治理中心
:以人为本,面向管理员和普通成员提供不同视角,简化治理推进难度,以个人治理带动全局治理优化。
阿里云云原生一体化数仓成本优化案例
措施1
:看数据治理中心资源消耗分析报告发现问题解决问题。
措施2
:合理使用付费模式,达到资源最高效利用。
措施3
:针对回刷数据场景成本管控方案。
阿里云云原生一体化数仓成本优化效果
90天上线
:某头部音视频客户出海300人团队使用数据5000+CU资源使用8万次。
数据质量规则数量提升
:某互联网客户数据质量规则数量提升4倍,拦截数百个风险问题。
成本降低
:某头部互联网客户20%成本降低,下线近万张表,下线数千个计算任务。
治理问题
:9000+治理问题,某金融客户处理完成3000+问题,构建全链路数据治理体系。
你可能感兴趣
阿里云大数据计算平台基于 AIOps 的根因定位实践-张颖莹
信息技术
ArchSummit上海2023|全球架构师峰会
2023-06-06
03-云原生跨域大数据架构落地实践-吴维伟
信息技术
ArchSummit北京2023|全球架构师峰会
2023-06-06
阿里云AI搜索RAG大模型优化实践
信息技术
极客传媒
2024-10-28
App 研发效能提升和性能优化实践-郭伟
信息技术
ArchSummit北京2022|全球架构师峰会
2022-11-02
快手基于自动化治理实践驱动数据成本零增长_孙伟
信息技术
ArchSummit深圳2023|全球架构师峰会
2023-08-02