行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

3 - 5 Kyligence 云云上势分析

信息技术 2022-07-18 DataFunSummit2022：多维分析架构峰会喜马拉雅

Kyligence Cloud 云上数据湖分分析报告总结

核心观点与问题背景

Kyligence 简介：Kyligence 是由 Apache Kylin 创始人于 2016 年创立的，面向大数据的领先开源 OLAP 平台，融合 Kylin 和 Intelligence，获得 Redpoints、Cisco 等顶级投资机构支持，采用双头办公模式，提供 24*7 全球 SLA 服务。
数据湖分析三大问题：自助数据湖中存在数据信任问题、数据冗余（“泥湖”）、ETL 成本高、数据扩展性差等问题，导致用户增加 100 倍时 IT 成本也增加 100 倍。

多维数据模型解决方案

自助服务极端问题：中国互联网巨头因自由形式、自我服务导致数据表爆炸式增长（5.7k ODS 表扩展至 1m 宽表），重复 ETL 浪费严重，宽表聚合表缺乏统一业务语义。
多维数据模型优势：通过构建多维数据模型，可以标准化数据、减少重复 ETL、降低成本，同时支持业务创新。
Kyligence Cloud 功能：作为多维数据库（MDDB），Kyligence Cloud 旨在组织数据资产、缩短洞察时间、降低总拥有成本。

多维数据模型如何解决问题

组织数据资产：
- 多维数据模型特性：专注于模型而非表格，使用 SQL 和 MDX 语言，消除重复数据。
- 案例：通过 1 个模型和 2 个长方体替代 8 个宽表，减少 8-3 和 4-1 的表数量，降低 10 亿级高管查询成本。
减少洞察时间：
- 预计算优势：95% 的预计算结合 5% 的在线计算，通过 SQL 快速查询，优化存储缓存（如 RaptorX 分层缓存）和计算加速（如 Velox、ClickHouse）。
- 优化器设计：通过 Transformer 和 WholestageTransformer 优化 Spark 计算计划，提升性能。
降低 TCO 和人力投入：
- 自动化扩展：云上自动化可扩展性，支持 Spot 实例和弹性扩展。
- 存算分离：存储/计算分离，对象存储读写分离，K8S 调度提高资源利用率。

研究结论

关键收益：数据湖中的多维数据库（Kyligence Cloud）可以显著减少洞察时间、降低总拥有成本，解决“泥湖”问题，通过优化数据组织和 ETL 流程提升业务效率。
联系方式：Apache Kylin 和 Kyligence 公司官网、邮箱和社交媒体信息。

报告封面

点击免费查看完整报告

你可能感兴趣

hot

台积电上周传出其客户同意台积电将3纳米芯片代工价上调5以上先进封装明年报价上

商贸零售

未知机构2024-07-08

hot

阿根廷：买入新的5年期美国国债（散布在UST）；在3个月期的Lebacs上获得部分利润

商贸零售

巴黎银行2016-05-05

hot

【机构调研】这家本土操作系统龙头服务器产品已上架华为云云商店

商贸零售

未知机构2023-07-04

hot

食品饮料行业深度分析：消费景气行业之海水产篇-舌尖上的海鲜，品牌化渐起势，千亿市场待掘金

商贸零售

安信证券2016-01-20

hot

15国开22(增2)、15国开23（增2）、15国开20（增5）、15国开21(增3)和15国开18(增7)金融债定价分析

商贸零售

顺德农商行2015-11-10