登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
3-1 通过 dbt 把软件开发的最佳实践带到数据领域
信息技术
2022-11-02
DataFunSummit2022:现代数据栈技术峰会
Aaron
传统数据分析中的流程问题
传统数据仓库的局限性
:成本高昂、数据转换在存储层外进行、基础设施管理复杂、数据分析任务分散在工程师、数据分析师和利益相关者之间。
具体问题
:工程师成为每次更改的瓶颈、从头创建代码比查找现有代码更简单、不可追踪的变更流程破坏数据管道,降低对数据的信任。
云原生数仓带来的机会
云原生数仓的优势
:降低成本、易于使用、弹性存储和计算使得数仓内转换可行、减少基础设施管理。
带来的可能性
:工程师和分析师更专注于高回报任务(如优化和构建数据转换流程),为数据工作流程创新提供机会。
dbt 提供的解决方案
核心理念
:将软件开发的最佳实践应用于数据分析,实现模块化、可测试、持续集成和文档化,使数据分析流程更快更稳定地更新。
工作方式
:让任何知道 SQL 的人都能快速构建和测试数据,使用版本控制一次性更新并部署到所有地方,提供文档工具和自动刷新的血缘关系。
dbt 的关键功能
开发
:
使用 SELECT 语句(声明式)快速开发,包括多种物化类型(表、视图、增量、快照)。
无需考虑运行顺序,在开发、测试和生产中运行相同代码,自动解析正确模式,自动构建依赖关系。
宏:沙盒环境执行用户逻辑,将 SQL 片段抽象为可重用的宏,使用控制结构(如 if 语句和 for 循环)和环境变量。
文档
:
自动生成数据血缘关系,维护共享理解。
测试
:
在线测试假设数据和转换的有效性,包括唯一性、空值、特定值和有效外键等测试。
部署
:
使用版本控制和 CI/CD 无缝部署,最小化无用运行,通过仅测试更改来减少浪费。
集成 git 提供商,实现持续集成和持续部署,提供作业调度、日志和警报功能。
你可能感兴趣
3-1 HyperEnclave 信创 TEE 最佳实践 - 刘双
商贸零售
DataFunSummit2022:数据安全与隐私计算峰会
2022-07-18
把餐厅品质的用餐带到您的家餐桌
商贸零售
中泰国际
2025-08-29
提升公共交通的可及性与包容性——通过新技术和新兴交通技术的最佳实践指南,为政策制定者提供指导
商贸零售
亚太组织
2024-07-15
构建包容性采购战略:通过食品服务采购促进营养的最佳实践
商贸零售
世界工商理事会
2025-03-12
3-1 Apache InLong 一站式海量数据集成框架原理和实践
商贸零售
DataFunSummit2022:大数据存储架构峰会
2022-07-19