AI智能总结
演讲人:贺钰城联想开源优化架构师 目录Contents 生产制造企业的数据现状 clickhouse数据集成问题 01生产制造企业的数据现状 生产制造企业数据库使用现状 1、业务系统分散采用了不同的关系型数据库2、现有大数据平台处理能力T+13、数据量不断积累,关系型数据库无法满足需求 谜一样的数据流向 迷一样的sql SELECT BILLING, BILLING_DATE, DN, DN_ITEM, SHIP_DATE, PSD_CHURN, FAMILY, DESCRIPTION, PSD, LINE_PSD, PSD_AI_ADJ, AI_PSD_FLAG,PSD_COMMENT, REASON_CODE, FPSD, FG_DATE, MOT, VSBED, TRAZTD,SHIPTO_COUNTRY, DIS_CHANNEL, MTM, SO, SO_ITEM, SHIPPING_POINT, ROUTE, PRIORITY, DELIVERY_BLOCK, L_DELIVERY_BLOCK, CREDIT, SOLD2_KUNNR, SOLD2_NAME1, SHIP2_KUNNR, SHIP2_NAME1, CREATE_DATE, Z_CRCAD, Z_CRGID, LINE_QTY, ORDER_QTY, SO_TYPE, FSD, SOLD2_LAND1, AUTLF, PSTYV, GRKOR, INCO1, SELF_PICK, BSTKD,WAERK, AUDAT, AEDAT_H, ROUTE2MARKET, BSARK, ZZODMCAD, ECC_REASON, SALES_ORG, DIVISION, HIERARCHY, MATERIAL_GROUP, PLANT, SALES_OFFICE, MFG_SO_NUM, MFG_SO_ITEM_NUM, PO_NUM, PO_ITEM_NUM, PO_VENDOR_NUM, REJECT_CODE, T1.SITE, T1.SITE_TYPE, KZTLF, CREDIT_REL_DATE, DB_REL_DATE, REGION,SUB_REGION, BRAND, BRAND_BACKLOG, PG_BACKLOG, SUB_BRAND, SERIES, PRODUCT_GROUP, MARKET_NAME, AGING_M3, AGING_TTL, FWD_BAU, M1M2_LT, M3_LT, M1M2_STATUS, M3_STATUS, OTS_LT, OTS_STATUS, PSD_RSD, NO_PSD, MISS_CRAD, PSD_PASTDUE, PSD_LT, DEL_ACCURACY, FIRST_FG_DATE, TIE_FG_DATE, MARKET,TERRITORY, M1M2_SLA, M3_SLA, E2E_SLA, PSD_STATUS, ORDER_TYPE, GEO, SUBGEO, SYS_CREATED_DATE, OTS_SLA, AGE_ORDER, 生产制造企业数据处理的痛点 1、需要解决由于大数据量下UPDATE死锁问题2、数据化运营的今天更需要数据分析的及时性3、由于UPDATE丢失了原始数据,无法分析历史4、分析师要面对上千行的sql发呆 1、数据已事件方式录入,减少更新数据带来的问题。2、使用OLAP引擎来解决,解决查询性能的问题。3、一张大宽表可以让数据更明晰,减少sql的复杂度 02clickhouse集群架构 ClickHouse集群架构 03clickhouse数据集成问题 来数据给你,你自己处理 Clickhouse:你要累死我呀,别人还要用呢 数据写入越来越慢 通过JDBC接口写入,HTTP模式 有没有比HTTP更快的方式?TCP?Orelse? 无法实现数据压缩 数据中重复数据多岂不是很浪费资源?为什么不能先压缩了再传输呢? 数据量过大容易导致OOM 数据写入越来越慢 数据量大,通过HTTP处理不过来 服务器压力大,太多的INSERT请求 原来 Sink-Clickhouse,通过JDBC处理数据 Sink-ClickhouseFile,通过文件传输数据 04clickhouse查询并发性能的提升 数据查询的痛 数据查询的架构调整 ALTER TABLEuser_log ADD PROJECTIONp_ugg(SELECTwhoappcode,xwhenGROUP BYwho);ALTER TABLEuser_log MATERIALIZE PROJECTION p_ugg; Projection •ClickHouseProjections包含两大类:normal与aggregate•使用查询定义Projection,新建的Projection仅影响后续的写入数据•对历史数据构建Projection需要进行Materialize操作•查询无需任何改动即可使用Projection优化•可对单表增加多个Projection,查询将择优使用 —THANKS— 感谢您的观看