登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
9-4 海量物联网设备元数据存储引擎选型和演进
信息技术
2022-07-19
DataFunSummit2022:大数据存储架构峰会
A***
AI智能总结
查看更多
业务场景介绍
场景描述
:统一设备元数据管理平台,涉及物流车、无人贩售机等设备,常见存储字段包括设备ID、类型、最近修改时间、在线时间等。
需求特点
:多类型接入、海量设备、并发更新、灵活检索和圈选。
能力拓展
:支持活动场景业务激增。
存储架构演进
第一代架构
:MySQL单库/分库分表,适用于活跃设备万级别、终端类型少量、峰值读写100QPS的场景。
第二代架构
:HBase + MySQL + Elasticsearch,适用于活跃设备亿级别、终端类型数十个、峰值读写10k+QPS,并支持复杂检索。
问题
:第一代架构成本高、运维复杂、弹性不足;第二代架构存在数据同步、更新能力弱、大促弹性不足等问题。
存储引擎对比
HBase
:分布式、LSM、写入能力强,适用于海量数据存储和简单查询。
MySQL
:分布式、B+树、SQL查询能力强,适用于中小数据集合下的CRUD操作。
Elasticsearch
:分布式、Lucene倒排、全文索引能力强,适用于复杂查询。
自研新存储引擎
需求
:活跃设备十亿级别、终端类型数百个、峰值读写100k+QPS,支持复杂检索分析。
架构设计
:分布式存储系统、存储计算分离、LSM文件组织、复合索引和灵活数据路由策略。
关键技术
:分布式架构、存储计算分离、LSM存储引擎、CDC数据订阅能力、自动分区扩展。
场景优化
海量设备圈选问题
:亿级别设备中基于条件圈选命中数据量大时性能不满足。
优化措施
:加并发优化查询、分片键路由、存储层深入优化(ParallelScan)。
架构对比
HBase+ES vs 自研引擎 vs Tablestore
:
HBase+ES
:需要额外维护数据同步,运维门槛高。
自研引擎
:存储计算分离,支持CDC和OLAP查询,扩展性强。
Tablestore
:Serverless免运维,租户隔离能力完善。
总结和展望
当前工作
:多介质分层存储、基于SQL扩展分布式OLAP能力、提升存储引擎计算能力。
你可能感兴趣
【研选】海量数据使我国存储设备需求增长成为必然,分析师看好相关产业链;公司下游客户确认存储价格反转趋势后,积极进行库存备货,有望最大化受益下游补库节奏
未知机构
2024-03-01
深耕物联网终端和数据存储,尽享AI时代红利
信息技术
太平洋证券
2024-03-24
数据湖统一元数据和存储管理
信息技术
DataFunSummit2023:数据湖架构峰会
2023-07-12
高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰
电子设备
ArchSummit北京2022|全球架构师峰会
2022-11-02
8-4 神策数据营销策略引擎的技术演进 - 关海南_神策数据
文化传媒
DataFunSummit2022:数据科学在线峰会
2022-06-13