美的 IoT 平台踩坑历程总结
01 美的 IoT 简介
美的物联网愿景是连接用户与家庭,为亿万家庭提供最佳的全屋智能家居体验。其核心产品美居提供场景联动、单品能力、空间场景等功能,涵盖安防、空气、娱乐、清洁、洗护等多个领域。平台包含设备卡片(控制与内容服务)、食谱(17000+智能食谱)、服务(售后服务能力闭环)等模块。
02 连接之坑
配网问题
- 配网流程:AP配网 -> 连接路由 -> 设备上云 -> 绑定设备。
- 安全挑战:设备易受隔壁WiFi影响,需通过物理按键确权解决。
- 解决方案:引入免确权机制,通过判断AP信号强度自动连接。
设备接入问题
- 接入层:使用100万+智能设备接入,面临DNS绑定IP限制、生效时间长、负载分配不均等问题。
- 智能DNS:按区域动态规划入口SLB集群地址,解决DNS问题。
- 设备寻址:通过ADNS服务实现设备区域动态切换,基于SLB及后端服务压力调节接入点。
- TCP平滑升级:利用uds将旧服务tcp fd控制权转移至新服务,避免断连冲击。
03 交互之坑
设备控制问题
- 旧架构:基于同步阻塞队列,高并发时阻塞严重,依赖Redis及MQ。
- 优化方案:服务框架异步化改造、移除同步锁、合并节点、无状态化、消息分拆。
- 云端控制改造效果:TPS提升至16000/s,RT优化至355ms。
04 消息之坑
Kafka再平衡问题
- 问题表现:设备数上升导致消息堆积不消费,影响业务。
- 问题分析:消息通道集中、过度依赖Redis及DB、消费线程池阻塞。
- 优化方案:从源头拆分消息处理(配置中心动态路由)、本地缓存过滤重复消息、共享业务缓存。
- 改造效果:网络带宽下降44%,Redis CPU下降56%,MySQL CPU下降65%。
05 架构之坑
云端架构迭代
- 演进过程:从2013年设备接入到2022年微服务治理,逐步实现统一平台、云原生改造。
- 技术选型:选用Consul+Fabio替代异构中间件,实现服务发现、通讯协议统一、人工维护成本降低。
- 改造过程:分阶段实施服务注册、接口标准化、流量切换、旧框架清理。
- 新问题:流控、熔断、安全治理能力欠缺,全链路可观测性不足,可替代性缺失,事件绑定多环境隔离困难。
- 分布式运行时:DAPR成熟度不足,组件接口抽象对老旧服务迁移有障碍。
- 业务分层:采用FaaS运行框架,实现业务接口、通用能力分层,但单体应用设计存在风险。