MatrixOne 从 NewSQL 到全新 HTAP 分布式架构的演进,主要围绕解决早期架构的三大难题——扩展性、性能和成本——展开。早期架构采用多副本存储、Leader 选举和多存储引擎,导致存储成本飙升、热点问题和开发维护成本高。架构升级的核心在于:
- 整体架构解耦:将计算、事务和存储三层解耦,采用灵活的架构设计,包括共享日志层、文件服务和 S3 存储等,实现极致弹性和高性价比。
- 融合存储引擎:引入单一 TAE 引擎,支持 TP 和 AP 负载,采用列式编码压缩和 Column Family 技术,灵活切换行存和列存,同时支持事务隔离和冷热数据分离。
- 高性能计算引擎:基于 DAG 构建执行计划,支持并发和并行执行,完善 SQL 能力,并引入因子化算法加速复杂查询。
- 资源隔离与扩展:通过机器级别和容器级别隔离,实现 TP 和 AP 负载的完全隔离;通过动态调整节点分配,灵活调整资源配比,提升资源利用率。
架构升级的困难与收获包括:理解 SQL 执行、事务与 ACID、CN 与 DN 适配、Logtail 引入和 S3 存储经验积累等。MatrixOne 致力于打破数据孤岛,提供开放的技术社区和生态系统,实现数据在数字世界中的任意存储和计算,帮助用户释放数据潜力。
MatrixOne 产品路线计划通过 Beta Program 和后续版本迭代,持续提升产品和性能体验,目标成为行业领先的数据基础软件公司。