图数据库是图谱系统的核心,其选型对数据规模、吞吐率、实时性和稳定性至关重要。然而,由于产品差异大、场景和方案不确定,图数据库选型存在困难。
基准测试(Benchmark)是系统选型的最佳工具。Benchmark通过模拟真实场景对系统进行测试,验证其在功能、性能和稳定性方面的表现。关系型数据库已有成熟的TPC-C、TPC-H等基准测试,而图数据库的基准测试尚处于发展初期。
好的Benchmark需要贴合实际、严谨且可扩展。数据特征应包括点抽象、边抽象、属性富集程度、重边、时间窗口等;操作特征应涵盖读操作和写操作;性能特征应考虑读写比例、并发特征、延迟要求和吞吐要求。LDBCSNB(SocialNetworkBenchmark)和Twitter的基准测试存在数据特征不符、读写操作与实际应用不符、扩展性差等问题,而LDBCSNB更符合实际应用场景。
LDBCSNB和FinBench是两种主要的图数据库基准测试。LDBCSNB面向社交领域,而FinBench面向金融场景。FinBench在模型设计、查询与负载设计等方面更具针对性,例如数据模型包含重复边、边上属性与操作强相关,查询设计包含延迟要求、子图分析等。
FinBench的设计进展。蚂蚁集团基于多年金融实践经验提出FinBench,并联合LDBC推进建设。目前,FinBench已进入共建阶段,下一步计划邀请更多国内外厂商加入,丰富设计并开发BenchmarkSuite。
蚂蚁集团积极参与行业标准与生态建设。蚂蚁作为国内核心参与者,已提出若干提案并被接纳,牵头制定国家标准和行业标准,并受邀成为LDBCSponsor。同时,蚂蚁图数据库TuGraph已对外商业化输出,致力于推动图数据库生态发展。
总结。图数据库是图谱应用系统的核心,Benchmark是图数据库选型的最有力工具。FinBench是面向金融场景的图Benchmark,欢迎更多人参与一起制定。TuGraph是高性能HTAP图数据库,欢迎合作,欢迎加入团队。