AI智能总结
目 录 C O N T E N T .............................................................................................................page 01 图数据库技术概述...................................................................................page 02 2.3 图数据库特点.............................................................................................page 04 2.3.1 直接体现实体间的关联关系2.3.2 高效灵活的扩展数据规模2.3.3 可对关联数据进行快速查询2.3.4 提供了针对图检索的查询语言 2.5 图数据库的未来挑战...................................................................................page 07 2.5.1 大数据的挑战2.5.2 新硬件的挑战2.5.3 接口语言的挑战2.5.4 数据建模的挑战 ...................................................................................page 08图数据库金融应用 .............................................................................................page 08.............................................................................................page 08.............................................................................................page 10.............................................................................................page 103.1 金融风险管理3.2 金融欺诈检测3.3 知识图谱构建3.4 市场营销分析 图数据库国际标准...................................................................................page 12 4.1 图数据库 Benchmark 介绍4.2 图数据库 Benchmark 的特性4.3 LDBC FinBench 标准4.4 FinBench 测试基准应用...........................................................................page 12..........................................................................page 13...................................................................................page 14...................................................................................page 154.3.1 FinBench 背景介绍4.3.2 FinBench 场景与设计4.3.3 FinBenchv0.1.0 版本 图数据库优秀案例分析5.1 蚂蚁集团基于 TuGraph 的金融风控实践5.2 海致星途基于 AtlasGraph 的信用卡智能应用5.3 嬴图 LRM 流动性风险管理图中台5.4 创邻科技——Galaxybase 国产高性能图数据库在某全国股份制银行的建设与应用5.5 TigerGraph——国内某 top5 银行利用 TigerGraph 打造图存储+ 图计算 + 图可视化的一体化的反洗钱反欺诈解决方案5.1.1 案例概述5.1.2 案例说明5.1.3 整体成效5.1.4 经验与启示5.1.5 企业介绍5.2.1 案例概述5.2.2 案例说明5.2.3 整体成效5.2.4 社会价值5.2.5 经验与启示5.2.6 企业介绍5.3.1 案例概述5.3.2 案例说明5.3.3 整体成效5.3.4 经验与启示5.3.5 企业介绍5.4.1 案例概述5.4.2 案例说明5.4.3 整体成效5.4.4 经验与启示5.4.5 企业介绍5.5.1 案例概述5.5.2 案例说明5.5.3 整体成效5.5.4 经验与启示5.5.5 企业介绍............................................................................page 16..........................................................page 16....................................................page 22................................................................page 27................................................................................................page 37..........................................page 42 引 言 随着通信技术和大数据快速发展,金融行业数字化程度不断加深,金融行业具有的数据资产体量剧增,数据间的关联关系变得愈发复杂交错。传统的对少量、单维度、静态化数据的分析已经难以满足金融业数字化转型需求,多样的风险形式对风控能力提出了更高要求,越来越多的场景需要借助智能化技术。图数据库作为深入挖掘数据信息的有力工具,开始受到全行业的关注,它以其独特的数据模型和高效的查询能力,为金融行业提供了一种全新的数据管理和分析解决方案,并在金融业开展广泛应用。 为了更有效的评估金融场景下的图数据库,国际关联数据基准委员会(LDBC)正式发布全球首个金融图数据库测试基准的首个版本 FinBench,填补了金融图数据库领域测试基准的空白,为金融行业提供了一个全球范围内专业、客观的共享工具,以评估和比较不同图数据库的性能。其参与成员包括蚂蚁集团及 Intel、KATANAGRAPH、NebulaGraph、Pometry、TigerGraph、嬴图等全世界范围内多家专注于图数据库领域的科技公司。 为推进图数据库国际标准 FinBench 在金融行业的创新应用试点,总结图数据库技术与产业融合创新的优秀经验做法,促进图数据库技术和经济社会发展的深度融合,北京前沿金融监管科技研究院(以下简称前沿研究院)开展金融图数据库场景应用案例征集工作,并在 2023 金融街论坛年会“全球金融科技中心网络年会”上发布重要成果“图数据库金融应用场景优秀案例”。 本次“图数据库金融应用场景案例”征集工作,以图数据库权威基准测试组织“关联数据基准委员会(LDBC)”发布的金融图数据库基准“LDBC-FinBench”为评选维度,考察了评选案例在金融场景的产品力、应用实效场景、风控效果等方面的表现。蚂蚁集团、海致星图、创邻科技、嬴图等 5 家企业的图数据库应用案例首批入选。 尽管图计算已经在各种不同场景展现了技术的卓越优越性,但未来应用的广度和深度仍然有着巨大的拓展空间。为帮助金融机构和相关从业者更深入地理解图数据库技术,前沿研究院编写了《高性能图数据库金融应用白皮书》,介绍了图数据库技术特点、在金融行业的应用、技术标准等内容,并展示了蚂蚁集团等获奖案例企业是如何借助图数据库技术助力金融机构实现数据价值的最大化,提升业务效率,降低风险,并推动创新。未来,图计算这项技术服务千行百业,还需要行业共建更多基准、标准指引,携手探索技术应用的更多可能性面,推动行业发展和技术创新。 图数据库技术概述 2.1图数据库定义 2.1.1市场定义 图数据库是指以图表示、存储和查询数据的一类数据库。此处的图不是指图片,而是以图论为理论基础,使用图模型,将关联数据的实体作为顶点(vertex)存储,关系作为边(edge)存储,解决了数据复杂关系带来的严重随机访问问题。在分类上,图数据库可归类为 NoSQL 数据库。 随着企业数字化转型的深入,社交、物联网、金融、电商等领域快速发展,因此产生和收集的数据量呈现指数级的增长,传统的关系型数据库在处理复杂关系的数据方面遇到瓶颈,其对数据的管理和使用不能完全满足市场需求。企业对于数据库的需求已经从一般的数据管理演变为从复杂的数据关系中最大化提取数据价值。在图数据库中,数据间的关系和数据本身同样重要,它们被作为数据的一部分存储起来。这样的架构使图数据库能够快速响应复杂关联查询,因为实体间的关系已经提前存储到了数据库中。图数据库可以直观地可视化关系,是存储、查询、分析高度互联数据的最优办法。 概念解析 图模型 在基于图的数据模型中,最常见的两种方法是标签属性图(LPG)和资源描述框架(RDF)图两种。 标签属性图模型数据对象被表示成节点(拥有一个或多个标签)、关系和属性,由顶点、边及其属性构成。图数据库通常是指基于标准属性图模型的图数据库。顶点和边都可以带有属性,节点可以通过“标签(Label) ”进行分组。表示关系的边总是从一个开始点指向一个结束点,而且边是一定是有方向的,这使得图成为了有向图。关系上的属性可以为节点的关系提供额外的元数据和语义。 需要指出的是,最早采用标签属性图模式来设计实现图数据库的是 Neo4j,但是标签这种模式并不是数据库领域的国际标准。标签可以看做是一种特殊的数据库索引,但是它的通用性和标准化相比于数据库领域标准化的 schema(模式)会弱很多。这个问题又涉及到 NoSQL vs. SQL 中的无模式(schema-free)与 模式化(schematic)之间的差异。Neo4j 是典型的无模式图数据库。在即将面世的图查询语言(GQL)国际标准中,采用的是支持模式的方式——其优点在于对于图数据的管理更加清晰。因篇幅所限,此议题不再展开论述。标签属性图可以看做是属性图模型的一类特例。 属性图模型的优点在于它具有优秀的查询性能和灵活性,可以通过局部和全局索引快速检索信息。此外,它还支持多种查询语言和图形算法,使用户可以更轻松地进行复杂的分析和查询。 RDF 主要针对文本语义的场景,用三元组来表达,因此基于 RDF 图模型的图数据库又称三元组数据库。RDF 模型在顶点和边上没有属性,只有一个资源描述符,使用 Web 标识符(URI)来标识事物,并通过属性和属性值来描述资源,这是 RDF 与属性图模型间最根本的区别。在 RDF 中每增加一条信息都要用一个单独的节点表示。比如,在图中给表示人的节点添加姓名。在属性图中只需要在节点添加属性即可,而在 RDF 中必须添加一个名字的单独加节点,并用 hasName 与原始节点相连。 RDF 模型的优点在于它具有灵活性和可扩展性,可以方便地添加新实体和关系,但是,RDF 模型在处理大规模数据时可能会出现性能问题,因为




