蚂蚁商家图谱的构建、融合应用及开放
01 概览
蚂蚁商家图谱旨在为蚂蚁集团建设丰富、精准、高效、一体化的商家知识图谱,通过掌握商家经营点位理解,了解商家场景、类别之间的联系,并在特定场景、时空条件下找到关联的商家和服务。其目标是为全生命周期的消费者提供最优质服务,支撑商家生意增长与优质服务供给的闭环。
背景介绍
蚂蚁商家图谱通过支付宝APP服务、小程序、线下门店等方式为商家和用户提供服务,旨在提升商家生意和用户服务体验。其核心目标是刻画商家用户和商家,赋能支撑商家生意增长与优质服务供给。
体系建设
蚂蚁商家图谱的体系建设包括图计算引擎、认知计算、基础依赖图谱底座、NLP平台、NLP算法研发/训练、预训练模型服务、知识/事件抽取、Schema构建及演化、图谱存储/更新/查询、图谱SDK、规则引擎等。核心能力体系包括认知搜索、智能客服、商家增长、企业风控等。
02 图谱构建&融合应用
图谱构建
整体框架
图谱构建的整体框架包括知识加工、知识存储、知识运营、持续学习、知识建模、知识获取。其中,知识获取通过大规模多标签分类模型和通用文本抽取模型实现。
知识获取
- 大规模多标签分类模型:结合图像特征和label语义信息,设计了一种融合语义知识的多模态多分类模型,在义原预测任务上准确率提升5pt。
- 通用文本抽取模型:引入词典先验信息,设计了一种词典融合抽取模型,在MSRA和CLUNER数据集上F1提升显著。
知识链指
知识链指通过实体链接流程,将自由文本中的商户、门店、品牌、商品等实体指称链接到知识图谱,完成实体的对齐归一。
图谱融合
跨图谱知识复用
跨图谱知识复用通过领域图谱融合/复用,实现跨业务的知识连接、复用,减少无效数据拷贝,连接即可应用,标准化知识服务链路,减少业务找数据的成本,通过知识复用带来更大业务价值,降本提效。
跨图谱融合能力模型
跨图谱融合能力模型通过不同实体类型但相同实例的融合和不同实体类型不同实例的关系连通,实现跨业务的知识复用。
图谱认知
知识表示
知识表示通过案例展示,如消费券召回业务,融合点属性和边学习长尾item,学习更充分行为图用于扩召回,业务场景图谱概览,向量召回模型引入user&item节点图表征后,相比于没有graph emb效果更优,delta版本召回的结果历史热度更低,对item分布更广、覆盖更多,一定程度缓解了头部效应。
03 图谱开放
开放知识
首批发布数据
首批发布数据包括3000+品牌、10w+商家类目、1000+标签、7w+品牌意图标签。
首批开放任务
首批开放任务包括小程序多意图分类、通用概念上下位预测、实体识别与分类。
官方网站
官方网站:https://akg.alipay.com/xxx
开放SDK能力
知识图谱开放SDK能力
- 系统集成:知识建模、知识加工、任务发布与结果查询、知识查询、知识推理。
- 算法开发:基于javasdk或前端组件被业务系统集成,基于pythonsdk支持算法一键import,高效子图获取,子图提取、算法定义、训练&预测。
- 数据集成:支持跨业务的图谱融合及业务数据-图谱高效挂载,知识视图、数据挂载、数据分析、数据挖掘。
支持业务直接集成图谱能力的JavaSDK
JavaSDK代码示意展示了如何使用JavaSDK进行知识建模、关系添加等操作。
04 总结与展望
总结
- 构建比较完整的user–商家连接。
- 各类商家供给之间通过id和推理关系进行对齐,商家信息归拢。
- 构建同类画像本体上下位,推理归纳不同类画像本体之间的关联。
- 商户信息整合与深度理解构建商家基础画像,品牌、行业意图、时空等。
- 服务场景数据深度理解,推理商家动态画像以及用户和商家的联系。
展望
通过构建和开放商家图谱,蚂蚁集团能够更好地服务商家和用户,提升业务价值和用户体验。