您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国电子技术标准化研究院]:2025年知识图谱与大模型融合实践案例集-中国电子技术标准化研究院 - 发现报告

2025年知识图谱与大模型融合实践案例集-中国电子技术标准化研究院

AI智能总结
查看更多
2025年知识图谱与大模型融合实践案例集-中国电子技术标准化研究院

ܿྰᎃ҃ӬͮὙ˖ڍႂߔ੾శಕэӐᆐቂᬒࣱ  త ಴Βᬶ᡺ࠃᚷՋۋഴܷ៧ˀڎᅻខ 牵头编制单位 中国电子技术标准化研究院 编制组成员 李瑞琪蔡宇峰卓兰韩丽程雨航李佳董昕阳李湘谭家琪焦铸金 知识图谱与大模型融合实践综述 随着人工智能的迅猛发展,知识图谱与大模型作为两大核心研究领域,各自彰显出独特的技术优势。知识图谱以结构化方式精准刻画实体关联,为知识表示与推理提供了可解释的框架;大模型则凭借海量数据训练展现出卓越的自然语言理解与生成能力,具备强大的泛化学习性能。 然而,知识图谱与大模型两者在实际应用中仍面临多重挑战。知识图谱虽然具有较好的可解释性,但其输出仅局限于知识图谱自身的信息,自身缺乏自主生成和学习能力,因此知识通用性和完备性不足。大模型在处理特定领域知识类问题时易产生“幻觉”问题,导致大模型“胡说八道”;其次,每次更新,大模型都需要经过长期的语料训练,训练周期冗长、资源消耗巨大,致使大模型难以快速响应动态业务需求;最后,大模型训练数据还面临隐私和数据安全等问题。 因此,为了突破上述难题,知识图谱与大模型融合应运而生。从技术互补角度出发,一方面知识图谱可以作为大模型的外部知识库,为大模型提供结构化知识,不仅有效减缓大模型“幻觉”现象,而且能减少大模型对海量标注数据的依赖,从而降低大模型的训练所需的算力和时间。同时,知识图谱的数据加密与保护能力,可与大模型的数据调用能力形成协同,强化隐私安全保障。另一方面,大模型所涵盖的海量知识及其对新数据的理解能力,能够帮助知识图谱进行知识补全与知识校验,提高知识图谱里知识的完备性与准确性。同时大模型的生成能力,还能帮助知识图谱实现多元化的知识输出,进一步提升人机交互水平。综上所述,知识图谱与大模型融合能够实现“1+1>2”的技术协同效应,为企业和用户提供更可靠、高效和安全的知识服务。 本章将系统阐述两者融合的整体架构,深入分析国内外标准化进展,并详细介绍本案例集的分布情况。 (1)整体架构 1.活动参与方 本节详细阐述知识图谱与大模型融合所涉及的参与方及其活动。知识图谱与大模型融合活动参与方如图1-1所示,主要由数据提供方、模型提供方、知识图谱提供方、图谱模型融合方与应用方五类参与方执行。 (1)数据提供方 数据提供方根据模型提供方、知识图谱提供方和图谱模型融合方的具体数据需求,从数据来源、类型、规模、质量、使用要求以及应用场景等多个维度,为三方提供构建知识图谱与大模型所需的数据。数据提供方主要任务是确保交付高质量、符合需求的数据资源,以支持图谱模型融合方的工作。其核心活动包括但不限于数据收集、数据清洗、数据标注以及 数据验证等数据服务,并确保数据交付的规范性、完整性、准确性、一致性、时效性和可访问性。同时,数据提供方持续优化数据提供流程,提升服务质量。数据提供方还需要根据应用方在知识服务过程中产生的新数据,评估应用服务效果及边界,并进行持续的数据更新与优化。 (2)模型提供方 模型提供方根据图谱模型融合方的具体模型需求,从模型类型、架构、性能、适配场景、训练数据要求以及部署方式等多个维度,为图谱模型融合方提供知识图谱与大模型融合所需的基础模型和工具等。模型提供方主要任务是确保交付高质量、符合融合需求的模型资源,以支撑图谱模型融合方的系统融合工作。其核心活动包括但不限于数据处理、模型训练、模型评估、模型融合以及模型微调,并确保模型的准确性、可靠性、高效性、可扩展性、安全性和可解释性。 (3)知识图谱提供方 知识图谱提供方与模型提供方类似,根据图谱模型融合方的需求及反馈,为图谱模型融合方开发和提供基础知识图谱、本体模型和工具,并对其优化和维护。知识图谱提供方主要任务是面向各类型的知识图谱与大模型融合任务提供知识图谱及相关工具支撑,确保交付高质量、符合融合需求的图谱资源。其核心活动包括但不限于本体构建、数据处理、知识标注、知识抽取、知识融合、知识编辑、知识计算等知识图谱构建与应用服务,并确保知识图谱的完整性、准确性、一致性和时效性。 (4)图谱模型融合方 图谱模型融合方根据应用方的具体需求和任务类型,整合知识图谱提供方与模型提供方的图谱和模型资源,从系统架构、接口适配、功能组成以及部署环境等多个维度,构建融合化的知识服务平台。图谱模型融合方的主要任务是执行融合过程,确保交付稳定、高效、符合应用需求的融合系统。其核心活动主要有知识图谱与大模型输出协同、大模型增强知识图 谱和知识图谱增强大模型,并确保融合系统的兼容性、稳定性、高效性、可扩展性和安全性。同时,图谱模型融合方将根据质量评估结果及应用方的使用反馈情况的系统使用效果与问题,持续优化融合系统与方案,提升知识服务质量。 (5)应用方 应用方负责将知识图谱与大模型融合后形成的系统部署到实际业务场景中,开发具体的功能模块,并进行持续的监控和优化。应用方主要任务是业务实施过程中,明确核心需求和关键指标,将知识服务过程中产生的新数据、新需求及问题反馈给数据提供方和图谱模型融合方,推动产业上中下游的协同优化与迭代。 2.融合类型 本节详细阐述图谱模型融合方的三种融合活动,即知识图谱与大模型输出协同、大模型增强知识图谱和知识图谱增强大模型,及其之间的关系。知识图谱与大模型融合技术框架图1-2所示,该框架详细呈现了图谱模型融合方的融合流程,三种融合活动各自的活动构成以及三种融合活动之间的关系。 (1)大模型增强知识图谱:图谱模型融合方以大模型为工具,对知识图谱进行构建、更新与补全,提升知识图谱自身质量及其构建效率。大模型增强知识图谱的活动构成包括模型增强知识表示、模型增强知识建模、模型增强知识获取、模型增强知识融合等。通过大模型增强知识图谱,能够实现知识图谱的动态更新,使知识图谱的结构与内容更加完整、准确。 (2)知识图谱增强大模型:图谱模型融合方以知识图谱为工具,围绕大模型的训练、微调、推理等过程,弥补大模型在知识准确性、逻辑性和可解释性上的不足,增强其应用能力。知识图谱增强大模型的活动构成包括知识图谱增强模型的预训练、知识图谱增强模型的对齐微调、知识图 谱增强模型的评估、知识图谱增强模型的推理等。通过知识图谱增强大模型,为大模型的输出结果提供可视化展示,增强了大模型输出的可解释性,并且大模型可以通过检索知识图谱来获取准确的知识,从而减少“幻觉”的产生。 (3)知识图谱与大模型输出协同:图谱模型融合方面向具体应用场景,将知识图谱的结构化知识与大模型的生成能力相结合,实现更精准、可靠且可解释的输出结果,以互补方式增强知识应用的性能。具体活动构成有检验与评估、语义识别/分解、混合知识检索、协同推理、结果生成与溯源、知识统一表征和动态编排与调度。通过输出协同,知识图谱为大模型提供了坚实的知识基础,大模型则借助其语义理解和生成能力,让知 识得以更灵活地应用。 知识图谱与大模型输出协同、大模型增强知识图谱、知识图谱增强大模型三者之间环环相扣,知识图谱与大模型输出协同也可作为前两者相互增强后的综合体现和应用成果。大模型增强知识图谱,使得知识图谱更完整和准确,为两者协同输出提供了高质量的知识基础;知识图谱增强大模型,让大模型在知识准确性、逻辑性和可解释性等性能方面更优,为输出协同的输出结果提供了可靠的生成能力。反过来,两者协同的结果又会作为大模型的输出,进一步强化、完善知识图谱的结构与内容,从而形成螺旋上升式循环。知识图谱与大模型通过相互增强,为两者的协同输出奠定基础,而协同输出又反哺两者的相互增强,共同推动着知识服务向更精准、高效和可靠的方向发展。 (2)知识图谱与大模型融合标准化现状 1.知识图谱国际标准化现状 2018年,ISO 30401:2018:《知识管理体系要求》由国际标准化组织(ISO)于2018年11月发布。该标准将知识定义为“一种人类或机构的资产,促进有效的决策及行动”,明确规定了在机构内促进知识的发展、共享及有效使用所需的要求。2024年7月,ISO/IEC 5392:2024《信息技术人工智能知识工程参考架构》在ISO和国际电工委员会(IEC)正式发布。该国际标准的正式发布填补了知识工程领域国际标准的空白,凝聚和统一了各利益相关方对知识工程的参考架构,对推动我国知识工程相关基础产品、技术方案在全球范围内的推广,探索知识服务与应用新模式,加速智慧医疗、智能制造、智慧金融、智慧交通、智慧教育等行业和企业知识要素流通及知识资产管理体系的建设均具有重要意义。 此外,电气与电子工程师协会(IEEE)于2023年正式宣布成立IEEE 知识工程标准委员会,负责指导、管理和监督IEEE知识工程标准的立项、研制、评审、发布、宣贯及相关应用实践过程。目前IEEE知识工程标准委员会已发布5项标准,2项标准技术内容已冻结,10项标准在研,覆盖知识图谱参考架构、测试评估规范、金融和电力行业等行业领域的应用指南,以及知识图谱与大模型融合和智能助手等实际应用的要求,形成了通用领域和细分领域标准协同推进的研制路线。其中,IEEE P2807.13与P2807.14聚焦知识图谱与大模型融合,拟提出统一和明确的框架,并给出图检索增强生成的技术要求。知识图谱及知识工程相关标准详细信息如表1-1所示。 2.大模型国际标准化现状 2022年,ISO/IEC 22989:2022《信息技术人工智能人工智能概念和术语》正式发布。该标准作为人工智能领域的基础标准,定义了100多个核心术语,为大模型的技术文档等文件提供规范化语言参考。同期,ISO/IEC 23053:2022《运用机器学习的人工智能系统框架》在ISO和IEC正式发布。该标准明确了机器学习系统的通用架构,为大模型的系统设计提供方法论指导。2023年,ISO/IEC 42001:2023《信息技术人工智能管理体系》正式发布。作为全球首个人工智能治理标准化文件,该标准规定了在组织内部建立、实施、维护和改进人工智能管理体系的要求,为行业内人工智能系统和大模型应用的规范化发展提供指导。 同期,ISO/IEC 5338:2023《信息技术人工智能AI系统生命周期流程》正式发布,其中文件对大模型全生命周期流程提出规范化要求,为大模型管理提供参考。在大模型质量评估方面,2024年,ISO/IEC TS25058:2024《系统和软件工程系统和软件质量要求和评估人工智能系统质量评估指南》和ISO/IEC 5259-4:2024《人工智能-分析和机器学习的数据质量-第4部分:数据质量过程框架》正式发布,为大模型的设计方面和评估要求提供标准化指导和规范。2025年7月,ISO/IEC AWI 25872-1《人工智能知识增强大模型第1部分:框架》正式立项,该标准将聚焦知识增强大模型预训练、微调、推理和生成等多个阶段,为知识增强大模型的技术发展和集成应用提供标准支撑。 除此之外,在人工智能道德伦理方面,IEEE于2018年发布了《人工智能设计的伦理准则(Ethically Aligned Design)》白皮书,并成立了IEEE P7000系列标准工作组。该白皮书围绕人权、福祉与问责等原则展开深入探讨,旨在推动社会对人工智能伦理议题的广泛讨论,并促进国际社会相关政策的制定与出台。大模型相关标准详细信息如表1-2所示。 3.知识图谱国内标准化现状 2022年12月30日,GB/T 42131-2022《人工智能知识图谱技术框架》发布。该标准围绕知识图谱技术框架、利益相关方、关键技术要求、性能指标、典型应用及相关领域、数字基础设施、使能技术等内容进行研究,以梳理知识图谱核心标准化需求,提升我国知识图谱标准化工作水平,并促进知识图谱在各行业的推广应用。2025年4月25日,GB/T 45628-2025《人工智能知识图谱知识交换协议》发布。该标准围绕知识交换协议框 架、知识描述规则、基于文件的知识交换以及基于消息的知识交换等内容进行研究,以规范知识交换活动中各方知识交换流程、消息结构等,提高多方知识图谱的兼容性和互操作性,提升整体产品质量