您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国通信标准化协会大数据技术标准推进委员会]:人工智能知识工程指南 - 发现报告

人工智能知识工程指南

AI智能总结
查看更多
人工智能知识工程指南

前言2024年政府工作报告明确提出,要“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”,随着“人工智能+”行动的持续推进,如何通过大数据、人工智能技术赋能数智化建设是各方关注的重点问题。数智化的核心是从数据中提炼出有价值的知识,构筑智能算法及模型,并将其赋能于机构业务、管理过程中的关键环节,实现降本增效及业务创新。作为连接“数据”和“智能”的桥梁,知识是机构员工决策、行动和创新的重要依据,同时也为大模型等智能算法的开发应用提供了高质量的训练和推理资源,是大模型在垂直领域应用落地的关键要素之一。在此背景下,各机构逐步开始重视知识工程能力建设,通过构筑知识工程工具链、完善知识管理体系、打造知识服务能力来更好的管理和利用知识资产,为大模型、智能体的应用落地提供知识来源,并赋能知识共享及协作、知识检索、知识推荐、智能创作等场景,从而提升机构的核心竞争力。知识工程已成为人工智能时代企业数智化能力建设的新增量。为进一步助力各方开展知识工程实践落地,助力各行业新质生产力的发展,中国信息通信研究院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSATC601)联合多家机构共同编制了《人工智能知识工程指南(1.0)》,以期与业界分享。由于相关领域正处于快速发展阶段,本指南仍有不足之处,欢迎联系wangchaolun@caict.ac.cn交流探讨。 编制说明CCSATC601大数据技术标准推进委员会中国信息通信研究院、中国联合网络通信集团有限公司、中电信人工智能科技(北京)有限公司、浙江大华技术股份有限公司、联通数据智能有限公司、厦门渊亭信息科技有限公司、中国铁道科学研究院、电科云(北京)科技有限公司、中移互联网有限公司、中国移动通信集团有限公司、南方电网数据平台与安全(广东)有限公司、中电科大数据研究院有限公司、上海鸿翼软件技术股份有限公司、中电金信软件有限公司、北京枫清科技有限公司、中国联合网络通信有限公司软件研究院、泛微网络科技股份有限公司、北京盛汉律师事务所、天翼数字生活科技有限公司、中国石油大学(华东)、北京宇信科技集团股份有限公司、易智瑞信息技术有限公司、上海爱数信息技术股份有限公司、湖北省数字产业发展集团有限公司、武汉大数据产业发展有限公司、南京中新赛克科技有限责任公司、广州小鹏汽车科技有限公司、山东犀盐数据科技有限公司、软通智慧科技有限公司、佳沃集团有限公司、途普智能科技(北京)有限公司、深圳力维智联技术有限公司 牵头机构:编委会成员机构名单: 目录一、知识工程发展情况概述..........................................1(一)知识工程概念探讨...........................................1(二)知识工程发展历程...........................................3(三)知识工程落地实践的关键要素.................................5二、构筑知识工程工具链............................................7(一)知识采集与抽取.............................................8(二)知识处理与加工.............................................9(三)知识存储与计算............................................10三、完善知识管理体系.............................................11(一)知识资产管理战略..........................................12(二)知识资产管理制度..........................................13(三)知识资产盘点..............................................14(四)知识资产运营..............................................15四、知识服务及应用赋能...........................................16(一)面向机构员工的知识服务....................................16(二)面向大模型的知识供给......................................18(三)面向行业场景的创新应用....................................19五、知识工程的落地路线...........................................20(一)明确建设目标与业务驱动力..................................20(二)体系化推进知识工程能力建设................................21(三)科学合理的评估知识能力建设成果............................23六、人工智能时代知识工程的发展趋势及展望.........................25附件:企业知识能力建设及应用案例.................................27 图目录图1 DIKW模型概览.................................................1图2知识能力发展的三个阶段.......................................3图3知识管理及应用过程中的痛点...................................5图4知识工程能力框架.............................................6图5人工智能时代知识工程工具链...................................7图6人工智能时代的知识管理体系..................................12图7知识服务类型分布统计........................................17图8知识工程能力成熟度模型标准框架..............................24表目录表1各行业知识的来源情况示例.....................................8表2知识存储的形式及特点........................................11表3行业场景的知识应用赋能案例..................................20表4知识工程技术工具标准介绍....................................24 1一、知识工程发展情况概述(一)知识工程概念探讨知识是通过学习、研究、实践获得的事实、原理、经验、技能的集合,是支撑决策、指导行动、驱动创新的基础。对机构知识能力建设的系统性研究可追溯至英国信息学家泽勒(Zeleny)于1987年提出的“数据-信息-知识-智慧”(DIKW)模型,其中将知识定义为对信息的解释和理解,是经过验证的、可应用的见解和经验,是机构无形资产的重要组成部分。图1DIKW模型概览目前,许多观点将知识同数据混用,而二者并不应混淆,相较于数据和信息而言,总体来说知识具备如下四大特性,机构在对知识进行管理、运营及应用的过程中应重视这些差异:稳定性:虽然知识也会时间的推移逐步更新,但仍相对稳定,因此具备积累的必要性。关联性:知识不是孤立产生的,通常会相互关联、相互影响,随时间的推移共同演进。实践性:知识来自于实践,可通过较为直接的方式赋能决策、 指导实践,并可通过实践验证。价值性:知识传播复用的成本较低,具备较高的价值密度。数字经济时代,各机构产生的数据和获取的信息呈现出爆炸式增长的态势,如何从这些数据和信息中甄别、获取知识,对知识进行安全高效的运营管理,并面向机构业务人员或人工智能应用提供知识服务是机构实现数智化转型的关键一环。随着发展新质生产力连续多年被写入政府工作报告,知识的重要性愈发凸显,高质量的知识供给能为科技创新提供理论支撑,助力突破核心技术瓶颈,推动传统产业改造升级,知识已成为新质生产力发展的重要源泉。随着以DeepSeek为代表的国产大模型快速发展,大模型对产业的赋能持续深化。行业大模型的应用落地须依托高质量的语料资源及检索增强生成(RAG)知识库的建设,对机构的知识供给能力提出了更高的要求。知识工程是机构知识能力的集合,通过整合、存储和管理机构内外的各类知识资源,实现知识的高效共享,赋能机构的智能决策和大模型应用落地。技术能力层面,知识工程通过自然语言处理(NLP)、机器学习、知识挖掘等手段,提供知识采集、分类、检索、分析、推荐等能力,实现对知识的处理、加工及应用;知识管理层面,知识工程整合内外部知识资源,依托知识管理体系,实现知识的整合与运营管理,为机构提供丰富的知识供给;知识服务层面,知识工程提供知识共享与协作、知识检索、推荐、问答等能力,赋能机构经营决策,并面向大模型建设运营方提供语料资源及RAG等 2 人工智能知识工程指南(1.0)3(二)知识工程发展历程知识工程的起源可追溯至传统的知识管理系统,发展历程可以图2知识工程发展的三个阶段计算机时代:在计算机时代,机构主要依托文件系统为政府机构及大型机构的档案管理部门提供知识服务。这一阶段的核心目标是实现知识的数字化存储和检索,解决纸质档案管理效率低下的问题。技术手段以数据库和文档管理系统为主,如早期的电子目录、文件索引等。核心能力包括知识的存储、查阅、检索和共享,但知识仍以静态形式存在,缺乏深度分析和关联。由于技术限制,企业知识能力更多是被动响应需求,而非主动赋能业务。这一阶段奠定了知识数字化的基础,但尚未形成系统化的知识开发利用方法论。 能力的支持。划分为三个阶段。 4信息化时代:随着信息化时代互联网及数字化办公技术的发展,机构的知识体量和价值进一步增长,一些知识密集型行业,如医疗、司法、教育、互联网、金融等,逐步开展了知识工程的实践。这一阶段的核心变革是知识图谱技术的引入,实现了从文件管理到知识关联分析的跃迁。通过NPL及机器学习等技术,可实现知识抽取、加工、挖掘和分析等能力,进一步挖掘知识的价值。例如,医疗领域通过知识图谱关联疾病、药品和诊疗方案,司法系统利用案例库辅助判决。这一阶段的局限性在于知识的挖掘工作依赖于专业人员参与,智能化程度有限,但为后续大模型时代的知识工程奠定了基础。大模型时代:大模型技术的快速发展推动了各行业加速开展知识工程能力建设,其核心目标是为各行业提供大模型增强的知识服务,同时为大模型训推提供语料供给及RAG支持,赋能AI原生应用。借助大模型技术,机构能够更深入地挖掘知识的内在关联和规律,为机构提供更加精准化、智能化的决策支持。同时,大模型技术还使得各类知识服务具备了更强的自然语言处理能力,能够更准确地理解和回应用户的知识需求。例如,机构可通过知识工程面向各业务领域的员工提供个性化的知识问答、智能搜索、智能写作等服务,并抽取知识用于大模型的训练及推理。这一阶段的特点是知识服务的智能化和场景化,知识服务的对象也由服务于机构员工逐步向服务大模型等智能算法转变。 5(三)知识工程落地实践的关键要素随着大模型的行业落地持续推进,各行业头部机构纷纷着手开展语料库、RAG平台、高质量数据集等能力建设,对行业知识、领域知识、业务知识的需求也逐步提升。然而各方在相关领域普遍缺乏技术积累和管理经验,存在着诸多痛点难点。一是知识获取难,企业的隐性知识多且分散,需资深从业者传授,难以系统化获取;二是知识加工难,企业知识多为非结构化,质量