生成式人工智能 智能 2025 专利布局 目录 关于Questel....................................................................................................................................3 执行摘要......................................................................................................................4 I. 介绍............................................................................................................................... 6 II.方法论............................................................................................................................................. 81. 数据来源 & 搜索策略................................................................................. 82. 分类法....................................................................................................... 9III.深度学习全球专利格局........................................................10 IV. 聚焦多模态AI / 数字人类 / 智能代理....141. 简介..............................................................................................................................142. 多模态人工智能...........................................................................................................................153. 智能体.................................................................................................................174. 数字人........................................................................................................................185. 生成式人工智能............................................................................................................................. 20附录.......................................................................................................................................22 关于Questel Questel是面向20000多家客户和150万用户的真实端到端知识产权解决方案提供商,覆盖30个国家。我们提供一套全面的软件,用于搜索、分析和管理发明和知识产权资产。 Questel 还提供贯穿整个知识产权生命周期的服务,包括先例检索、专利申请文件撰写、国际申请、翻译和续展。这些解决方案,与我们的知识产权成本管理平台相结合,为客户在整个申请预算中节省平均 30-60%。 Questel的使命是让创新以高效、安全、可持续的方式得到发展。在该使命背后,Questel认为企业社会责任(CSR)是一场鼓励企业对其活动对客户、员工、社区和环境产生的影响负责的广泛运动。欲了解更多关于Questel的信息,请访问:www.questel.com 更多内容可在网上获取,请咨询:www.questel.com/resources-hub/ 执行摘要 深度学习持续成为技术创新中最具活力的领域之一,专利活动显示出持续加速的增长。基于我们对深度学习和大型语言模型的前期研究,本报告通过专利申请分析了下一波创新浪潮,重点关注多模态人工智能、智能代理和数字人。这三个领域正在快速兴起,并日益融合,朝着更加自主、交互和以人为本的人工智能系统发展。 专利格局显示,少数全球科技领导者通过将基础模型、自主能力和类人界面结合为连贯的创新战略,正在塑造这一转型。 谷歌通过其Gemini系列模型将自己定位为核心技术领导者。作为原生多模态设计,Gemini集成了文本、视觉、音频和视频,同时逐步嵌入代理推理能力。谷歌的专利策略反映了其对国际保护的强烈重视,支持其部署多模态和基于代理的AI在全球范围内在搜索、云服务和生产力工具上的雄心。 百度作为垂直整合度最高的参与者脱颖而出。凭借 ERNIE 多模态引擎、GenFlow 和 AgentBuilder用于智能体,以及快速扩张的数字人技术组合,百度在一个统一的堆栈中覆盖了所有三个领域。其专利领导地位,特别是在数量上,突显了一种以大规模部署为中心的策略。 . 英伟达主导了数字人领域。虽然它不将自己定位为通用人工智能助手提供商,但英伟达提供了实现具身人工智能所必需的基础设施、平台和工具链。其Omniverse和Avatar Cloud Engine技术支持高度逼真的数字人和多模态交互,并拥有非常强大的国际专利组合。 微软采用以企业为中心的方法,将多模态人工智能和智能代理直接连接到业务工作流程。利用其与OpenAI 的合作以及自己的代理框架,微软将 Copilot 跨 Office 集成 云和企业软件。其专利申请显示了一种均衡的战略,结合了稳固的产品组合规模和高比例的国际家族,反映了在专业和企业人工智能领域的全球雄心。 . 国际商业机器公司(IBM)成为智能代理领域的核心领导者,其watsonx.ai平台和Granite基础模型家族提供支持。IBM的战略专注于专业和企业级AI系统。虽然在其面向消费者的应用中不那么显眼,但IBM强大的专利地位证实了其作为企业环境中基于代理的AI基石角色。 一、引言 深度学习是人工智能的核心技术层,基于能够从大型数据集中学习层次化表示并擅长图像识别、语音识别和自然语言处理等感知任务的多层人工神经网络。在这一技术层中,生成式人工智能(GenAI)于2016年左右兴起,作为一个专注于使用VAEs、GANs、扩散模型、Transformer等技术创建新内容文本、图像、视频、音频、代码或合成数据的分支,尤其是大型语言模型(LLMs)。LLMs是基于Transformer的系统,在大量语料库上进行训练以理解、生成和操作自然语言,具备推理、摘要、翻译和对话交互等能力。 与这些基础人工智能层次不同,几个领域已发展成为构建于其上的应用: •多模态AI指的是能够在多种模态或数据类型(文本、图像、音频、视频、传感器数据等)之间处理、理解和生成信息的系统。通过整合并推理不同形式的输入,这些系统产生统一的理解,并能生成连贯 跨越模态的输出(例如,带说明文字的图像、有声视频或同步的音频视频响应)。这种多模态能力比单模态人工智能更能实现更丰富的感知、更自然的人机交互以及更灵活的内容生成。 •智能体是自主或半自主的AI系统,通过传感器(这些传感器可以包括视觉、音频或其他传感器数据)感知其环境,根据给定的目标做出决策,并采取行动以实现特定目标。基于深度学习、多模态理解以及生成或推理能力,这些智能体可以独立运行、从经验中学习、与人类和其他智能体交互,并适应不断变化的环境。这使得它们适合于任务自动化、规划、人机协作、响应式辅助或自适应决策支持等动态任务。 •最后,数字人是AI驱动的虚拟人类形象,结合计算机图形学、动画、自然语言处理、语音合成和行为AI,创造出能够与真人进行自主或半自主交互的逼真人类化身。得益于多模态AI和生成式技术,数字人可以表现出逼真的外观、声音、表情、手势和行为,从而实现虚拟助手、虚拟培训师、数字演员或医疗保健、教育、娱乐或客户服务中的伴侣系统等应用。 II. 方法论 1. 数据来源 & 搜索策略 本研究中使用的数据源是全球专利数据库搜索工具Orbit Intelligence FamPat。FamPat是一个按简单专利家族组织的全球专利申请和授权专利集合,涵盖全球100多个专利局,包括由Questel提供的22家专利局的可搜索全文。由于每个FamPat记录可能包含许多具有不同日期的单独出版事件,报告使用每个专利家族最早已知的首次申请日期的办公室。这被认为是代表性的专利家族成员,用于指代该专利家族。首次申请办公室(OFF)或优先权是指针对特定发明的首次申请,在任一专利局提交时,该申请即成为“优先申请”,该事件日期定义为优先权日期。首次申请的国家被定义为优先权国家。 报告中所包含的表格和图表使用此优先日期,除非另有说明,因为它提供了最能反映发明活动的最准确指示。专利来源的定义,即专利家族的来源地,是基于首次申请办公室(OFF)。需要注意的是,此定义并不完全准确;尽管如此,它提供了一种有用且公平的方法来确定实体的通常首次申请国,这通常与其 home 专利局一致。 每个专利家族都与一个或多个实体相关联,这些实体统称为专利权人。在相同家族内的专利由多个权人持有时,该家族归属于所有相关实体。为了提高可读性并提供清晰概述,本文中提到的各种申请人已被系统地清理和整合到其各自母公司下。子公司和关联实体被归类到其母组织下,以反映统一的所有权结构。此分组过程结合使用自动化方法(通过Orbit Intelligence数据库)和手动方法进行。此分组是基于报告创建时可获得的公开信息最佳情况进行的。 2. 分类学 这项专利布局聚焦于深度学习(DL),特别关注三个快速兴起的应用领域:多模态人工智能、数字人类和智能代理。其检索方法结合了多种策略,利用深度学习相关关键词、相关技术和相关专利分类(如 G06N 3/02(基于神经网络模型的计算机系统)),以确保检索结果在全面性和精确性之间达到最佳平衡,采用布尔逻辑和迭代优化,从而构建了一个用于分析的稳健可靠的数据库。 尽管专利并非总是明确描述这些应用,但审查那些明确描述的应用可以深入了解这些技术是如何被实施和保护的。这种方法提供了一种独特且基于技术的视角,可以补充企业沟通或营销叙述,而企业沟通或营销叙述通常只强调最明显或最热门的使用案例。 为丰富分析,我们回顾了特定领域的文献,以识别和分类多模态人工智能、数字人和智能代理的最相关应用。这使我们能够突出它们在各个行业和用例中的潜力,为这些快速发展的技术领域提供可行的见解。这些应用的详细列表及其描述在本报告末尾的附录中提供。 III.深度学习全球专利布局 爆炸式增长:深度学习热潮持续! 数据显示深度学习和生成式人工智能革命经历了三个主要阶段: .2011–2016:深度学习革命:表征学习、卷积和循环神经网络的突破,以及GPU加速训练,将深度学习确立为