AI智能总结
专利景观报告 生成人工智能 首次发布 2024 用户可以复制、分发、改编、翻译并公开表演此出版物,包括出于商业目的,无需明确许可,但前提是内容须附有认可世界知识产权组织(WIPO)为来源的声明,并且须清楚标注对原始内容进行了修改。 世界知识产权组织 34, chemin des Colombettes, P. O. Box 18 CH - 1211 Geneva 20, Switzerland 建议引用:世界知识产权组织(WIPO)(2024)。生成式人工智能专利景观报告。日内瓦:世界知识产权组织。https://doi.org/10.34667/tind.49740 ISBN : 978 - 92 - 805 - 3648- 5(打印) ISBN : 978 - 92 - 805 - 3649 - 2(在线) ISSN: 2790 - 7007 (打印) ISSN: 2790 - 7015 (在线) 对于任何衍生作品,请包含以下免责声明:“世界知识产权组织不对原始内容的转换或翻译承担任何责任或义务。” 封面 : Getty Images / Just _ Super , Naeblys 当WIPO发布的内容(如图像、图形、商标或标志)被归因于第三方时,使用此类内容的用户需独自负责获得相应权利持有者的许可。 要查看此许可证的副本 , 请访问 https: / / creativecommons. org / licenses / by / 4.0 任何根据本许可条款无法友好解决的争议应提交仲裁,并根据国际商会国际贸易法委员会(UNCITRAL)当时生效的仲裁规则进行。双方应受任何由此仲裁产生的仲裁裁决的约束,视为对该争议的最终裁决。 该出版物中使用的任何设计ations和内容的呈现均不反映世界知识产权组织(WIPO)对任何国家、领土或区域及其当局的法律地位的意见,也不反映对其边界或边界的划分。 本出版物无意反映成员国或 WIPO 秘书处的观点。 提及特定公司或制造商的产品不意味着这些公司或产品得到了世界知识产权组织(WIPO)的endorsement或推荐,而不提及类似性质的其他公司或产品。 Contents 致谢 5 主要发现和见解 7 导言 13 GenerativeAI - newsystems with alonghistory13本报告的动机16 1 生成 AI : 主要概念 19 背景和历史起源19深度学习20区分一般要求20有哪些 GenAI 模型 ?22什么是 GenAImodes ?23 2 GenAI 的全球专利和研究 33 全球发展33Toppatentowners35发明人的关键位置40Keyfiling 司法管辖区43 3 GenAI 模型的专利趋势 45 全球发展45Toppatentowners46Keylocationsofinventors49 4 GenAI 模式的专利趋势 51 全球发展51Toppatentowners52发明人的关键位置55GenAI 模型和 GenAI 模式之间的联系55 5 GenAI 应用的专利趋势 57 全球趋势57Toppatentowners59Keylocationsofinventors62Connectionbetweencoremodelssandapplications63连接之间的模式和应用程序65 进一步考虑 67 关注 GenAI 的使用67与 GenAI 相关的专利分析的局限性和未来69 附录 71 A.1 方法学专利分析71A.2 专利指标73A.3 相互依赖性模型、模式和应用 74 A.4 专利搜索77A.5 提示82A.6 ScientificpublicationquerywithTheLens86A.7 非专利文献中提到的采矿软件和数据集86A.8 GenAIapplications 的说明 / 示例87 参考文献 105 Acknowledgments 这份生成型人工智能专利景观报告在马科·阿莱曼(IP和创新生态系统部门助理总干事)的指导下,在Alejandro Roca Campaña(创新者知识产权部门高级总监)和Andrew Czajkowski(技术与创新支持部门主任)的领导下,并得到了日本专利局提供的日本工业产权全球信托基金的慷慨财务支持下编制。该报告由技术与创新支持部门专利分析经理Christopher Harrison(IP分析部分)牵头编制。 该报告由技术与创新支持部门专利分析小组的专利分析官员克里斯托弗·哈里森和拉克希米·斯普里耶领导的项目团队编制,团队成员包括埃克逊 Sight 的凯·格兰克、约恩·施普克、卡尔斯·詹克和迈克尔·弗雷内克(均为埃克逊 Sight 的成员)、科学矿工帕特里斯·洛佩兹以及技术与创新支持部门专利分析小组的专利分析官员韩洪、前青年专家亚历山大·贝利安诺夫和克雷格·达席亚。 我们的感谢也送给Ulrike Till(IP和前沿技术部门主任),她审阅了报告并提供了宝贵的建议。最后,我们对由Charlotte Beauchamp(出版与设计部分负责人)领导的WIPO编辑和设计团队表示感谢。 电子邮件 : ip. analystics @ wipo. int 主要发现和见解 OpenAI于2022年11月发布的ChatGPT聊天机器人极大地提升了公众对生成式人工智能(GenAI)的兴趣。许多人士,包括NVIDIA首席执行官黄仁勋,将其形容为GenAI领域的“iPhone时刻”。这是因为OpenAI平台使得所有用户更容易访问高级GenAI程序,尤其是大型语言模型(LLMs)。这些模型已经达到了新的性能水平,展示了各种实际应用的潜力,引发了研究和开发热潮,以及大型企业对GenAI的投资。 这份世界知识产权组织专利景观报告提供了关于生成人工智能(GenAI)领域专利活动和科学出版物的观察,并基于2019年世界知识产权组织人工智能技术趋势出版物。该报告旨在揭示当前的技术发展状况、动态变化以及GenAI技术预期的应用领域。此外,该报告还识别了关键的研究国家、公司和组织。 自 2017 年以来 , GenAI 专利家族和科学出版物大幅增加 过去几年中生成式人工智能(GenAI)的兴起主要受到三个因素的驱动:更强大的计算机、可用的大规模数据集作为训练数据源,以及改进的人工智能/机器学习算法。例如,大型语言模型(LLMs)中的变压器架构等发展显著推动了GenAI的进步。这使得在许多不同领域开发复杂应用成为可能。 生成人工智能(GenAI)技术的进步体现在专利申请活动的显著增加上。在过去10年中,截至2023年,GenAI领域的专利家族数量从2014年的733个增长到超过14,000个。自2017年引入变压器以来,作为GenAI代名词的大语言模型背后的深层神经网络架构,GenAI专利的数量增加了超过800%。同期内,科学出版物的数量更是大幅增加,从2014年的116篇增长到2023年的超过34,000篇。仅在2023年,就发布了超过25%的GenAI专利和超过45%的GenAI科学论文。 GenAI 拥有最多的专利的顶级组织是哪些 ? 5. IBM 腾讯、平安保险集团和百度拥有最多的生成式人工智能(GenAI)专利。腾讯计划在其产品如微信中添加GenAI功能,以提高用户体验。平安保险专注于GenAI模型在承保和风险评估方面的应用。百度是早期进入GenAI领域的公司之一,并最近推出了其最新的基于大语言模型的AI聊天机器人ERNIE 4.0。中国科学院(第四位)是排名前十中唯一的研究机构。阿里巴巴(第六位)和字节跳动(第九位)也是排名前十的其他中国公司。 IBM(第五) , Alphabet / 谷歌(第八) 和微软(10th美国领先的生成式人工智能(GenAI)专利公司包括IBM、Alphabet/谷歌的DeepMind以及微软和OpenAI等。IBM开发了watsonx平台,该平台允许公司部署和定制大型语言模型(LLMs),重点关注数据安全和合规性。Alphabet/谷歌的人工智能部门DeepMind最近发布了其最新的大型语言模型Gemini,并逐步将其整合到Alphabet/谷歌的产品和服务中。微软也是生成式人工智能领域的关键玩家,并且是OpenAI的投资方。OpenAI自身仅近期才提交了其首项生成式人工智能专利。韩国的电子巨头三星电子位列前十,排名第7。 哪些机构在 GenAI 上发表了最多的科学出版物 ? 中国科学院在科学出版物方面明显处于领先地位,自2010年以来发表了超过1100篇论文。清华大学和斯坦福大学分别以超过600篇论文位列第二和第三。 Alphabet/Google(第四位)是前20名中唯一的公司(发表556篇科学论文)。 然而,根据科学出版物影响力通过引用次数来衡量,企业占据主导地位。 Alphabet/Google 是其中最领先的机构,差距明显,另有七家其他公司位列前二十。OpenAI 的案例也值得一提。在我们的生成式人工智能(GenAI)科学出版物语料库中,该公司仅发表了 48 篇文章(325th机构在发表论文的数量上有所增长,但这些论文总共获得了来自其他科学文献的11,816次引用(13th总体) 。 GenAI 技术在哪里发明 ? 1. 中国7. 德国5. 印度6. 联合王国4. 日本2. 美国3. 大韩民国 基于专利上公布的发明人地址,截至2023年,来自中国的发明人负责了超过38,000个专利家族。自2017年起,中国每年在此领域的专利数量超过了所有其他国家的总和。 在美国提交了大约6,300个专利族(2014年至2023年)的情况下,美国是GenAI专利研究的第二大重要地点。亚洲国家韩国、日本和印度也是GenAI研究的关键地点,分别排名全球第五、第四和第三。英国是欧洲领先的地点(全球第六),在同一时期发布了714项专利。然而,德国紧随其后(708个专利族),近年来在GenAI专利数量上超过了英国。这些顶级发明地点占全球与GenAI相关的专利活动的绝大多数(94%)。 哪个 GenAI 模型拥有最多的专利 ? 近年来 , 已经开发了许多 GenAI 程序或模型。最重要的 GenAI 模型包括 : 1. 生成对抗网络 (GAN) 2. 变分自编码器 (VAE) 3. 基于解码器的大型语言模型 (LLM) 然而,根据现有专利摘要、权利要求或标题中的信息,并非所有生成式人工智能(GenAI)专利都能归类到这三种特定核心模型中。 在这些生成式人工智能模型中,大多数专利属于GANs。2014年至2023年间,此类模型共有9700个专利家族,其中仅2023年就发布了2400个专利家族。VAEs和LLMs在专利数量上位列第二和第三,分别有约1800个和1300个新的专利家族在2014年至2023年间获得授权。 在专利增长方面,GAN专利在过去十年中显示出最强的增长势头。然而,这一增长速度近期有所放缓。相比之下,扩散模型和大语言模型(LLMs)在过去三年内的增长速率明显更高,扩散模型的专利家族数量从2020年的18个增加到2023年的441个,而大语言模型的专利家族数量从2020年的53个增加到2023年的881个。由现代聊天机器人如ChatGPT引发的生成人工智能(GenAI)热潮显然增加了对大语言模型的研究兴趣。 GenAI 专利中使用的主要数据类型是什么 ? 主要的 GenAI 数据类型包括 : - 图像 - 视频 - 语音 - 声音 - 音乐 在不同的生成人工智能(GenAI)模式,即数据输入和输出类型中,大多数专利属于图像/视频类别。图像/视频数据对于生成对抗网络(GANs)尤为重要。涉及文本处理、语音/声音/音乐处理的专利是大型语言模型(LLMs)的关键数据类型。剩余的模式,如3D图像模型、化学分子/基因/蛋白质以及代码/软件,目