您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[斯坦福大学]:全球人工智能实力排行榜 - 发现报告

全球人工智能实力排行榜

全球人工智能实力排行榜

Loredana Fattorini Nestor Maslej Raymond Perrault Vanessa Parli John Etchemendy Yoav Shoham 卡特里娜 · 利吉特 AI 索引项目 斯坦福大学以人为中心的人工智能研究所 摘要 这篇论文介绍了全球人工智能活力工具(GVT)的最新版本,这是一个交互式的可视化套件,旨在使用42项指标(分为8个支柱)比较36个国家的人工智能活力。该工具提供了可定制的功能,允许用户进行深入的国家层面比较和人工智能相关指标的时间序列分析,所有这些都基于公开可用的数据。通过提供对各国在人工智能领域进展的透明评估,它满足了政策制定者、行业领袖、研究人员以及普通公众的不同需求。利用AI指数专家小组为指标和支柱开发的权重,并将其组合成一个指数,全球人工智能活力排名2023版将美国置于首位,领先优势显著,其次是中国和英国。该排名还突出了如新加坡等较小国家在绝对值和人均基础上的上升趋势。该工具提供了三个子指数,从不同维度评估全球人工智能活力:创新指数、经济竞争力指数以及政策、治理与公众参与指数。 1 介绍 这篇论文介绍了全球人工智能活力工具(GVT)的最新版本,这是一个综合性的公共时间序列数据集合和一系列交互式可视化工具,允许对36个国家在42个人工智能相关指标上的数据进行比较。此次更新扩展了先前版本的内容,涵盖了更多的国家和地区以及更多的指标。它现在包含最广泛的人工智能特定指标之一。1可获取地,该工具综合评估了从2017年至2023年各国家的人工智能活动。重新设计的工具提升了用户体验,具备直观导航、自定义可视化展示和下载选项。此外,该工具通过全球和国家人工智能活力排名部分中用户可定制的指标指数,提供了详细的和细腻的国家对比分析。新的GVT还对选定国家的特定指标随时间的变化进行了深入分析。 AI指标随时间变化部分。此次新推出的内容引入了additional AI vibrancy子指数,包括创新指数、经济竞争力指数以及政策、治理与公众参与指数。 在人工智能快速发展的时代,各类利益相关方都需要可靠的指标来衡量国家在人工智能发展方面的进步。政策制定者需要这些指标来构建人工智能能力,通过识别有效的政策、必要的研究与开发投资以及理解人工智能的地缘政治影响来实现这一目标。行业领导者寻求投资和战略上的见解,旨在了解哪些国家正在成为人工智能的中心,并确定资源应分配到何处。此外,普通公众也可能对了解其国家在人工智能活动中的表现感兴趣,并希望了解哪些国家在人工智能领域处于领先地位。 现有的AI国家跟踪工具往往侧重于狭窄的方面,如投资水平或出版数量,并可能包括更广泛的、未必特定于AI的指标,例如互联网用户的比例或STEM毕业生的数量。尽管这些指标对于理解技术及教育基础设施具有价值,但它们可能无法直接衡量一个国家在AI方面的进步和能力。GVT通过提供一个综合且互动的分析平台来弥补这一差距,该平台将各种AI进展指标整合到一个用户友好的界面中,从而促进AI领域的更大透明度、问责制和知识共享。GVT的设计涉及有战略性的选择指标并将其组织成支柱和总体指数,以减少AI指标的复杂性。用户还可以调整指标和支柱的权重以反映自己的视角。GVT将不断进化,未来版本可能会纳入新的指标。 并且扩大国家覆盖范围。这些变化将确保该工具继续成为现在和未来追踪全球AI进展的相关且有价值的资源。 该工具包含了一套默认权重,这些权重是在与一组专家咨询后确定的。利用这些权重,美国自2018年以来一直稳居全球AI活力榜首,显著领先于其他国家,并在大多数维度上表现出色,特别是在研发、基础设施和经济方面。中国和英国紧随其后,其中中国在研发和基础设施方面表现强劲,而英国则在教育以及政策和治理方面处于领先地位。值得注意的是,当根据人均调整指标时,一些较小的国家如新加坡在排名中脱颖而出,成为领导者。这些全球排名展示了各国为促进AI发展所采取的多样化策略,无论是大国还是小国都在取得显著进展。本文其余部分组织如下:相关工作我们回顾的部分 与 AI 指标和比较相关的现有文献和工具。概念框架部分概述了该工具的关键概念。Methodology该部分详细描述了数据收集的过程、AI活力指数的构建以及在工具中的实施。随后是一部分提供了该工具的概览。国家排名结果.Finally, theConclusion提供了贡献的摘要 , 并提出了未来改进的方向。 2 相关工作 Composite 指标的发展和完善涉及将多个个体指标综合为一个全面的衡量标准。这一过程借鉴了统计学、经济学和科技评估等多种方法论。值得注意的例子包括联合国于1990年推出的 人类发展指数(HDI)。2], 该指标综合考虑了健康、教育和收入水平,并衡量了性别不平等指数(GII),该指数衡量性别在健康、赋权和劳动力市场参与方面的不平等现象[36] 。作为 AI 景观 继续快速演变,各国AI能力的衡量和比较工具的需求日益明显。 经合组织等人。 [27他们在合成指数创建的研究中已经奠定了重要的基础工作。他们的指导强调了建立一致的理论框架、精心的数据选择与转换以及进行稳健性检验以确保这些指标可靠性的的重要性。类似地,Nardo等人[26讨论选择、标准化、权重分配以及聚合指标可能存在的陷阱。他们强调方法论中的透明度和一致性至关重要,这对于增强综合指数的可解释性和可比性极为重要。 近期对综合指标方法论框架的最新进展在Greco等人进行全面回顾中进行了讨论[21]. 这篇综述突出了由于合成指标在各个研究领域中 popularity 的增加,其在采用和方法学 refinement 方面的发展演变。Greco 等人 [21]特别关注重要的方面,如加权和聚合,这些领域受到了大量批评,并提出了未来研究的方向。他们的工作探讨了在这些指标构建之后进行的稳健性分析,这是一个较少探索但至关重要的阶段,强调了需要采用能够经受审查并提供可靠且可解释结果的稳健方法的重要性。除了基础知识,欧盟委员会的COIN工具用户指南[32] 提供了针对政策分析特别设计的合成指标的实用指导。该指南作为研究人员和政策制定者的重要资源,旨在将这些指标应用于评估和比较不同地区或国家的政策影响。借鉴这些经验教训,全球人工智能活力工具(GVT)采用了这些最佳实践方法。 也建立了一项传统,即创建指数来跟踪不同国家的技术进步。例如,Desai等人开发的技文献部分确保了坚实的概念框架、透明的数据处理以及严格的稳健性检验。更多细节详见附录。Methodology Section. 术成就指数(TAI)。14], 是衡量跨国技术进步的基础框架。TAI 根据多个维度对国家进行评估,包括技术创造、扩散以及人力技能发展。该指数为评估人工智能能力的专业工具奠定了基础。Incekara 等人 [23] 从原始 TAI 开发的 TAI - 16 , 按技术对国家进行分类 Adoption和创新。该指数强调了技术发展动态节奏要求频繁更新评估标准。TAI-16还展示了各国如何适应技术变革并衡量人工智能准备程度。 Archibugi 等人 [10:提供对衡量国家技术能力综合指标的广泛分析。他们的研究回顾了欧洲委员会、世界经济论坛和世界银行等机构开发的各种综合指标,讨论了这些指标的方法论、假设及其结果的一致性。这些作者阐述了这些指标对于公共政策、企业战略和经济研究的重要性,同时也指出了它们使用中固有的挑战和局限性,如潜在的简化倾向以及难以捕捉技术变革的全部复杂性。Shoham [34] 是第一个提出系统地测量和跟踪国家 人工智能在各个维度的进展和影响。 Shoham [34它建议需要构建一个综合国家层面的人工智能技术指数,该指数应包括投资、研究成果和技术成就等因素。提出的这一指数为人工智能指数奠定了基础。25] 倡议。 牛津见解的 AI 就绪指数 [22:评估一个国家在公共服务中使用人工智能的准备程度,考虑的因素包括创新潜力、数据可用性、基础设施和人力资源。此外,AI 准备指数 [12涵盖更广泛的领域,包括技术基础设施、AI研究社区、行业和政府对AI的应用支持。Tortoise Media 的全球AI指数 [13] 根据研究、开发、人才、基础设施和运营环境对国家进行排名。 经合组织人工智能政策观察站是另一个宝贵的资源 [3它提供了全面的国家人工智能战略目录,并深入分析了各国采用的战略优先事项和政策措施。观察室从各个国家收集有关人工智能政策、研究投资及其他相关因素的数据。这些数据有助于评估不同监管环境对人工智能发展的影响。该平台对于跟踪各国的人工智能准备情况至关重要。综上所述,相关文献强调了复合指标在这一领域的重要性。 提供对诸如AI发展等复杂现象进行结构化和量化的评估。然而,它也警告不要过分简化,并强调了不断改进方法论的必要性。这些见解为GVT(全球AI活力衡量体系)的发展提供了指导,旨在提供一个权威且最新的全球AI活力衡量标准。 2.1 与其他 AI 指数和工具的比较 Table1将GVT与其他 prominente AI 指数和工具进行比较,并总结每种工具的独特特征、范围、指标以及目标受众。 新的GVT旨在衡量国家在人工智能领域的进步,并填补了当前人工智能国家活力跟踪领域中的一些空白。不同于政府人工智能准备指数 [Government AI Readiness Index],22], 主要评估公共服务中的人工智能准备情况 , 或人工智能准备指数 [12], 该工具专注 于人工智能 Adoption 的战略领域,并采用多种指标(例如在研发、经济或负责任的人工智能等领域)进行评估,这些指标被组织成不同的支柱,并汇总在一个总体指数之下。这种结构有助于更广泛的分析可能性,并创造一个可以在更广泛的AI社区中更广泛灵活使用的工具。该工具的选择性意味着它能够提供可靠的人工智能相关活动的数据,主要侧重于 在特定的AI相关指标上进行评估,而不是像其他工具(如全球AI指数)那样使用更广泛的科技指标,如“公共研发支出总额”。13]). 此外,GVT 在数据呈现方面表现出色,提供了交互式、可定制且可下载的可视化图表,这有助于提高用户参与度和理解能力。这一功能与其它指数中较为静态的展示方式形成了对比。虽然经合组织人工智能政策观察站[3它富含数据和交互式可视化图表,但缺乏索引或排名系统。此外,GVT 的一个重要差异化因素是其对开放性的承诺:所有数据都是公开的。 用户可以灵活调整支柱和指标的权重。这种灵活性提高了该工具在不同应用场景下的适用性,并允许用户根据自己的视角来判断哪些特定的人工智能支柱(例如研发与政策治理)在评估一个国家的人工智能活力方面最为重要。GVT 设计得更能有效地应对快速变化的人工智能领域,相比静态方法更具优势。 指数。虽然一些工具在特定领域可能具有较强的覆盖能力,但它们往往缺乏此工具提供的灵活性和AI相关的重点。 3 概念性框架 全球人工智能活力工具(GVT)的主要目标是促进各国在人工智能领域的人工智能活力进行跨国比较。人工智能活力可以定义为一个国家内人工智能技术的活动水平、发展程度及其影响。该评估提供了对不同国家在人工智能领域取得进展的全面理解,从而突出各自的强项和潜在改进领域。GVT 通过多个关键维度来捕捉国家层面的人工智能活力,每个维度代表 人工智能发展的一个关键方面。因此,以下维度(以下简称支柱)包括:研发(R&D)、负责任的人工智能、经济、教育、多元化、政策。 治理、公众意见与基础设施。每个支柱均由一组指标代表,这些指标作为代理用于捕捉 underlying concept 的本质含义。 1. 研发(R & D)研发是AI进步的基础,推动了新算法、模型和技术创新的创造,进而促进AI创新。根据Furman等人的研究[17国家创新能力和长期产生并商业化创新技术的能力显著受研发努力的影响。创新产出的衡量标准,如专利活动和期刊发表,是这一能力的关键指标。负责任的 AI 2.构建符合伦理标准的AI系统