行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

OCDE指标对IA能力的陈述

信息技术 2025-06-03 OECD Joken Hu

核心观点

本报告由经济合作与发展组织（OECD）发布，旨在评估和比较人工智能（AI）的进步与人类能力。报告提出了九个衡量AI能力的指标，涵盖语言、社交互动、问题解决、创造力、元认知/批判性思维、知识/学习/记忆、视觉、操作和机器人智能等九个方面。每个指标都采用五级量表进行评估，从低到高分别代表AI能力的不同发展阶段，其中最高级别代表AI能力与人类能力完全相当。

关键数据

报告指出，目前AI技术发展迅速，但其在大多数指标上仍处于较低级别。例如，在语言指标中，大型语言模型（LLM）如ChatGPT已达到3级水平，能够理解和生成可靠的内容，并进行逻辑推理和社会推理，但其在推理、学习和理解语言细微差别方面仍有不足。在社交互动指标中，AI仍缺乏自我意识和社会感知能力，因此只能进行简单的互动。在问题解决指标中，AI在特定领域如物流规划方面表现出色，但在处理开放环境中的复杂问题和进行道德推理方面仍有困难。

研究结论

报告认为，AI的发展将对教育、就业和社会产生重大影响。通过将AI能力与人类能力进行比较，决策者可以更好地评估AI在教育中的应用潜力，并制定相应的政策和措施。例如，AI可以帮助教师进行教学和管理，但同时也需要重新思考教育目标和学生所需技能，以适应AI带来的变化。此外，报告还强调了制定AI伦理规范和监管框架的重要性，以确保AI技术的安全和可靠发展。

介绍经合组织关于人工智能能力的指标介绍经合组织关于人工智能能力的指标本书由经济合作与发展组织秘书长负责出版。此处表达的观点和论点不一定反映经济合作与发展组织成员国的官方立场。本文件，以及与其可能包含的数据和地图，均不损害任何领土的地位、对该领土行使的主权、国际边界和界限的划定，以及任何领土、城市或地区的名称。关于以色列的统计数据由相关以色列当局提供并承担责任。经合组织使用这些数据不影响戈兰高地、东耶路撒冷和约旦河西岸以色列定居点的国际法地位。土耳其共和国备忘录此文档中提及\"塞浦路斯\"的信息涉及该岛的南部。岛上没有单一机构同时代表土耳其裔塞浦路斯人和希腊裔塞浦路斯人。土耳其承认北塞浦路斯土耳其共和国（RTCN）。在联合国框架内未找到持久且公平的解决方案之前，土耳其将保持其关于\"塞浦路斯问题\"的立场。所有欧洲联盟成员国和经合组织成员国的笔记塞浦路斯共和国被联合国所有成员国（除土耳其外）所承认。本文件中包含的信息涉及塞浦路斯共和国政府实际控制区域。请按如下方式引用该著作： OCDE(2025),介绍经合组织关于人工智能能力的指标,经济合作与发展组织出版社,巴黎,https://doi.org/10.1787/d321ba78-fr. ISBN978-92-64-32777-1(印刷版)ISBN978-92-64-82957-2(PDF)ISBN978-92-64-35205-6(HTML) 图片版权：封面©瓦西里耶夫·亚历山大/Shutterstock.com. https://www.oecd.org/fr/publications/support/corrigenda.html.经济合作与发展组织的出版物勘误表可在以下网址获得： ©OECD2025 知识共享署名4.0国际许可协议(CCBY4.0) 本作品根据知识共享署名4.0国际许可协议发布。使用本作品，即表示您接受此协议条款的约束（https://creativecommons.org/licenses/by/4.0/).归因–你必须引用作品。翻译–你必须引用原始作品，指明对原始作品所做的修改，并添加以下文字：如果原作和译文之间存在分歧，仅原作的文本将被视为有效。适应–你必须引用原始作品并添加以下文本：这是对经合组织（OECD）一项原创作品的改编。本改编中表述的观点和使用论点不应被视为代表经合组织及其成员国官方立场。来自第三方的內容–本许可不适用于可能被纳入作品的第三方内容。如果您使用此类内容，获取第三方授权的责任在于您，且在发生侵权指控时您将承担相应责任。未经特别许可，您不得使用经合组织的标志、视觉标识或封面图像，也不得暗示经合组织认可您使用该作品。根据2012年常设仲裁法院仲裁规则（CPA仲裁规则）进行仲裁解决由此许可产生的任何争议。仲裁地点为巴黎（法国）。仲裁员人数为一名。前言人工智能的进步及其对社会的后果尚未得到充分理解。在教育领域，人们就人工智能能够如何转变教育供给展开了激烈讨论，但对它是如何改变学习规则，使学生在有效弥补人工智能能力方面取得进步了解甚少。如果希望公共政策制定不仅仅是针对市场上出现的新的人工智能工具而对课程和教学系统进行适应性调整，就必须积极努力地预见这些能力的演变。这正是本报告中阐述的方法论的目的。该方法提供了一系列对应人类能力主要维度的指标，每个指标都描述了人工智能向与人类完美相当发展演变的进程。这些指标涵盖以下要素：语言、社交互动、问题解决、创造力、元认知、知识/学习/记忆、视觉、操作和机器人智能。它们以五级量表形式呈现，最顶端的等级代表对人工智能系统最具挑战性的能力。这种基于人类心理学的方法为人工智能的演变提供了结构化和高层次的视角。将人工智能的能力与人类技能相结合，使决策者能够评估人工智能在教学中可能发挥的作用。例如，人工智能在多大程度上能够复制教师工作中体现的社会技能，因此它可以在哪些任务中替代或补充教师？当人工智能的能力再进一步发展时，会产生哪些影响？这些指标将使部长们能够讨论人工智能对未来教育的影响，从课程设计到教学方式，再到空间、时间、人力、技术和人际关系的配置，以创造一个能够帮助学习者面向未来而非过去的环境。除了教学之外，指标还提供了一个框架，使部长能够讨论人工智能对其他领域的影响：就业、公民参与、休闲和日常生活。在所有这些领域，公共政策都必须采取面向未来的愿景，而不是基于过去。安德里亚斯·施莱歇尔，经合组织教育技能司司长致谢本报告由经合组织人工智能与未来技能项目团队规划并撰写：斯图尔特·艾略特（项目负责人）、阿贝尔·巴拉特、希维·钱德拉、马克·富斯特-拉巴利亚、布莱安娜·耶斯梅、玛格丽塔·卡拉莫娃、奥蕾莉亚·马西乌特yte、山姆·米切尔、诺拉·雷瓦伊、吉安卢卡·里斯、米拉·斯坦耶娃及蔡诗曼。若没有那些支持项目的著名计算机科学家和心理学家的宝贵贡献，我们的编写工作将不可能完成。我们首先向制定经合组织关于人工智能能力的首批指标的专家表示感谢（按字母顺序）：AnaTeresaAntunes、JoanaBrito、ReginadeBritoDuarte、Kexin-JiangChen、AnthonyG.Cohn、HenriqueCorreiadaFonseca、HaohuaDong、NicholasC.Georgiou、MiguelFaria、AntónioM.Fernandes、RobertB.Fisher、KennethD.Forbus、GiorgioFranceschelli、JonathanFrancis、ArthurC.Graesser、YvetteGraham、JoséHernández-Orallo、CherieHo、RyotaKanai、PatrickKyllonen、ChristianLebiere、InêsLobo、ChristopherLochhead、RebeccaMartin、ElenaR.Messina、MircoMusolesi、JeanOh、AnaPaiva、RuiPrada、RebeccaRamnauth、SwenRibeiro、BrianScassellati和AnaVilaçaCarrasco。我们随后感谢就指标制定提出意见或建议的专家（按字母顺序）：菲利普·L·阿克曼、约翰·安德森、吉约姆·阿夫林、埃娃·L·贝克、钱德拉·巴赫加瓦图拉、奥利弗·博恩、阿德里安·杜里格、安杰洛·坎戈佐西、露西·奇克、埃马纽埃尔·谢尔马、汉斯·I·克里斯滕森、迈克尔·科恩、欧内斯特·戴维斯、查尔斯·法德尔、丹·古特弗里恩德、大卫·霍格、乔纳森·格拉奇、山姆·约翰逊、齐德·库特巴利、诺米·勒·多内、乔尔·利博、玛莎·刘易斯、马蒂亚斯·米歇尔、哈罗德·F·奥尼尔、布里塔·吕施霍夫、乌特·施密德、埃里克·施维茨盖贝尔、洛丽·谢帕德、平野忠仁、马克奥·泰西奇、大卫·特拉姆、迈克尔·维特罗克和山崎博志。我们谨向教学研究与创新发展中心（CERI）的同事表示感谢。CERI主任埃德蒙·米松（EdmundMisson）和IMEPdivision副主任斯蒂芬·文森特-兰克兰（StéphanVincent-Lancrin）在整个过程中指导和监督了工作，并提供了宝贵的建议。该项目及团队在很大程度上得益于前部门主管蒂亚·卢科拉的热心支持、深思熟虑的领导力和建议。在她英年早逝之前，她的远见和投入对项目的推进和成功发挥了决定性作用。我们怀着深深的感激和钦佩之情纪念这位为这项工作留下了持久印记的人。教育技能司及对外关系与公共司的通信团队成员参与了报告的格式制定和准备工作。我们向MarkFoss表示感谢，他的内容修改和形式修改使报告的阅读一致且清晰。我们感谢CERI指导委员会在整个项目期间给予的鼓励和支持。这项出版物有助于经合组织关于工作、创新、生产力和技能的人工智能计划（AI-WIPS），该计划旨在为决策者提供新的证据数据和分析，使他们能够及时了解能力和人工智能（AI）的快速发展及其对劳动力市场的影响。目标也是帮助确保人工智能在劳动力市场的采纳是有效的、以所有人的利益为中心、以人为本且为全体民众所接受。该AI-WIPS计划由德国联邦劳工与社会保障部支持，将补充德国人工智能观察站的工作，该观察站隶属于该部数字、劳动与社会政策实验室。欲了解更多信息，请参阅https://oecd.ai/workinnovation-productivity-skillsethttps://denkfabrik-bmas.de/. 目录前言3 致谢4 简历8 参考文献10 1人工智能当前能力概述11 功能对比表当前人工智能能力当前评估评论参考文献12 14 17 设计人工智能能力评估框架18 人工智能已经取得了如此大的进步，以至于它的能力超出了我们的19 理解20 方法论：一种创新且独特的方法指标的设计与制定22 局限性24 下一步骤25 指标在人工智能能力中的作用26 参考文献28 3经合组织关于人工智能能力的指标29 语言尺度30 社交互动尺度32 问题解决的尺度34 创造力尺度36 元认知和批判性思维量表38 知识、学习和记忆的尺度40 视野范围42 操控规模44 机器人智能等级46 参考文献48 4公众使用AI能力指标之实例 49 与专业人才需求相关的指标地图绘制教育中的转型变革结论50 53 55 图表图4.1教学任务要求相关的语言、问题解决和社会互动指标地图51 图4.2.分析人工智能日益增强的能力对教学的影响的框架54 表格表1.1.当前人工智能能力水平概览13 Tableau3.1.人工智能语言尺度31 Tableau3.2.人工智能的社会互动尺度33 Tableau3.3人工智能问题解决分辨率尺度35 Tableau3.4.人工智能创造力量表37 Tableau3.5.人工智能的元认知和批判性思维量表39 Tableau3.6.人工智能的认知、学习与记忆尺度41 Tableau3.7.人工智能视野尺度43 Tableau3.8.人工智能操作比例尺45 Tableau3.9.人工智能机器人智能等级47 ENCADRÉS 四.1人工智能协助处理疫情的情景，处于问题解决规模的中等程度52 简历随着2022年11月ChatGPT的推出，人工智能（AI）的潜在后果1人类活动已经占据了集体想象。然而，如果人工智能快速发展，公众对其影响的理解并没有跟上。为了理解人工智能如何可能改变人类活动，还有许多工作要做。本报告描述了经合组织为评估人工智能系统能力而制定的新指标。这些指标旨在为决策者提供一个客观的框架，使其能够理解人工智能的能力并将其与人类能力进行比较。历时五年制定，这些指标依托于一个广泛的涵盖人工智能研究人员、心理学家及其他专家的网络。补充技术报告的章节（经合组织，2025）[1])已由32名专家编写，并由另外25名专家审查。这九个指标涵盖了描述人工智能向与人类完美相当发展的各种人类能力：语言、社交互动、问题解决、创造力、元认知/批判性思维、知识/学习/记忆、视觉、操作和机器人智能。它们以五级量表形式呈现，最高级别对应于人工智能系统最难达到的能力。每个级别都提供了简短描述，说明人工智能系统能够精确且持续完成任务的任务类型。人工智能在每个量表上的表现基于可用数据记录。这些指标以测试版形式在此发布，邀请两大关键利益相关群体提供反馈意见：人工智能研究人员和决策者。研究人员进行的评估工作为指标提供了证据数据，而解读和利用来自量表的资料能力对于阐明公共政策至关重要。其他利益相关群体的反馈意见也受欢迎。经经济合作与发展组织收到其利益相关群体的反馈意见并制定出系统性更新方案后，将发布指标的第一版完整版本。结论 •经济合作与发展组织作为一家负责任的对公众的国际组织，占据着独特的地位。凭借其在比较评估方面的专业知识， 1这里采用经合组织提出的“人工智能系统”术语定义

点击免费查看完整报告

OCDE指标对IA能力的陈述

核心观点

关键数据

研究结论

你可能感兴趣

OCDE关于尽职调查以支持IA责任的指南

OCDE同意的权利和政治对考试：泰国

OCDE对一致性的倾向、态度和分析

新野纺织（002087）涉嫌对高额环境处罚作出虚假陈述

OCDE对2025年就业政策的看法

OCDE对2026年廉洁与反腐败斗争的看法：公正的廉洁与战略

OCDE对2023年数字教育的看法：与数字教育的有效性

OCDE对2025年公司的展望：21世纪我们公司的发展

G20/OCDE关于合并与经济发展过程中资本流动的评估与促进：影响因素及其对公共政治的影响的报告

普华永道中国汽车团队能力陈述 (2019年版)