2024年AI指数报告
引言
2024年的AI指数报告是迄今为止最全面的一份,涵盖了技术进步、公众感知和地缘政治动态等方面。本年度报告包含大量原创数据,新增了AI训练成本估算、负责任AI分析,并新增了一章探讨AI对科学与医学的影响。
概述
AI指数旨在提供客观、全面的数据,帮助政策制定者、研究人员、企业高管、记者和公众更好地理解人工智能这一复杂领域。该报告被广泛引用,曾在《纽约时报》、彭博社和《卫报》等媒体上出现,并被全球各地的高官引用。
技术进步
- 大型语言模型:2023年新发布的大型语言模型数量翻倍,其中三分之二为开源模型,但最高性能的模型来自拥有封闭系统的行业玩家。
- 基准测试:GPT-4在综合评估语言模型(HELM)基准测试中取得了0.96的平均胜率,MMLU基准测试得分提高了15个百分点。Gemini Ultra成为首个达到人类水平的多模态大模型。
私有投资
尽管全球对AI的投资连续第二年下降,但生成式AI领域的投资激增,几乎增长了八倍,达到252亿美元。
政策制定
- 立法动向:美国通过了创纪录数量的AI相关法规,而全球范围内提及AI的立法文件数量也达到了历史新高。
- 担忧:监管机构和公众对AI生成假新闻和影响选举的担忧日益增加。
公众认知
- 意识提升:公众对AI潜在影响的认识增强,担心程度增加。超过半数的人表示对AI产品和服务感到紧张。
- 美国情况:52%的美国人表示对AI感到担忧,高于2022年的37%。
主要发现
- 任务表现:AI在某些任务上超越人类,但在复杂任务如数学竞赛、视觉常识推理和规划方面仍落后。
- 研究主导:2023年,行业继续主导前沿AI研究,发布了51个重要机器学习模型,而学术界贡献了15个。
- 高昂的成本:前沿模型的训练成本显著上升,例如OpenAI的GPT-4耗资约7800万美元,Google的Gemini Ultra耗资约1.91亿美元。
- 领导地位:美国依然是顶级AI模型的主要来源,2023年共发布61个顶级AI模型,远超欧盟和中国。
- 缺乏标准化评估:负责AI的评价标准不统一,主要开发者测试模型时使用不同的标准,这使得系统性比较风险和限制变得困难。
- 生产力提升:AI使工人工作效率提高,质量改善,但仍需适当监督以避免负面影响。
- 科学进展:AI加速了科学研究,从算法排序到材料发现等多个领域取得突破。
- 法规增加:美国的AI相关法规数量显著增加,2023年达到25项,比2016年增长了56.3%。
- 全球认知:全球范围内对AI影响的认知增强,担忧情绪上升。
结语
AI正在深刻改变我们的生活,AI指数致力于帮助社会各界更好地理解和应对这一变革。