您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[赛迪]:赛迪译丛2024年第42期(总第668期):2024年人工智能全景报告 - 发现报告

赛迪译丛2024年第42期(总第668期):2024年人工智能全景报告

信息技术2024-12-16-赛迪J***
AI智能总结
查看更多
赛迪译丛2024年第42期(总第668期):2024年人工智能全景报告

2024年人工智能全景报告 【译者按】今年10月,英国风投公司Air Street Capital发布第七版《人工智能全景报告》。人工智能正迅速成为全球经济发展的关键驱动力,系统评估人工智能行业现状和未来趋势尤为重要。报告全面审视了人工智能在研究、产业、政治和安全四方面的最新进展,揭示了包括多模态基础模型突破学科局限、龙头企业与初创企业并行加速发展、人工智能监管立法持续提速、企业关注点从安全主义转向加速发展等重大趋势。同时,报告对未来12个月全球人工智能发展作出了前瞻性预测。赛迪智库未来产业研究中心对该报告进行了编译,期望对我国有关部门有所帮助。 【关键词】人工智能研究产业政治安全预测 人工智能是一个涉及多学科的科学与工程领域。本报告认为,在这个日益数字化、由数据驱动的社会,人工智能将成为推动技术进步的倍增器。本报告围绕以下几方面进行讨论: 研究:技术突破及其能力。 产业:人工智能的商业应用领域及其商业影响。 政治:人工智能的监管、经济影响以及不断演变的人工智能地缘政治。 安全:确定并减轻未来高性能人工智能系统可能带来的灾难性风险。 预测:未来12个月可能会发生的事。 一、概述 (一)研究 前沿实验室的表现趋于一致,但因为规划和推理已成为主要前沿领域,因此OpenAI公司在推出o1大型语言模型后仍保持领先优势。随着多模态研究深入到数学、生物学、基因组学、物理科学和神经科学领域,基础模型展现出了突破语言局限的能力。美国的制裁未能阻止中国的大型语言模型在社会各界排行榜上的飙升。 (二)产业 英伟达(NVIDIA)仍是全球最具实力的公司,跻身市值3万亿美元企业之列。监管机构正在对生成式人工智能领域的权力集中问题展开调查。更为成熟的生成式人工智能企业已实现数十亿美元的营收,初创企业也开始在视频和音频生成等领域崭露头角。尽管这些企业的发展已开始从模型研发迈向产品落地,但有关定价和可持续性的长期问题仍未解决。在公共市场牛市的推动下,人工智能企业的市值达到9万亿美元,同时私营企业的投资也在健康增长。 (三)政治 在全球治理停滞不前背景下,国家和地区层级的人工智能监管却在不断推进,美国和欧盟都通过了相关立法,但这些立法颇具争议。计算需求的实际情况迫使大型科技企业不得不考虑在规模扩张方面面临的现实物理限制以及它们自身的排放目标。与此同时,各国政府在能力建设方面的尝试仍然滞后。人工智能对选举、就业以及一系列其他敏感领域可能产生的影响目前还尚未显现。 (四)安全 企业的关注点正在从安全向加速发展转变,之前还在警告人类即将灭绝的企业,现在却在大力提高销售额,推广消费类应用程序。世界各国政府纷纷效仿英国,构建提升人工智能安全的国 家能力,成立相关机构,研究关键国家基础设施在人工智能方面存在的潜在漏洞。每一项人工智能发起的攻击都以失败告终,但让研究人员更加担忧的却是更为复杂、长期的攻击。 二、研究 (一)OpenAI独霸一方的局面宣告结束,“草莓”(Strawberry)的问世,将在扩展推理计算方面加倍发力 这一年的大部分时间,各项基准测试和社会各界排行榜都显示GPT-4与“其他最优模型”之间存在巨大差距。然而,Claude 3.5Sonnet、Gemini 1.5和Grok 2等模型几乎消除了这一差距,如今各模型的表现开始趋于一致。OpenAI团队显然很早就察觉到了推理计算的潜力,在其他实验室发表有关该技术的论文几周后,OpenAI的o1就问世了。 (二)尽管屡受制裁,中国的大型语言模型仍榜上有名 深度求索、零一万物、智谱和阿里巴巴所研发的模型在大型模型系统机构排行榜上取得了优异名次,尤其在数学和编程方面展现出了令人瞩目的成果。例如,深度求索率先采用多头潜在注意力1等技术,降低推理过程中的内存需求,并且还研发了一种增 强型混合专家(MoE)2架构。零一万物对架构创新关注较少,致力于构建强大的中文数据集,以弥补其在常用数据存储库中相关数据相对匮乏的不足。 (三)中国的开源项目赢得了全球粉丝 为推动国际上的采用和评估,中国的实验室已成为热情的开源贡献者。有几款模型已在个别子领域中崭露头角,成为强有力的竞争者。例如,深度求索的Deepseek-Coder-V2已成为编程任务中最受欢迎的工具之一,具有速度、轻便、准确等优点。阿里巴巴发布Qwen-2系列芯片,其出色的视觉识别技术震撼业界,不仅在极具考验的光学字符识别(OCR)任务中展现出非凡实力,还能深度解析纷繁精妙的艺术作品。 (四)人工智能亦可获得诺贝尔奖 瑞典皇家科学院将诺贝尔奖授予深度学习领域的先驱者,表明人工智能作为一门学科以及加速科学发展的工具,已经发展成熟。 (五)AlphaFold 3:超越蛋白质及其与其他生物分子的相互作用 DeepMind和 同 构 实 验 室 发 布 了AlphaFold 3模 型 , 它 是 AlphaFold 2的后续版,如今已能够模拟小分子药物、脱氧核糖核酸(DNA)、核糖核酸(RNA)以及抗体与蛋白质靶点的相互作用机制。 (六)AlphaProteo:DeepMind公司展示了新的实验生物学能力 DeepMind公司的神秘蛋白质设计团队终于凭借其首个模型AlphaProteo“走出幕后”。这是一个生成式模型,能够设计出亲和力提高3到300倍的亚纳摩尔级蛋白质结合剂。 (七)学习设计人类基因组编辑器的语言模型 之前介绍了如何使用在大量多样的天然蛋白质序列数据集上预先训练的大型语言模型(如ProGen2)来设计与天然蛋白质序列完全不同的功能蛋白质。现在,Profluent在CRISPR-Cas图谱上对ProGen2进行了微调,以生成具有新序列的功能基因组编辑器,且这些编辑器首次被证明可在体外对人类细胞的DNA进行编辑。 (八)人工智能基础模型:通过功能性磁共振成像了解大脑活动 深度学习最初受到神经科学的启发,如今正应用于对大脑本身进行建模。“大脑语言模型”(BrainLM)是一个基于6700小时 人类大脑活动记录构建的基础模型,这些记录是通过功能性磁共振成像生成的,该技术可检测血氧含量的变化。该模型学会了重建被掩盖的时空大脑活动序列,且能够泛化到未见过的数据分布。可通过微调该模型来预测临床变量,例如年龄、神经质程度、创伤后应激障碍(PTSD)以及焦虑症评分等,其效果要优于图卷积模型或长短期记忆网络(LSTM)模型。 (九)各科学领域的基础模型:大气领域 传统的大气模拟方法,如数值天气预报,成本高昂,且无法利用各种稀缺的大气数据模态。但基础模型在这些方面的表现却很好。微软的研究人员创建了基础模型Aurora,能够针对诸多大气预报问题进行预测,比如全球空气污染和高分辨率中期天气模式等问题。它还能通过利用通用的已习得大气动力学表征来适应新任务。 (十)心智的基础模型:重建看到的事物 MindEye2是一种生成式模型,能够将功能性磁共振成像活动映射到丰富的对比语言-图像预训练(CLIP)空间,然后利用经过微调的Stable Diffusion XL模型从该空间重建个体所看到的图像。该模型在自然场景数据集上进行训练,这是一个基于8名受试者构建的功能性磁共振成像数据集,在这些受试者观看来自COCO数据集扫描会话的数百种丰富的自然场景刺激物时(每次 扫描观看时长为3秒),对其大脑反应进行30至40小时的捕捉。 (十一)程序搜索在数学领域获得新发现 结合大型语言模型和进化算法,“趣味搜索”(FunSearch)利用大型语言模型生成和修改程序,并能通过对求解质量打分实现功能进化。趣味搜索通过搜索程序而非直接的解决方案,发现复杂对象或策略的简洁且可解释的表述形式。肖莱认为,这种形式的程序搜索是最有可能解决抽象和推理挑战的途径之一。谷歌DeepMind团队将其应用于极值组合学中的帽集问题以及在线装箱问题。在这两个案例中,趣味搜索都发现了超越人类设计方法的新颖解决方案。 (十二)基础模型能否让大规模训练强化学习智能体变得更容易? 训练强化学习智能体的一大瓶颈是训练数据的短缺。诸如转换已有环境或手动构建环境这类标准方法都需要耗费大量人力,且 无 法 实 现 规 模 化 。 帝 国 理 工 学 院 和 英 属 哥 伦 比 亚 大 学 的OMNI-EPIC项目利用大型语言模型创建了理论上无穷无尽的强化学习任务和环境流,以帮助智能体基于先前学到的技能进一步发展。该系统会生成可执行的Python代码,这些代码能够为每个任务实现模拟环境和奖励函数,且会利用模型评估新任务是否足够新颖和复杂。 (十三)人工智能研究领域的全球力量平衡并未改变,但学 术界有所获益 随着人工智能成为新竞争战场,大型科技企业开始对研发工作的更多细节秘而不宣。自本报告开始发布以来,前沿实验室首次大幅削减成果发表数量,而学术界也参与其中(见图1)。 三、产业 (一)英伟达成为全球最具实力的公司,不断提出更具雄心 的目标 随着用于支持对算力要求极高的生成式人工智能工作负载的硬件需求不断增长,各大实验室都需要依靠英伟达提供的硬件。 其市值在6月达到3万亿美元,成为继微软和苹果之后第三家达到这一里程碑的美国公司。其第二季度财报业绩依然亮眼,地位依然坚不可摧。英伟达已经在其新款Blackwell系列图形处理器上获得了大量预订单,并且正在积极争取政府方面的订单。 (二)老牌竞争对手未能缩小差距 超威半导体和英特尔已经开始投资建设软件生态系统,超威半导体公司已经利用ROCm平台大力向开源各界推广。然而,他们尚未开发出能与英伟达网络解决方案产品组合相媲美的有竞争力的替代方案。超威半导体希望其49亿美元收购服务器制造商ZT系统公司(ZT Systems)的计划能改变这一局面。与此同时,英特尔的硬件销售额出现了下滑。除非出现监管干预、研究范式转变或供应受限等情况,否则英伟达的地位似乎坚不可摧。 (三)购买英伟达的股票要比投资那些与英伟达竞争的初创企业好得多 对自2016年以来对人工智能芯片领域竞争对手投资的60亿美元进行分析和设想,如果投资者当时按当日股价购入等值的英伟达股票,情况会怎样?答案是:若买入英伟达股票,那60亿美元如今价值将是1200亿美元(涨20倍),而投入初创企业如今的价值仅310亿美元(仅涨5倍)。 (四)并非所有人都认为英伟达只会越来越好 有一小部分直言不讳的分析师和评论员并不信服。他们指出图形处理器稀缺状况已有所缓解,目前只有少数几家公司能从人工智能产品中获得可靠营收,而且大型科技企业的基础设施建设规模也不太可能大到足以支撑英伟达目前的估值。市场目前对这些声音置若罔闻,似乎更倾向于认同特斯拉早期投资者詹姆斯·安德森的观点,即英伟达在十年内市值可能达到“数万亿美元”。 (五)但初创企业的收入在哪里?利润又在哪里? 许多从事生成式人工智能的热门初创企业正在以创纪录的、通常是三位数的营收倍数进行融资。虽然这可能表明投资者对未来回报有信心,但这也设定了一个很高的门槛,因为这些企业中的很多目前还没有明确的盈利途径。然而,并非所有的企业都是如此,最大模型提供商的营收已开始增长。OpenAI有望在一年内实现营收增长两倍,但训练、推理及人员成本意味着亏损仍在持续增加。他们并非唯一一家在寻求实现良性经济运作的领军企业。 (六)或许收入和利润两者都不重要:要恢复股价只需要一 种氛围 元宇宙公司通过放弃在元宇宙领域的大量投资,凭借“羊驼”模型大力转向开源人工智能领域,在公共市场引发了令人难以置信的氛围转变。可以说,马克·扎克伯格实际上已成为开源人工智 能救世主,与OpenAI、Anthropic和谷歌DeepMind形成对抗之势。 (七)顶级质量的模型,即OpenAI的o1模型,在价格和延迟方面都有明显溢价 随着模型种类日益丰富,开发者们正在根据工作需求(以及自身预算)选择合适工具。 (八)模型费用持续下降 服务成本曾经一度被认为高得令人望而却步,但如今强大模型的推理服务成本正在下降(见图2)。