AI智能总结
2023年10月Air Street Capital 划重点|行业|研究|政策|安全|预测|关于 前言 人工智能(AI)是科学和工程的多学科领域,其目标是创造智能机器。 我们相信,在日益数字化、数据驱动的世界中,人工智能将成为技术进步的力量倍增器。这是因为今天我们周围的一切,从文化到消费品,都是智能的产物。 Air Street已连续第六年发布人工智能现状报告。我们把这份报告视为所见过的最有趣的事情的汇编,目的是引发一场关于人工智能现状及其对未来影响的知情对话。 报告中考虑了以下主要方面: l行业:人工智能的商业应用领域及其商业影响。l研究:技术突破及其能力。l政治:人工智能的监管,其经济影响和人工智能地缘政治的演变。l安全:识别和减轻高性能未来人工智能系统可能给我们带来的灾难性风险。l预测:我们认为未来12个月会发生什么,以及保持我们诚实度的2022年绩效评估。 由Air Street Capital团队制作。腾讯科技(微信公众号:qqtech)进行了整理汉化,内容有删减。关注腾讯科技微信公众号(qqtech),回复“AI2023”可免费获取本报告PDF版。 stateof.ai2023 划重点 行业(第6页-第57页)--随着各国政府、初创公司、大型科技公司和研究人员对GPU的贪婪需求,英伟达迈入了1万亿美元的市值俱乐部。 --出口管制限制了对中国的先进芯片销售,但主要芯片供应商开发出不受出口管制的替代品。--在ChatGPT的带领下,GenAI应用在图像、视频、编码、语音或CoPilot方面都取得了突破性的一年,推动了180亿美元的风险投资和企业投资。 研究(第58页-第115页) --GPT-4落地并展示了专有和次佳开源替代方案之间的能力鸿沟,同时也验证了从人类反馈中强化学习的力量。 --用更小的模型、更好的数据集、更长的上下文来克隆或击败专有模型性能的努力越来越多…由LLaMa-1/2提供支持。--目前还不清楚人类生成的数据可以维持人工智能扩展趋势多久(有人估计,到2025年,大型语言模型将耗尽数据),以及添加合成数据的影响是什么。锁定在企业中的视频和数据可能是下一个目标。--大型语言模型和扩散模型通过为分子生物学和药物发现带来新的突破,继续为生命科学领域提供礼物。 --多模态成为新的前沿,所有参与方的兴奋感大幅增长。政治(第116页-第127页) --全球已经划分出明确的监管阵营,但全球治理的进展仍然缓慢。最大的人工智能实验室正在填补这一真空。 --芯片战争有增无减。 --人工智能预计将影响一系列敏感领域,包括选举和就业,但尚未看到显著影响。安全(第128页-第145页) --生存风险辩论首次成为主流,并显著加剧。 --很多高性能的机型很容易‘越狱’。为了补救RLHF的挑战,研究人员正在探索替代方案,例如自我校准和根据人类偏好进行预训练。--随着能力的提高,对SOTA模型进行一致的评估变得越来越困难。只有共鸣是不够的。 stateof.ai 2023 回顾Air Street 2022年的预测 stateof.ai 2023 划重点|行业|研究|政策|安全|预测|关于 第一章:行业 stateof.ai 2023 划重点|行业|研究|政策|安全|预测|关于 GPU需求刺激英伟达营收井喷,市值进入万亿美元俱乐部 英伟达2023年第二季度营收达到创纪录的103.2亿美元,比第一季度增长141%,比一年前增长171%。尽管该公司2022年营收达到270亿美元,比2021年增长61.4%,但市场对该股曾持悲观态度。英伟达现在的市值为1万亿美元,比10年前的85亿美元高出116倍。 划重点|行业|研究|政策|安全|预测|关于 比Coachella卖得更快:从新贵基础设施提供商手中抢购GPU CoreWeave和Lambda是两家选定的英伟达合作伙伴,负责构建和运行GPU数据中心,它们总共有数万颗GPU。Lambda在其点播云中提供了价值9位数美元的H100s,并在一个多小时内销售一空。CoreWeave是市场上最大的GPU运营商之一。该公司今年年底的建造时间表已经排满,正在签订2024年第一季度的合同。 划重点|行业|研究|政策|安全|预测|关于 私营公司正在支持英伟达GPU,并将其作为竞争优势 划重点|行业|研究|政策|安全|预测|关于 算力是海湾国家的新石油? 据称,沙特阿拉伯阿卜杜拉国王科技大学(Kaust)购买了3000多颗H100s来建造超级计算机ShaheenIII。这台超级计算机将于2023年底投入运行。与此同时,阿联酋马斯达尔市的技术创新研究所开发了Falcon LLM,据说也从英伟达采购计算资源。最后,总部位于阿布扎比的G42与总部位于美国的Cerebras达成协议,购买该公司价值高达9亿美元的晶圆级计算系统,并建造9台互联的人工智能超级计算机。未来可能会有更多的支出…本报告由腾讯科技整理汉化,内容有删减。关注腾讯科技微信公众号(qqtech),回复“AI2023”免费获取PDF版。 划重点|行业|研究|政策|安全|预测|关于 计算指数:英伟达A100集群 自去年以来,大规模英伟达A100 GPU集群的数量一直在增长,特别是特斯拉和Stability,以及HuggingFace的新集群。 划重点|行业|研究|政策|安全|预测|关于 计算指数:英伟达H100集群 现在还为时尚早,但私营和上市公司正在宣布新的H100基础设施,用于大规模模型培训。截至10月中旬,谷歌和Inflection尚未全面发展,我们知道其他公司包括OpenAI、Anthropic、Meta、Character.ai、Adept、Imbue等都有很大的能力。我们预计不久会有更多的产品上线。 划重点|行业|研究|政策|安全|预测|关于 人工智能研究论文中使用的英伟达芯片比所有替代芯片的总和多19倍 在去年的报告中,我们开始跟踪人工智能研究论文中特定半导体的利用情况。我们发现,英伟达芯片被引用的次数远远多于替代品。2023年,英伟达GPU更受欢迎:比FPGAs多31倍,比TPUs多150倍。 划重点|行业|研究|政策|安全|预测|关于 英伟达芯片具有非常长的生命周期价值:从上市到流行达到顶峰需要5年时间 2023年,所有的目光都集中在英伟达新推出的H100 GPU上,它是A100更强大的后继者。虽然H100集群正在建设中(并非没有障碍),但研究人员依赖于V100、A100和RTX3090。英伟达产品的竞争寿命相当惊人:2017年发布的V100目前仍然是人工智能研究中最常用的芯片。这表明,2020年发布的A100可能在2026年达到峰值,而V100可能会达到低谷。因此,新款H100可能会伴随我们直到下一个十年! 划重点|行业|研究|政策|安全|预测|关于 英伟达是王者,但Cerebras在挑战者当中崭露头角 全球最大的人工智能芯片的创造者Cerebras,参与了若干个开源模型训练和数据集创建项目,这帮助它比竞争对手更受研究人员的欢迎。但总体上,英伟达的竞争者还有很长的路要走。 划重点|行业|研究|政策|安全|预测|关于 超大规模企业将提高人工智能支出所占总资本支出的比例 有传闻称,英伟达将在2024年出货150万至200万颗H100,高于今年预计的50万颗。 划重点|行业|研究|政策|安全|预测|关于 特斯拉迈向全球前五大人工智能计算集群 在我们2022年的计算指数中,特斯拉基于其100 GPU计数排名第四。截至2023年夏天,该公司推出了一个新的由1万颗H100组成的集群,成为迄今为止最大的在线集群之一。 stateof.ai 2023 划重点|行业|研究|政策|安全|预测|关于 越来越多的超大规模公司为内部人工智能工作流开发自己的推理硬件 Meta发布了MTIA,这是该公司第一个基于开源RISC-V架构的内部加速器,可以满足基于深度学习的推荐模型的要求。这是由生产中部署的模型不断增长的规模和复杂性以及GPU提供的缓慢推理速度所驱动的。 划重点|行业|研究|政策|安全|预测|关于 英伟达、英特尔和AMD制造向中国出口的非管制芯片 根据英伟达首席财务官的说法,中国过去占英伟达数据中心相关产品营收的20-25%(金融时报)。英伟达(及其竞争对手)开发了低于出口清单阈值的芯片。 ●2022年8月下旬,英伟达的A100和H100—该公司在人工智能应用方面最强大的芯片—被列入美国商务部的出口管制清单。到当年11月,英伟达已经开始宣传A800和H800芯片,其设计低于美国禁令设定的性能阈值。 ●英特尔对他们的Habana Gaudi2芯片的新版本做了类似的调整,AMD也表达了类似的意图。●因此,中国互联网大公司已经订购价值超10亿美元美元的英伟达A800/H800GPU。也有报道称中国的A100/H100GPU流量有所增加,但规模要小得多。 stateof.ai 2023 划重点|行业|研究|政策|安全|预测|关于 在出售给英伟达的交易被阻后,软银旗下的Arm重新在纳斯达克上市 回到2020年,我们预测英伟达将无法完成对Arm的收购。今年9月,Arm在纳斯达克重新上市,开盘时市值达到600亿美元。 ●Arm的知识产权支撑着全球99%的智能手机芯片,该公司正在努力重新定位自己在人工智能市场的角色。它已同自动驾驶汽车公司Cruise和英伟达合作开发了Grace Hopper芯片(其技术在其中扮演了配角)。 ●然而,这不会一帆风顺。该公司营收与上一财年持平,25%来自Arm中国,这是进入中国市场所需的独立子公司。 ●考虑到其巨大的市场份额,Arm可能有潜力提高其每台设备的专利费,但需要与不断增长的开源替代架构(如RISC-V)进行平衡。●由于Arm不销售实物芯片,迄今为止未受任何影响,但无法保证这种情况会持续下去。 划重点|行业|研究|政策|安全|预测|关于 2022年预测:生成式人工智能应用越来越受欢迎 我们在2022年预测:“到2023年9月,生成式音频工具将吸引超过10万名开发人员。”ElevenLabs(英国)和LembleAI(美国)都超过了这个门槛。另一个领域,产品设计,正在见证生成式人工智能技术的快速整合,这有利于像Uizard这样的快速发展的公司。 ●ElevenLabs现在有超过200万注册用户,并且增长迅速。该公司获得第二个百万用户的速度比第一个百万用户快了一倍。用户累计上传了超过10年的音频内容。ElevenLabs最初面向创作者和出版商,现在正在适应来自人工智能代理、伴侣、娱乐和游戏的大量用例。●由人工智能工具驱动的产品设计公司Uizard表示,截至7月23日,该公司录得320万美元的ARR(年度经常性收入),同比增长13倍。该公司4月份的ARR突破了100万美元,3个月内从100万美元增至300万美元。 stateof.ai 2023 划重点|行业|研究|政策|安全|预测|关于 2022年预测:生成式人工智能应用越来越受欢迎 视频也是GenAI快速发展的前沿领域。总部位于伦敦的Synthesia成立于2017年,于2020年推出了人工智能优先的视频创作器。该系统生成多语言化身,该化身制定供消费者和企业等使用的脚本。曾经被认为是“边缘”的Synthesia现在被44%的财富100强企业用于学习和发展、市场营销、销售支持、信息安全和客户服务。自2020年推出以来,这项服务已经产生了超过960万个视频。 划重点|行业|研究|政策|安全|预测|关于 OpenAI的ChatGPT是发展最快的互联网产品之一 横轴为产品推出时间 划重点|行业|研究|政策|安全|预测|关于 OpenAI当前的赚钱能力惊人……但代价是什么? 12个月之前,OpenAI在筹集100亿美元资金时所做的营收预测曾遭到了很多质疑。如今,该公司正在超越其目标。这会持续多久?代价是什么?