AI智能总结
目录 I.执行摘要3II.LAZARD VGB AI INFRA 40列表4III.报告范围和方法6IV.主要市场趋势6V.AI基础设施的分割14VI.附录一:公司简介21VII.附录二:参考资料42 I.执行摘要 我们很高兴介绍拉扎德VGBAI基础设施40名单,该名单展示了我们通过与数百位CEO和投资者的讨论中识别出的一些最令人兴奋的成长阶段AI基础设施公司。 通过我们的研究和公司访谈,出现了4个关键的市场趋势: 重新思考AI时代的堆栈 在AI时代和技术创新背景下,硬件、软件及其相关工具的最佳架构似乎正在发生显著变化。架构可能将日益受到特定AI应用场景(例如,针对边缘计算进行专门优化)和灵活性(对底层芯片及基础模型均保持中立)的驱动。 专注于AI可持续性 快速增长的人工智能训练和推理所需的能源需求正促使对架构能效的关注,并增加了优化能源和人工智能基础设施集成的需求。 隐现数据约束 高质量语言数据的有限供应导致了替代和合成数据源的机会。 自主AI代理人的黎明 副驾代理只是利用大型语言模型(LLMs)为代理提供动力的起点。我们预见在未来12个月内,多代理和自主代理模型可能成为关键主题,展现出新兴的机会。 本报告将AI基础设施视为增长阶段潜在投资的空间。麦肯锡1估计,生成式人工智能(GenAI)及其应用每年可为全球经济增加高达25.6万亿美元的价值。然而,实现这一潜力的关键在于构建必不可少的人工智能基础设施:“基础设施决定命运”,正如OpenAI的一位高管最近所说。2 当前阶段的AI基础设施增长正受到一系列显著短缺的阻碍:硬件(GPU和其他AI芯片)、可持续能源来源、高质量训练数据以及人才。我们相信,包括我们的VGBAIInfra40名单在内的许多公司技术专家正致力于通过创新的方式重新思考硬件、软件、数据和工具堆栈,越来越多地以AI应用场景为引领,包括不断增长的边缘计算需求。 II.LazardVGBAIInfra40列表 我们很高兴介绍VGBAI基础设施40强名单,按照细分市场字母顺序排列。VGBAI基础设施40强公司的详细资料可以在附录中找到。 III.报告范围和方法 自2023年中期发布我们的关于AI商业化和市场进入策略的工作以来(参见此处的报告),拉扎德VGB洞察团队已与堆栈各层的100多家私人AI公司的CEO进行了交流。 本报告专注于我们选定的人工智能基础设施成长阶段公司,并附有一份针对企业级准备情况的补充报告。水平和垂直AI应用将在稍后的日期。 我们的筛选方法可以总结如下: 我们利用了广泛的公开信息、行业报告和数据库,如PitchBook,筛选出了北美和欧洲核心市场的2000多家公司,然后对这些公司进行了详细的研究和访谈。我们仅考虑了被归类为“以AI为中心”的公司,这意味着人工智能功能被评估为核心,是公司本源架构或产品提供的核心部分。我们排除了仅使用单一功能或增强功能的公司。我们未将被视为既有或主导玩家的公司纳入考虑范围,同时也排除了诸如Anthropic或OpenAI等我们认为市场细分正在成熟的基石模型构建者。我们的选择仅限于已知估值低于15亿美元的公司。1234 IV.主要市场趋势 Introduction 自ChatGPT发布以来的18个月中,人工智能时代的巨大潜力以惊人的速度被催化。然而,对于观察者来说,在利用两者的同时区分信号与噪音可能颇具挑战性。 最高级和怀疑主义。事实上,最近的一项调查3专家表示,对于与人工智能相关的公共股票是否处于泡沫状态存在分歧:40%的人说“是”,45%的人说“不是”。 MarcBenioff,Salesforce首席执行官 这可能同时是对的。投资者BillJaneway(最近在我们的伦敦VGBT500会议上发表了主旨演讲)认为,并非 "在一个泡泡内部再出现一个泡泡……这完全前所未见。最好的猜测是,这个[AI泡泡]至少暂时会消散。" 所有泡沫都相似,在“生产性泡沫”中,投机附着于具有真正潜力创造新经济的变革性通用技术。4 JeremyGrantham,GMO 文本框源代码7 然而,潜在的机会大到不容忽视。生成式AI引发了根本性的变化,并代表了一个报告中提到的巨大机会。5至2032年,全球市场机会将达到1.3万亿美元,潜在地增加到总计全球科技支出的12%,可能达到4倍。麦肯锡估计,通用人工智能(GenAI)每年可为全球经济增加高达2.56万亿美元的经济价值,这包括新应用场景和生产力提升的影响。6 尽管仍存在明显的采纳挑战,但根据最近调查的71%的企业高管表示,我们正在看到主要来自于CEO/高管层或指导委员会的“企业主导拉动”对于应用场景的需求显著增加。8 预计到2026年,超过80%的企业将使用GenAI,而2023年不到5%。9 我们的AI基础设施40强名单中的几乎全部公司都拥有付费的旗舰企业客户,通常签订多年期的重复合同并在生产环境中部署。然而,我们通过例外情况包含了少数尚未产生收入的公司。 如我们先前关于AI商业化报告中所概述的,我们注意到风险投资支持的AI公司持续追求通过盈利性的多年战略合作伙伴关系触及广大受众的趋势,这些合作伙伴关系通常伴随着股权投资的支持。 自我们上次报告以来,此类合作的一些近期案例包括亚马逊/Anthropic、Snowflake/Mistral以及Google/HuggingFace的合作。10然而,我们注意到,大型科技企业合作伙伴关系可能因反垄断担忧而面临有限的发展空间。据报道,美国司法部和联邦贸易委员会已同意对Nvidia、OpenAI和Microsoft(包括最近的InflectionAI交易)进行潜在调查的策略。.11 而美国在2023年获得了绝大多数的风投投资,占总投资的70%12,比欧洲多3倍13,我们注意到加拿大(多伦多和滑铁卢)、英国和法国新兴的充满活力的生态系统。 尽管超出了本报告的详细范围,但我们注意到朝着“主权AI”迈进。14为了文化与语言保护、经济发展、人才发展以及网络安全等利益,某些国家可能在未来几年实质性地影响资金环境。 有关AI地缘政治的更多信息,请参阅Lazard地缘政治咨询的2023年10月报告。15 为了满足AI时代即将到来的不断增长的需求,正在构建能源和人工智能基础设施以满足潜在需求。尽管Nvidia已在AI时代的第一阶段(即生成式AI模型运行所需的专门芯片制造)占据了主导市场地位,但我们认为 “数据中心目前价值1万亿美元的设备将不得不被AI芯片取代。 JENSENHOANG,NVIDIA 广泛的人工智能基础设施领域,或称为“工具与铲子”(注:这里可能是指为AI应用提供基础支持和服务的产业),可能代表一个重大投资机遇,预计到2031年其价值将达到3090亿美元。16第二阶段的AI进化很可能涉及众多公司构建专门针对AI的相关基础设施,涵盖软件和硬件领域、AIOps(利用机器学习和大数据自动化IT系统)、MLOps(标准化部署机器学习系统的流程)、数据基础设施等更多方面。 1.重新思考AI时代的堆栈 人工智能基础设施堆栈将与历史数据中心、云和软件基础设施有显著不同,这归因于AI工作负载的许多独特特性和需求。目前,训练占据了计算需求的主要部分,但随着市场需求规模扩大,高效实时推理和低延迟可能变得同样关键。 尽管从CPU转向AI芯片(包括GPU、ASIC和TPU)显著提高了AI工作负载的效率,但仍存在进一步优化、创新以及重新思考硬件/软件集成需求的空间。 在高峰时段,大部分GPU被闲置。提高有效GPU部署效率预计将成为2024年至2025年间的关键问题。17“令人震惊的是,高达74%的公司对当前的工作排程工具感到不满,并且经常面临资源分配限制,而有限的按需和自助访问GPU计算资源阻碍了生产力的提升。”18 为了优化GPU使用,互连技术以及高带宽内存(HBM)等架构创新成为了AI堆栈的关键组成部分: AyarLabs'光学输入输出(I/O)解决方案旨在解决人工智能系统中的数据移动瓶颈,从而实现更高的带宽和更低的延迟,并提高能效。"随着光学I/O成为满足新兴技术如生成式AI等指数级增长、数据密集型需求的必备构建模块,我们正处于高性能计算新时代的门槛上。"19 同时天体AI的光子结构互连解决了“内存墙”20通过旨在使带宽直接传递到芯片内的计算点。 CornelisNetworks提供了一站式高性能互连解决方案,采用专有的扩展架构,集成基于遥测的自适应路由、低延迟拥塞控制以及大规模超大规模提供商、云AI和本地AI/HPC环境中的消息模型、内存模型和AI优化的增强支持。 在硬件/硅片层面,新进和专业化玩家也可能面临巨大的机遇,考虑到市场需求潜力,以及鉴于Nvidia预估80%市场份额的主导地位,存在多样化供应链的可能性。21以及潜在的未来供应链约束。22 “许多公司增长的瓶颈很快不是客户需求,而是从Nvidia获得最新的GPU。 SEUOIA SiPearl旨在提供一款高性能、低功耗微处理器,适用于高性能计算(HPC)和人工智能工作负载,集成三星的HBM解决方案,通过降低热阻来提高处理速度,而非单纯增加GPU,以提升性能。23 边缘加速将需要一系列准备就绪的AI和能效优化解决方案,无论是在汽车、国防还是企业领域,我们已经观察到这些领域都有明显的采用趋势。 边缘计算市场规模在2023年估计为160亿美元,预计到2030年将以37%的复合年增长率增长至1560亿美元。24 同时,Gartner预测到2026年底,100%的企业PC购买将为AIPC,其中集成有神经处理单元(NPU)。25 SiMa的嵌入式边缘机器学习片上系统(MLSoC)旨在允许客户在芯片上运行整个应用程序,而Axelera的AI加速平台旨在利用YOLO(仅看一次,实时对象检测的卷积神经网络)为边缘AI计算机视觉应用提供推理处理能力。 我们访谈的大多数新兴半导体/硬件类别公司都在致力于创新的技术方法来管理工作负载,认识到数据准备、训练和推理的计算需求存在显著差异。他们正在开发整合的硬件/软件解决方案,并利用计算能力以满足这些需求。 我们正处于一场大规模的技术转型之中——新兴AI基础设施栈内的创新正以前所未有的速度进行。 贝塞创业合作伙伴 适当的模型也会因用例而异。 预计到2027年,企业使用特定于行业或功能的通用人工智能(GenAI)模型的比例将从约2023年的1%增加至50%。26 2.专注于AI可持续性 生成式人工智能的快速增长引发了对能源使用强度的关注。国际能源署估计,到2026年,数据中心在全球的电力消耗将超过1,000太瓦时,几乎是2022年的两倍,相当于日本的总能源消耗。27随着能源消耗从训练转向推理,尤其是在现代大规模部署模型时,整个模型生命周期中的能效日益受到关注。28我们识别出两个潜在的新兴趋势:能源与AI基础设施的整合,以及能源效率硬件和模型的创新。 能源供应链和数据中心基础设施的相互依存关系正在出现“壮丽7”(Mag7)29集成能源基础设施,越来越多地将数据中心与可再生能源源并置。然而,并不清楚足够的清洁能源资源能否满足需求。 微软和OpenAI据报道计划在未指定地点建设一个庞大的价值1000亿美元、5GW的“星门”人工智能数据中心,可能采用包括核能在内的替代能源。30虽然微软在2023年与核电生产商星座能源签署了协议,31分析报告指出这将无法提供所需的规模效应,且现有的全球核设施中只有少数能够满足需求。32 微软近期还宣布,将通过与布鲁克菲尔德资产管理公司(BrookfieldAM)的合作,支持约100亿美元的可再生能源项目。33 同时,在2024年3月,亚马逊以6.5亿美元的价格收购了Talen能源公司在宾夕法尼亚州核电站的数据中心校园。34 人工智能时代的大资本投入体现在Mag7在2023年的蓬勃增长的资本支出和研发开支(US$3740亿美