证券研究报告 行业研究 2025年3月5日 本期内容提要: 杨宇轩电子行业分析师执业编号:S1500525010001邮箱:yangyuxuan@cindasc.com ➢众多厂商推出世界模型,相关领域已展开角逐。英伟达推出Cosmos,赋能机器人和自动驾驶开发者。Cosmos世界基础模型是一套用于物理感知视频生成的开放式扩散和自回归Transformer模型。这些模型已基于2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据,训练了9,000万亿个token。李飞飞创立World Labs,探索从2D到3D的路径。World Labs是一家空间智能AI公司,由在AI学术领域享有盛誉的李飞飞博士创立。World Labs致力于构建空间智能大型世界模型(LWM)来感知、生成3D世界并与之交互。其目标是将AI模型从像素的2D平面提升到完整的3D世界。WorldLabs仅创立了三个月,便吸引了英伟达、AMD等公司的融资,估值超过10亿美元。谷歌旗下DeepMind推出Genie2,性能强大用例广泛。Genie 2是一种自回归潜在扩散模型,在大型视频数据集上进行了 训 练 。 通 过 自 动 编 码 器 后 , 视 频 中 的 潜 在 帧 被 传 递 到 大 型transformer动力学模型,该模型使用类似于大型语言模型使用的因果掩码进行训练。在推理时,Genie 2可以以自回归方式进行采样,逐帧执行单个作和过去的潜帧。谷歌使用无分类器的指导来提高可控性。在DeepMind官网上,Genie2的能力也非常强大。昆仑万维发布Matrix-Zero,国产模型紧追不舍。昆仑万维发布的Matrix-Zero世界模型包含两款子模型,其中,3D场景生成大模型支持将用户输入的图 片转化为可自由探索的真实合理的3D场景。而可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果,具备更精准控制的actionmodel。 ➢投资建议:无论是北美还是国内,推理成本的降低及推理性能的迅速提升趋势非常显著。微软董事长Satya Nadella曾在法说会表示,每代硬件的性价比提高2倍以上,而由于软件优化,每代模型的性能提升10倍以上。DeepSeek卓越的性价比让人印象深刻,据Semianalysis观察,在GPT-4上同样有类似的趋势,即每过一年,算法改进和优化使得推理成本降低10倍,同时性能提升10倍。因此,我们认为,AI的发展目前正如火如荼地进行着,大模型不会满足于帮人类查找资料这样的小事,长期看它甚至具备改变部分行业运行逻辑的潜力。而当前伴随推理性能的提升和推理成本的降低,许多算力密集型的场景有了落地的可能,本文所探讨的世界模型便是其中一个例子。世界模型可以帮助端侧理解并预测世界,从而产生正确的决策。从云来看,由于多模态数据的训练与推理,算力需求总体仍然呈现迅速增长的趋势;而从端来看,人形机器人、自动驾驶等重要赛道有望迅速前进,以突破目前的智能化瓶颈。AI呈现出巨大的产业前景,建议关注相关产业链优质个股。 信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编:100031 ➢相关个股:【AI云侧】工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息;【AI端侧】蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等。 ➢风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。 目录 世界模型探索空间智能,AI复杂场景落地可期..............................................................................5世界模型研究进展迅速,应用端机遇与挑战并存...................................................................5众多厂商推出世界模型,相关领域已展开角逐.....................................................................10风险因素............................................................................................................................................14 表1:建议关注个股................................................................................................................................................13 图目录 图1:世界模型研究进展..........................................................................................................................................6图2:Sora的潜在架构..............................................................................................................................................7图3:Sora替换视频元素.........................................................................................................................................7图4:Sora合并视频..................................................................................................................................................7图5:Sora扩展场景..................................................................................................................................................7图6:Sora组织和编辑视频....................................................................................................................................7图7:视频生成模型时间线梳理............................................................................................................................8图8:机器人世界模型研究进展............................................................................................................................9图9:o3-mini生成的四维超立方体内反弹小球的python代码..............................................................9图10:Grok3生成模拟航天器任务.....................................................................................................................9图11:Cosmos优势...............................................................................................................................................10图12:Cosmos简介...............................................................................................................................................11图13:Genie 2可以在长达一分钟内保持一致性........................................................................................11图14:Genie 2可生成不同的视角....................................................................................................................11图15:Genie 2学会了创建复杂的3D视觉场景。.................................................................................12图16:Genie 2可创建不同的物理效果(如水、烟)..............................................................................12图17:昆仑万维Matrix-Zero..............................................................................................................................12图18:推理成本迅速降低....................................................................................................................................13 世界模型探索空间智能,AI复杂场景落地可期 世界模型研究进展迅速,应用端机遇与挑战并存 长期以来,科学界一直渴望开发一个统一的模型,该模型可以复制其世界的基本动态,以追求通用人工智能(AGI)。OpenAI发布了Sora之后,Sora强大的仿真能力初步理解了物理定律,但关于该模型是否符合世界模型的标准产生了争议。 世界模型尚无统一的定义,观点通常分为理解世界和预测未来。Ha和Schmidhuber的早期工作侧重于抽象外部世界,以深入了解其潜在机制。相比之下,LeCun认为,世界模型不仅应该感知和建模现实世界,而且还应该具备设想可能的未来状态的能力,从而为决策提供信息。英伟达官网的定义为:“世界模型是理解现实世界动态(包括其物理和空间属性)的生成式AI模型。它们使用文本、图像、视频和运动等输入数据来生成视频。通过学习,它们能够理解现实世界环境的物理特性,