行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

电子：世界模型探索空间智能，AI复杂场景落地可期

电子设备 2025-03-05 莫文宇,杨宇轩信达证券大熊

世界模型探索空间智能，AI复杂场景落地可期

世界模型研究进展迅速，应用端机遇与挑战并存

定义与进展：世界模型旨在理解现实世界动态，追求通用人工智能（AGI）。英伟达定义其为生成式AI模型，通过文本、图像等输入数据生成视频，理解并预测物理世界。Sora发布后获得广泛关注，展示了视频生成模型的潜力，但仍存在对物理世界理解不足的争议。
技术架构：Sora基于扩散和自回归Transformer模型，由压缩模型、扩散模型和语言模型组成，可生成和编辑视频，但存在像素层面生成的问题。
应用领域：世界模型在自动驾驶和机器人领域应用前景广阔。自动驾驶中，基于扩散的视频生成模型可解决信息丢失和建模效率问题；机器人领域，世界模型使机器人能处理通用任务，提升智能化水平。
近期进展：o3-mini可模拟生成物理场景代码，Grok3能模拟航天器任务，推动世界模型快速迭代。

众多厂商推出世界模型，相关领域已展开角逐

英伟达Cosmos：基于扩散和自回归Transformer模型，基于2000万小时真实数据训练，赋能机器人和自动驾驶开发者。
World Labs：由李飞飞创立，构建空间智能大型世界模型（LWM），将AI模型从2D提升至3D，估值超10亿美元。
DeepMind Genie2：自回归潜在扩散模型，性能强大，可生成复杂3D场景和物理效果。
昆仑万维Matrix-Zero：包含3D场景生成和可交互视频生成子模型，支持图片转3D场景和实时互动视频生成。

投资建议

推理成本降低和性能提升趋势显著，AI发展如火如荼，世界模型等算力密集型场景有望落地。
云端算力需求持续增长，端侧人形机器人、自动驾驶等赛道将迅速前进。
建议关注AI云侧和端侧相关产业链优质个股。

风险因素

宏观经济下行风险、下游需求不及预期风险、中美贸易摩擦加剧风险。

证券研究报告行业研究 2025年3月5日本期内容提要: 杨宇轩电子行业分析师执业编号：S1500525010001邮箱：yangyuxuan@cindasc.com ➢众多厂商推出世界模型，相关领域已展开角逐。英伟达推出Cosmos，赋能机器人和自动驾驶开发者。Cosmos世界基础模型是一套用于物理感知视频生成的开放式扩散和自回归Transformer模型。这些模型已基于2000万小时的真实世界人类互动、环境、工业、机器人和驾驶数据，训练了9,000万亿个token。李飞飞创立World Labs，探索从2D到3D的路径。World Labs是一家空间智能AI公司，由在AI学术领域享有盛誉的李飞飞博士创立。World Labs致力于构建空间智能大型世界模型（LWM）来感知、生成3D世界并与之交互。其目标是将AI模型从像素的2D平面提升到完整的3D世界。WorldLabs仅创立了三个月，便吸引了英伟达、AMD等公司的融资，估值超过10亿美元。谷歌旗下DeepMind推出Genie2，性能强大用例广泛。Genie 2是一种自回归潜在扩散模型，在大型视频数据集上进行了训练。通过自动编码器后，视频中的潜在帧被传递到大型transformer动力学模型，该模型使用类似于大型语言模型使用的因果掩码进行训练。在推理时，Genie 2可以以自回归方式进行采样，逐帧执行单个作和过去的潜帧。谷歌使用无分类器的指导来提高可控性。在DeepMind官网上，Genie2的能力也非常强大。昆仑万维发布Matrix-Zero，国产模型紧追不舍。昆仑万维发布的Matrix-Zero世界模型包含两款子模型，其中，3D场景生成大模型支持将用户输入的图片转化为可自由探索的真实合理的3D场景。而可交互视频生成大模型，提供以用户输入为核心驱动的可交互空间智能视频生成方案，支持根据用户实时输入生成互动视频效果，具备更精准控制的actionmodel。 ➢投资建议：无论是北美还是国内，推理成本的降低及推理性能的迅速提升趋势非常显著。微软董事长Satya Nadella曾在法说会表示，每代硬件的性价比提高2倍以上，而由于软件优化，每代模型的性能提升10倍以上。DeepSeek卓越的性价比让人印象深刻，据Semianalysis观察，在GPT-4上同样有类似的趋势，即每过一年，算法改进和优化使得推理成本降低10倍，同时性能提升10倍。因此，我们认为，AI的发展目前正如火如荼地进行着，大模型不会满足于帮人类查找资料这样的小事，长期看它甚至具备改变部分行业运行逻辑的潜力。而当前伴随推理性能的提升和推理成本的降低，许多算力密集型的场景有了落地的可能，本文所探讨的世界模型便是其中一个例子。世界模型可以帮助端侧理解并预测世界，从而产生正确的决策。从云来看，由于多模态数据的训练与推理，算力需求总体仍然呈现迅速增长的趋势；而从端来看，人形机器人、自动驾驶等重要赛道有望迅速前进，以突破目前的智能化瓶颈。AI呈现出巨大的产业前景，建议关注相关产业链优质个股。信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编：100031 ➢相关个股：【AI云侧】工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息；【AI端侧】蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等。 ➢风险因素：宏观经济下行风险；下游需求不及预期风险；中美贸易摩擦加剧风险。目录世界模型探索空间智能，AI复杂场景落地可期..............................................................................5世界模型研究进展迅速，应用端机遇与挑战并存...................................................................5众多厂商推出世界模型，相关领域已展开角逐.....................................................................10风险因素............................................................................................................................................14 表1：建议关注个股................................................................................................................................................13 图目录图1：世界模型研究进展..........................................................................................................................................6图2：Sora的潜在架构..............................................................................................................................................7图3：Sora替换视频元素.........................................................................................................................................7图4：Sora合并视频..................................................................................................................................................7图5：Sora扩展场景..................................................................................................................................................7图6：Sora组织和编辑视频....................................................................................................................................7图7：视频生成模型时间线梳理............................................................................................................................8图8：机器人世界模型研究进展............................................................................................................................9图9：o3-mini生成的四维超立方体内反弹小球的python代码..............................................................9图10：Grok3生成模拟航天器任务.....................................................................................................................9图11：Cosmos优势...............................................................................................................................................10图12：Cosmos简介...............................................................................................................................................11图13：Genie 2可以在长达一分钟内保持一致性........................................................................................11图14：Genie 2可生成不同的视角....................................................................................................................11图15：Genie 2学会了创建复杂的3D视觉场景。.................................................................................12图16：Genie 2可创建不同的物理效果（如水、烟）..............................................................................12图17：昆仑万维Matrix-Zero..............................................................................................................................12图18：推理成本迅速降低....................................................................................................................................13 世界模型探索空间智能，AI复杂场景落地可期世界模型研究进展迅速，应用端机遇与挑战并存长期以来，科学界一直渴望开发一个统一的模型，该模型可以复制其世界的基本动态，以追求通用人工智能（AGI）。OpenAI发布了Sora之后，Sora强大的仿真能力初步理解了物理定律，但关于该模型是否符合世界模型的标准产生了争议。世界模型尚无统一的定义，观点通常分为理解世界和预测未来。Ha和Schmidhuber的早期工作侧重于抽象外部世界，以深入了解其潜在机制。相比之下，LeCun认为，世界模型不仅应该感知和建模现实世界，而且还应该具备设想可能的未来状态的能力，从而为决策提供信息。英伟达官网的定义为：“世界模型是理解现实世界动态(包括其物理和空间属性)的生成式AI模型。它们使用文本、图像、视频和运动等输入数据来生成视频。通过学习，它们能够理解现实世界环境的物理特性，

点击免费查看完整报告

电子：世界模型探索空间智能，AI复杂场景落地可期

世界模型探索空间智能，AI复杂场景落地可期

世界模型研究进展迅速，应用端机遇与挑战并存

众多厂商推出世界模型，相关领域已展开角逐

投资建议

相关个股

风险因素

你可能感兴趣

世界模型和空间智能铸基，推动物理AI发展

电子行业深度报告：智能眼镜有望成为端侧AI落地最佳场景之一

电子元器件：AI端侧系列推荐之十五：景气度延续可期，Apple Intelligence落地打开果链成长空间

【AI先行者大会】阿里小蜜—智能服务技术实践及场景探索

大数据+AI场景化落地，从神州迈向世界

计算机行业周报：世界人工智能大会举办，关注AI落地场景

智能汽车系列报告（一）：小鹏科技日前瞻：物理AI与世界模型或有突破

探索AI模型落地

Haoyu-基于大数据的复杂场景的语音识别的探索与实践

计算机行业深度报告：公共数据垂直模型有望成为AI重要落地场景