您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中泰证券]:在时间的折痕处:物理AI - 发现报告

在时间的折痕处:物理AI

综合 2026-06-02 苏仪,刘一哲 中泰证券 周剑
报告封面

在时间的折痕处——物理AI 意义和本质绝非隐藏在事物背后,它们就在事物当中,在一切事物当中。——《悉达多》 2 0 2 6.0 6.0 2 分析师:苏仪执业证书编号:S0740520060001 分析师:刘一哲执业证书编号:S0740525030001 摘要 ◼物理AI(Physical AI)由黄仁勋于2024年提出,指能感知、理解并在真实物理世界中执行复杂操作的模型,是人工智能从虚拟智能迈向具身智能的关键桥梁。其外延覆盖人形机器人、智能驾驶与工业机器人三大核心场景。 ◼基础模型层呈现VLM、VLA与世界模型三条路径收敛之势。世界模型作为后台数据工厂合成训练数据,VLM承担长程规划的“慢思考”,VLA则把指令与感知直接转化为动作。海外格局是“NVIDIA一超、Google/Figure/Pi多强”,英伟达凭仿真、世界模型、基座VLA与软硬件全栈抢占“机器人安卓”地位;国内则由人形机器人厂商主导基模+硬件,大厂仍在追赶。场景端,智驾完成从端到端到VLA世界模型的切换,人形机器人加速量产并构建数据—模型飞轮。 ◼物理AI浪潮中,工具层是被低估的一环。仿真平台是基础模型训练的核心数据来源,英伟达Omniverse/Isaac主导、国内智元Genie Sim等开源生态加速追赶。物理AI还从仿真训练与数字孪生两个维度拉动工业软件需求,英伟达已与Cadence、达索、PTC、西门子、Synopsys等巨头深度合作。随着部署量提升、数据持续回流,物理AI有望进入“数据增长—模型迭代—能力提升—场景扩张”的飞轮。 ◼建议关注:工具层软件厂商如索辰科技、五一视界;智能驾驶软硬件提供商如地平线机器人、中科创达、经纬恒润、禾赛等。 ◼风险提示:AI等底层技术变革不及预期、政策落地不及预期、行业竞争加剧、报告信息更新不及时等。 CCONTE何谓物理AI? 1.1物理AI是什么?定义与边界 ◼物理AI(Physical AI)这个词在2024年由黄仁勋率先广泛使用,是指使用运动技能理解现实世界并与之进行交互的模型,它们通常封装在机器人或自动驾驶汽车等自主机器中。利用物理AI,自主机器能够感知、理解并在现实(物理)世界中执行复杂的操作。从外延上看,物理AI至少覆盖三个明确场景: ➢人形机器人:以接近人体形态、能在为人设计的环境中作业为目标,是物理AI最具想象空间的应用。➢智能驾驶:本质上是一个移动的、约束化的具身智能体,或成为物理AI最先规模化落地的场景。➢工业机器人:包括协作机器人、自主移动机器人、专用机械臂等,已获得规模化收入的领域。 1.2理解人工智能、具身智能与物理AI的关系 ◼人工智能和机器人技术的发展并非孤立进行,而是相互促进、共同演进的。人工智能为机器人赋予了“大脑”,使其具备感知、思考和决策能力;而机器人则为人工智能提供了“身体”,使其能够与真实世界进行交互,获取经验和知识。具身智能的兴起是人工智能和机器人技术各自发展到一定阶段的必然结果,是两者深度融合的体现。人工智能的持续进步需要与物理世界的交互能力,而机器人的未来发展也离不开更高级别的智能化水平。 ◼物理AI的核心价值,在于赋予自主机器在真实物理世界中实现“感知—理解—执行”闭环能力,使人工智能从虚拟智能向具身智能演进的关键桥梁。 资料来源:甲子光年,中泰证券研究所 1.3物理AI产业链全览 ◼物理AI的产业链可以按“大脑(基础模型)—身体(硬件)—环境(工具与应用)”三层划分。 图表:产业链全览 资料来源:中泰证券研究所 基础模型层:VLA、VLM、世界模型路径收敛 2三类基础模型的 ◼基础模型分别为VLM、VLA、WFM。世界模型能够作为后台合成数据工厂,生成物理感知视频和仿真环境,为下游模型提供低成本训练数据与闭环评估场景;VLM作为运行时的“大脑”,负责视频理解、物理常识推理和高层任务规划;VLA可作为“小脑+脊髓”,把语言指令和视觉感知直接转化为机器人关节级动作。 图表:三类模型的关系 资料来源:NVIDIA,中泰证券研究所 2.1 VLM视觉语言模型:长程任务规划与“慢思考”接入 ◼VLM(视觉语言模型/推理型VLM):代表是NVIDIA的CosmosReason 2。Cosmos Reason通过对视频和图像输入进行推理来回答查询。具身推理需要人工智能系统与物理世界交互并从中学习。与被动理解不同,具身人工智能中的推理通常以行动为基础,使机器人不仅能够理解它们当前观察到的内容,而且还能在不确定和动态的环境中为未来规划智能行为。 图表:NVIDIACosmosReason1 资料来源:NVIDIA,中泰证券研究所 2.2视觉语言动作模型(VLA):从模仿学习到规模化预训练 ◼VLA模型将视觉、语言和动作整合到一个统一的多模态系统中,使机器人能够理解人类指令并将其转化为物理操作。执行流程包括语义解析、目标检测、路径规划和动作执行,从而完成“理解语义→感知世界→完成任务”的完整循环。代表性项目包括Google RT-X、Meta Ego-Exo和Figure Helix等。 资料来源:Medium,中泰证券研究所 2.2世界模型:从视频生成器走向可交互的物理仿真器 ◼“世界模型”这个词在2024年之前主要用在强化学习领域(Dreamer系列),2024年之后被OpenAI Sora、NVIDIACosmos、Google Genie等广泛引用。当下世界模型的技术路线主要有视频生成、3D生成和物理引擎混合三种。 资料来源:清华大学,中泰证券研究所 2.4海外格局:NVIDIA一超,Google / Figure / Pi多强 ◼NVIDIA是基础模型层领先者。除GR00T外,NVIDIA还同时拥有仿真平台、世界模型、基座VLA、推理模型、训练芯片、推理芯片。任何想做物理AI的公司可能都需要其中的工具,这就是黄仁勋追求的“机器人安卓”地位。 ◼除NVIDIA外,Google、Figure AI、Physical Intelligence、Tesla等公司也在布局物理AI基础模型。 2.4国内格局:人形机器人厂商主导基模,大厂仍在追赶 ◼国内基础模型层的核心特征是:人形机器人公司在做基础模型,大厂在做大模型支撑。与海外路径不同。原因有两个:◼国内LLM大厂的主要算力和注意力还在AGI路线上,对物理AI特别是机器人硬件投入相对克制;人形机器人公司技术和融资能力强,有能力自建基础模型团队。 两大场景:智能驾驶与人形机器人 3.1智驾整车端:从端到端大模型到VLA世界模型 ◼车企技术路径经历切换。主流车企完成了从规则驱动时代、端到端AI时代与VLA时代的路径切换。 ◼理想的詹锟在NVIDIA GTC 2026上明确表示,“自动驾驶只是物理AI的起点,基于同一套VLA模型,不仅可以控制车辆,也能够扩展到机器人。” 3.2人形机器人:量产加速落地,数据-模型飞轮加速构建 ◼人形机器人正从样机验证进入小批量/规模化部署阶段,Figure、Tesla、智元、宇树等厂商均给出2026年万台级产能或部署目标,应用场景从工厂、物流逐步扩展至家庭与零售。真实场景数据开始形成持续回流。我们认为数据闭环成为模型层竞争的关键。Figure依托BotQ工厂和Helix-02形成“产能即数据”路径,Tesla延续FSD数据体系和Cortex算力优势,智元、银河通用等国内厂商加快真机与合成数据积累。随着部署量提升,机器人模型有望进入“数据增长—模型迭代—能力提升—场景扩张”的飞轮阶段。 工具层:被严重低估的一层 4.1仿真平台:英伟达Omniverse / Isaac主导,开源生态加速追赶 ◼谁掌握了高质量仿真平台,谁就握住了基础模型训练的核心来源。仿真平台的核心能力包含几个主要方面:➢物理引擎:刚体、流体、接触动力学、变形等物理求解器的精度与速度。➢渲染引擎:把仿真器输出转化为接近真实的视觉,用于训练视觉为主的VLA。➢生成式数据引擎:用自然语言或文本提示生成各种任务场景和生成数据。◼我们认为物理引擎是仿真平台中技术门槛最高的环节。 4.1国内仿真平台:智元GenieSim、索辰开物,51Sim等 ◼国内仿真平台与海外的差距依旧存在,但开源生态在快速追赶。智元Genie Sim 3.0在CES 2026发布并开源,是国内首个对标Isaac Lab + Cosmos的综合性平台。索辰开物平台基于生成式物理AI技术和实景渲染技术,实现真实场景下的四维时空耦合多物理场设计、仿真、优化和训练,并应用于工业装备的研制和部署。开物平台提供一系列的工具集和应用服务,使开发者和工业用户能够轻松开发和部署物理AI应用。 4.2工业软件:物理AI增加工业软件需求,NV与工业软件巨头广泛合作 ◼我们认为物理AI正在从两个维度拉动工业软件需求。1)仿真训练直接需求。物理AI的训练数据中,仿真合成数据需要CAE求解器提供精确的物理一致性。每一台部署的物理AI设备背后,都对应着数千小时的CAE仿真。2)数字孪生开始规模落地。物理AI给出了数字孪生的实用场景:用于训练机器人在真实工厂部署前先在数字孪生中迭代。NVIDIAOmniverse + ABB /西门子的工厂数字孪生案例已经在汽车、电子、物流行业规模化落地。 ◼GTC 2026上NVIDIA同时宣布与Cadence、达索系统、PTC、西门子、Synopsys五大全球工业软件巨头深度合作,把CUDA-X、Omniverse注入工业软件生态: 风险提示 ◼AI等底层技术变革不及预期。计算机产业发展的底层驱动力是技术的变革,若AI等技术变革不及预期将影响计算机产业业绩释放周期。 ◼政策落地不及预期。政策对计算机产业供需两端均有重要促进作用,若以自主可控为代表的相关国产化政策落地时间和扶持力度不及预期,则可能会对计算机产业的业绩产生不利影响。 ◼行业竞争加剧。目前国产软硬件尚未呈现出清晰的格局,很多领域仍处于高度竞争状态,若后续行业竞争加剧,可能会影响计算机公司的毛利率与净利率水平。 ◼研报信息更新不及时的风险。 重要声明 ◼中泰证券股份有限公司(以下简称“本公司”)具有中国证券监督管理委员会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。 ◼本报告基于本公司及其研究人员认为可信的公开资料或实地调研资料,反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响。本公司力求但不保证这些信息的准确性和完整性,且本报告中的资料、意见、预测均反映报告初次公开发布时的判断,可能会随时调整。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。 ◼市场有风险,投资需谨慎。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 ◼投资者应注意,在法律允许的情况下,本公司及其本公司的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。本公司及其本公司的关联机构或个人可能在本报告公开发布之前已经使用或了解其中的信息。 ◼本报告版权归“中泰证券股份有限公司”所有。事先未经本公司书面授权,任何机构和个人,不得对本报告进行任何形式的翻版、发布、复制、转载、刊登、篡改,且不得对本报告进行有悖原意的删节或修改。