行业观点 怎么看人形机器人的商业化?——四象限的泛化与“干中学”的可能性。 在2026年2月25日的深度报告《具身智能迫近临界点,人形机器人商业化有望揭开序幕》中,我们曾领先市场率先提出了对于人形机器人商业化的思考框架:人形机器人所面向的工作环境必然是“高价值量+低重复性”的场景,上述场景又会在ToB/C客群差异、大脑/小脑层面泛化性要求的区分下形成四类买单方画像清晰且现阶段具身智能足以胜任的商业化场景——1)ToB+大脑泛化:导览、导购、导巡场景。2)ToB+小脑泛化:特种行业场景。3)ToC+大脑泛化:个人陪伴场景。4)ToC+小脑泛化:家庭照护场景。 结合前不久我们团队在硅谷调研的见闻,我们认为Optimus第一阶段的商业化,不一定是“完全自主替代人”,而更可能是一种“干中学”的过渡,将“劳动力”与“劳动场景”拆开,先做成一种physical labor cloud的类型。1)从官方发心看,Tesla自己对Optimus的官方定义,就是去做“危险、重复、无聊”的工作,而不是先从完全家用万能机器人开始。2)从行业实践看,Sanctuary AI公开承认很多公开视频其实是人工遥操作,并将teleoperation视为采集行为数据、训练模型、验证硬件的关键环节。Contoro将遥操作模式商业化,它们让远程操作员在客户现场之外控制机器人处理AI搞不定的edge cases,并且“从day 1提供可靠运行”,同时把这些人工接管继续喂给模型。3)从商业逻辑看,以部分美国加州与德州蓝领工作为例,①工业喷涂危险性和重复性高,年均工资差距38.0%;②商业清洁动作容错高、重复度高、夜班多,年均工资差距34.8%;③仓储搬运/补货/分拣场景更结构化,且已经有Contoro在部署跑通商业模式,年均工资差距14.8%。 特斯拉Optimus V3发布在即,人形机器人有望迎量产元年。埃隆·马斯克在过去半个月中持续为Optimus V3预热,3月21日在X发言称把Optimus放进“自复制机器/太空制造” 的叙事中,3月25日将Raptor 3类比Optimus V3,暗示这是一次明显的代际升级,同一天发布视频,为OptimusV3预热;3月31日在X发言称Optimus V3已能走动,还仍需最后一些润色才能对外展示。我们认为当前特斯拉Optimus已进入大规模量产前的供应链准备阶段,且未来量产指引将从上一个阶段的百万台指引逐渐演进到德州工厂驱动的千万台,行业空间有望十倍打开。 人类视频数据Scaling Law,顶尖具身大脑商业化试水。 数据侧:召唤感觉运动幽灵,NV EgoScale验证人类视频数据的Scaling Law。2026年2月19日,NV EgoScale框架基于2万+小时的带动作标签的第一人称(egocentric)人类视频数据集,验证了灵巧手操作泛化性的Scaling Law。2月底,NV GROOT研究员Danfei Xu在X上发布长文,再次指出“人类数据本质上是伪装的机器人数据”的观点。①理想的人类数据:虽然形态不同、驱动和传感堆栈不同,但通过充分的传感器和状态估计,人类行为可以被捕捉并视abc为另一个"机器人"的数据,仍然是由相同物理规律支配的从感知到动作的映射。②相比遥操作数据:遥操作会扭曲人类行为,许多自然且细微的感觉运动智能从未进入数据集,而日常人类数据包含丰富的人与人之间的互动。③相比视频数据:在预测的视觉画面和物理执行之间仍然存在最后一英寸(或牛顿)的差距。几毫米的误差、几毫秒的延迟,或单个牛顿的力差都可能决定物体是滑落还是保持稳定。模型侧:顶尖具身大脑公司的商业化进入试水阶段。2月24日,PI发布Blog,认为机器人行业也需要一个像大模型API那样可复用、可调用的“基础智能层”,从而让应用团队不必每次都从控制器、数据管线和模型训练重新搭起整套系统,同时给出了Weave和Ultra两家合作伙伴的标杆案例。我们认为,抛出商业化橄榄枝、展示合作伙伴案例秀肌肉本身证明SOTA级别的具身大脑渐渐进入可用阶段。相关标的 1)北美链:斯菱智驱、田中精机、科森科技、福赛科技、新泉股份、三花智控、恒立液压、北特科技、金力永磁、均 胜电子等。 2)其他机器人链:泛亚微透、唯科科技、领益智造、蓝思科技、禾赛、速腾聚创、海康威视、大华股份等。3)AI大脑及世界模型:协创数据、索辰科技、群核科技、智微智能、五一视界等。 风险提示 北美人形机器人量产节奏不及预期的风险;通用机器人Day1 L4路线缺乏商业化基础的风险;仿真合成数据质 量不及预期的风险;模型及软件解决方案三方公司长期产业链话语权较低的风险。 内容目录 一、怎么看人形机器人的商业化?——四象限的泛化与“干中学”的可能性.............................3二、特斯拉Optimus V3发布在即,人形机器人有望迎量产元年........................................5三、物理AI:人类视频数据Scaling Law,顶尖具身大脑商业化试水...................................8四、相关标的..................................................................................15五、风险提示..................................................................................15 图表目录 图表1:人形机器人核心商业价值在于处理“高价值/低重复”任务....................................3图表2:对高价值/低重复场景的进一步拆解,ToB/C×动脑/动手......................................4图表3:Optimus的官方定义是去做“危险、重复、无聊”的工作....................................5图表4:Sanctuary AI将遥操作在加拿大零售店落地部署............................................5图表5:Contoro将遥操作模式商业化.............................................................5图表6:美国加州与德州部分蓝领工作年均工资差距高达30+%.......................................5图表7:过去半个月Elon Musk持续为Optimus V3预热.............................................6图表8:Elon Musk 3.31在X发布视频为Optimus V3预热..........................................6图表9:Optimus技术逐步成熟,能力持续突破....................................................6图表10:Optimus量产规划明确,预计2027年底正式向公众发售....................................7图表11:NV EgoScale框架验证人类视频数据的Scaling Law........................................8图表12:NV EgoScale 2万+小时的人类预训练视频................................................9图表13:PI展示与Weave和Ultra两家合作伙伴的标杆案例........................................9图表14:UMI设备由平行夹爪+软指+扳机构成....................................................10图表15:多家具身智能大模型所用训练数据引入仿真合成数据......................................10图表16:银河通用GraspVLA大模型工作展示中,在不同光照条件下,模型都能精准执行抓取任务......12图表17:NVIDIA机器人三大计算平台协同解决方案...............................................12图表18:三台计算机之间闭环工作流与数据协同..................................................12图表19:Omniverse验证机器人步态,支持机器人学习...........................................13图表20:机器人在Isaac Sim中的不同仿真环境下训练............................................13图表21:Omniverse免费+订阅模式促进生态建设,形成软件驱动硬件销售模式.......................13图表22:谷歌发布通用世界模型Genie 3支持生成多样化交互环境..................................14图表23:LingBot-World在高动态环境下仍能保持主体一致性.......................................14图表24:Gemini 3.1 Pro实现抽象推理能力翻倍跃升..............................................15图表25:Gemini 3.1 Pro视觉表现力实现显著提升................................................15 一、怎么看人形机器人的商业化?——四象限的泛化与“干中学”的可能性 在2026年2月25日的深度报告《具身智能迫近临界点,人形机器人商业化有望揭开序幕》中,我们曾领先市场率先提出了对于人形机器人商业化的思考框架: 人形机器人的商业化价值几乎必然面向“高价值/低重复”任务。我们将机器人面向的商业场景抽象为四大象限。第一象限(高重复、高价值)是典型的专用设备领域,如汽车组装车间的机械臂或医疗领域的达芬奇手术机器人,客户愿意为特定高价值任务买单,但设备泛化性弱;第二象限(高重复、低价值)多由通用型自动化设备主导,如仓储AGV或家用扫地机,以标准化方案解决低附加值劳动;我们认为,人形机器人由于初期研发成本较高,其必须面向具有高额支付意愿的“高价值”领域;同时,其通用形态与泛化智能的溢价,只有在面对非标准化、高度复杂的“低重复性”任务时才能得到真正释放。因此,人形机器人真正的星辰大海在于第四象限(低重复、高价值)。此外,第三象限(低重复、低价值)中长尾且琐碎的日常杂务(如捡拾零散纸团),目前并不具备独立的商业化土壤,我们预计这类场景将在第四象限核心技术成熟后,受益于技术外溢被顺带解决。 在“高价值、低重复”的核心市场中,基于机器人能力侧重点(大脑思考泛化/小脑动作泛化)与客群属性(ToB/ToC)的进一步解耦,人形机器人的商业化落地可划分为四大细分场景。 其一,多动脑×ToB端的营销服务场景,主要聚焦商业环境下的逻辑推理与信息交互。该场景对机器人物理运动能力要求较低,仅需完成平地行走、手势引导等基础动作,却对模型“大脑”的动态认知能力要求颇高。小鹏汽车全新人形机器人IRON率先落地自有门店“导览、导购、导巡”核心商业场景,在展厅动态复杂环境中,可实时调用VLM/VLA架构的底层物理大模型,除完成引路导览外,还能精准解析客户非标准化需求、自主开展产品答疑,并在多轮对话中挖掘客户痛点、输出定




