您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:计算机行业研究:具身智能迫近临界点,人形机器人商业化有望揭开序幕 - 发现报告

计算机行业研究:具身智能迫近临界点,人形机器人商业化有望揭开序幕

信息技术2026-02-25刘高畅、郑元昊国金证券陈***
计算机行业研究:具身智能迫近临界点,人形机器人商业化有望揭开序幕

从央视春晚Bot火热看人形机器人四大潜在商业化场景。马年央视春晚“含Bot”量再度提升,松延动力、宇树科技、魔法原子、银河通用&Sharpa为全国人民贡献了四台兼顾科技属性与人文关怀的精彩节目,也展示出人形机器人产业面向商业化落地的最新尝试。以星海图前首席科学家许华哲博士的思考为蓝本,我们认为人形机器人所面向的工作环境必然是“高价值量+低重复性”的场景,上述场景又会在ToB/C客群差异、大脑/小脑层面泛化性要求的区分下形成四类买单方画像清晰且现阶段具身智能足以胜任的商业化场景——1)ToB+大脑泛化:导览、导购、导巡场景,比如小鹏Iron机器人的展厅导览、汽车门店导购、公司前台导流与巡逻场景,底层能力是流利流畅的语言智能沟通+亲切的人形姿态。2)ToB+小脑泛化:特种行业场景,比如央视春晚《武Bot》节目中宇树科技在高动态集群控制下,实现16台机器人毫秒级协同响应的醉拳、后空翻、双节棍、跳马、队列穿插变阵等高难度动作的能力,底层能力是类人的运动控制+蜂群协同作战。3)ToC+大脑泛化:个人陪伴场景,比如央视春晚《奶奶的最爱》节目中,松延动力机器人展示出的情绪价值拉满的唠嗑、玩梗能力,底层能力是基于语言智能的情绪价值供给,用户数据、情感投射、品牌心智形成正向飞轮。4)ToC+小脑泛化:家庭照护场景,比如央视春晚贺岁微电影中,银河通用机器人使用Sharpa的灵巧手完成盘核桃、叠衣服等任务,底层能力是触视觉协同的长程精细操作能力。 模型:具身智能泛化的曙光。泛化是机器人区别于自动化机器设备的本质区别,也是解锁上述商业化场景的钥匙。1)一段式学习系统取得阶段性突破。26年初,Figure AI发布Helix 02,新增运动直觉S0系统,能够在整个房间范围内实现“灵巧、长时程的自主行为”;同期,特斯拉选择将Optimus与无人驾驶共享一套闭环仿真世界模型,并希望将Grok大模型作为Optimus机器人集群的高级调度中枢。2)大脑侧模型的预训练已跨越ScalingLaw门槛。25年11月,北美创企Generalist AI发布GEN-0,首次验证了激活具身智能的参数门槛大约在7B。我们认为,由于Scaling路径已基本被LLM摸清,所以具身智能大脑侧的卡点更多是一个数据与工程问题而非复杂的科学问题。3)小脑侧,25年9月底北美创企Skild AI发布通用小脑,在相对于传统单一模型训练量提升500倍的情况下意外训练得到了能够跨本体实现运动控制的通用小脑能力——比如在被锯断了小腿的四足机器狗、锁定了一个电机关节只剩下三条腿的四足机器狗以及锁定了轮足的机器狗上,通用小脑均展现出快速的泛化适应能力。同期,李飞飞博士在发布ImageNet的十五年后启动首届BEHAVIOR挑战赛,开放总计1,200+小时的10,000条专家遥操作示范,细致标注物体状态、空间关系和自然语言描述。ImageNet曾推动计算机视觉进入大模型时代,我们相信BEHAVIOR也将为机器人时代设定第一个统一的Benchmark,推动大小脑协同进化。 数据:三线交织,虚实融合,加速演绎。我们认为,具身训练中,真机数据是刚需,而仿真与人类视频可以提供数据扩展必要的数量级补充,以上三条路线均在过去一年中取得突破性进展。1)真机数据:UMI作为一种轻量化、无本体、低成本的真实数采方案,由3D打印的平行夹爪+软指+扳机构成,整套成本约400美金。2)仿真合成数据:英伟达Isaac&Sim与索辰开物机器人训练平台持续迭代,北美Skild AI+国内银河通用都证明足够多样性的仿真数据可以一定程度上弥补Sim2Real的gap问题。3)人类视频数据:Gemini 3.0/3.1 Pro在屏幕理解、抽象推理层面取得显著能力提升,有望加速解锁机器人理解真实世界的能力,北美Tesla与Figure都在转向人类视频数据进行模型的训练。 相关标的:智能迫近临界点有望推动人形机器人进入大规模量产前奏,建议关注人形机器人核心供应链企业,如斯菱智驱、科森科技、福赛科技、新泉股份、三花智控、恒立液压、泛亚微透、唯科科技、领益智造、蓝思科技、海康威视、大华股份等;具身智能AI大脑和世界模型,建议关注协创数据(旗下奥佳科技Fcloud与NV合作提供Ominibot具身智能大脑训练平台)、索辰科技(中国物理AI稀缺资产)、群核科技、智微智能等。 北美人形机器人量产节奏不及预期的风险;通用机器人Day1 L4路线缺乏商业化基础的风险;仿真合成数据质量不及预期的风险;模型及软件解决方案三方公司长期产业链话语权较低的风险。 内容目录 1.引子:从央视春晚Bot火热看人形机器人商业化提速......................................................................................42.模型:具身智能泛化的曙光,一段式学习系统取得突破..................................................................................62.1端到端:Figure AI布局全身推理系统,特斯拉Optimus与无人驾驶共享一套世界模型........................62.2大脑:预训练跨越Scaling Law门槛,激活参数或为7B.......................................................................82.2小脑:跨本体通用小脑问世,Behavior牵动具身智能ImageNet时刻...................................................93.数据:三线交织,虚实融合,加速演绎..........................................................................................................103.1真实数采:刚需,UMI解锁轻量化、无本体、低成本方案...................................................................103.2仿真合成:增广,不断逼近真实世界的性价比方案..............................................................................113.3人类视频:潜力,AI多模态能力突飞猛进............................................................................................184.风险提示.........................................................................................................................................................19 图表目录 图表1:春晚“含Bot”量浓度升高,能力展示程度逐步深化.................................................................................4图表2:人形机器人核心商业价值在于处理“高价值/低重复”任务.......................................................................5图表3:对高价值/低重复场景的进一步拆解,ToB/C×动脑/动手........................................................................6图表4:Helix 02:一个能够同时对全身进行推理的单一学习系统.....................................................................7图表5:特斯拉Optimus机器人与无人驾驶共享一套世界仿真模型...................................................................8图表6:激活具身智能模型的参数门槛或许是7B...............................................................................................8图表7:2023年GPT-4相对3.5扩展了10X参数量.........................................................................................9图表8:2025年上下文窗口的10X扩容 .............................................................................................................9图表9:推理相对非推理解锁了10X Token消耗................................................................................................9图表10:Skild AI通用小脑使机器人可实现跨本体运动控制............................................................................10图表11:Behavior为机器人提供日常家庭长时序任务综合仿真基准与训练环境.............................................10图表12:UMI设备由平行夹爪+软指+扳机构成...............................................................................................10图表13:多家具身智能大模型所用训练数据引入仿真合成数据.......................................................................11图表14:银河通用GraspVLA大模型工作展示中,在不同光照条件下,模型都能精准执行抓取任务............12图表15:NVIDIA机器人三大计算平台协同解决方案......................................................................................13图表16:三台计算机之间闭环工作流与数据协同.............................................................................................13图表17:Omniverse验证机器人步态,支持机器人学习................................................................................13图表18:机器人在Isaac Sim中的不同仿真环境下训练..................................................................................13图表19:NVIDIA Isaac Sim生态系统合作伙伴遍布海内外.....