20251220 #①模型侧-目前具身智能尚处于预训练摸到ScalingLaw门槛阶段。 具身智能目前的一大问题是泛化能力较弱,9月底北美创企Skild AI发布通用小脑,在相对于传统单一模型训练量提升500倍的情况下意外训练得到了能够跨本体实现运动控制的通用小脑能力;11月北美创企Generalist AI发布GE 【国金计算机】2025年具身智能模型发展到哪一步了? 20251220 #①模型侧-目前具身智能尚处于预训练摸到ScalingLaw门槛阶段。 具身智能目前的一大问题是泛化能力较弱,9月底北美创企Skild AI发布通用小脑,在相对于传统单一模型训练量提升500倍的情况下意外训练得到了能够跨本体实现运动控制的通用小脑能力;11月北美创企Generalist AI发布GEN-0,首次验证了激活具身智能参数门槛大约在7B,而现有模型的参数量普遍在4B左右。 我们认为,参考LLM的发展轨迹,过去3年每一年都是在某个技术方向上通过狂堆资源的暴力美学实现10倍级以上的提升,23年是预训练的Scaling Law,将LLM参数量从千亿拉升到万亿规模(第一个10倍),解锁了模型的常识能力;24年是后训练的Scaling Law,通过强化学习的方式解锁了模型的推理能力,同一模型在响应任务时推理Token消耗量是单纯回答问题的10倍(第二个10倍);25年是记忆长度的Scaling Law,通过堆高存储,将模型的上下文窗口长度从100k拉升到1m(第三个10倍),解锁了模型的长期记忆能力。 一方面,目前具身智能模型刚刚解锁预训练Scaling Law的门槛,另一方面,由于路径已经被LLM摸清,所以卡点更多是一个数据问题而非复杂的科学问题。 #②数据侧-真机、仿真、人类视频数据采集方案均取得较大进展。 真机数据是刚需,而仿真与人类视频可以提供数据扩展必要的数量级补充。 ImageNet曾推动计算机视觉进入大模型时代,我们相信BEHAVIOR也将为机器人时代设定第一个统一的Benchmark。 三条路径进展方面,1)真机数据:UMI作为一种轻量化、无本体、低成本的真实数采方案,由3D打印的平行夹爪+软指+扳机构成,整套成本约400美金。 2)仿真合成数据:英伟达Isaac&Sim与索辰开物机器人训练平台,北美Skild AI+国内银河通用都证明足够多样性的仿真数据可以一定程度上弥补Sim2Real的gap问题。 3)人类视频数据:受益于多模态理解/生成近期的突破性进展,北美巨头Tesla Optimus与Figure都在转向人类视频数据进行模型的训练。 #③应用侧-人形的未来是高价值低重复场景。 星海图许博认为,如果按照价值量-重复性的四象限划分,高价值高重复场景大概率会被非人形的专用自动化设备解决,因而目前没有自动化的事情,往往要么单价不高,要么重复度不高。 因而基于更大、更多样数据集训练的泛化能力+针对多场景的RL仍是未来解锁商业化场景的必要路径。 现阶段而言,11月的小鹏科技日,会走猫步的Iron机器人放弃了家庭场景,转而优先落地在动脑&动嘴为主的销售、导购、导览等服务型场景,这或许是跳舞、跑酷、格斗展示之外现阶段更靠近商业化的一条路,此外,近期逐际动力的模块化底座也是一条值得思考的路。 投资建议: 【索辰科技】【能科科技】 【速腾聚创】【禾赛】 风险提示:世界模型底层技术架构发展不及预期;合成数据质量不及预期;通用机器人Day L4路线缺乏商业化基础等风险。