AI智能总结
证券研究报告 人形机器人赛道深度之运动控制:制约商业化落地进程的关键环节 -人形机器人行业专题报告 西部证券研发中心2025年06月24日 分析师|齐天翔S0800524040003邮箱地址:qitianxiang@research.xbmail.com.cn分析师|张磊S0800524070001邮箱地址:zhanglei@research.xbmail.com.cn 核心结论 人形机器人应用广泛,机遇与挑战并存。人形机器人,是指具有人的形态和功能的机器人。随着行业不断发展,具备高度仿人外形、强大的感知能力以及智能决策和学习能力的人形机器人有望广泛进入各种生态场景,如工业自动化、医疗康复、服务与零售、危险救援、家庭服务、教育科研等。随着资本和人才不断涌入、机器人控制和AI技术快速迭代,人形机器人产业日新月异,但从大规模商业化落地角度来看,人形机器人产业在技术、经济、社会等方面仍然面临诸多挑战。 精准的复杂运动控制技术是人形机器人得以广泛应用的基础。人形机器人运动控制是指对机器人进行精确控制,使其能够模拟和执行人类的各种动作和运动。这种控制不仅包括对机器人关节的精确控制,还包括对机器人整体运动轨迹的规划和控制,以确保机器人能够完成复杂的任务,为机器人在实际应用中的广泛发展奠定基础。 基于模型的控制和基于学习的控制方法相辅相成,助力人形机器人运控迭代升级。在软件算法层面,人形机器人的运动控制可以分为基于模型的控制和数据驱动控制,每种控制方法都有其独特的优势,能够解决不同的控制问题。1)基于模型的控制:具有高可解释性等独特优势,但其主要依赖于准确的建模和手动参数调整,这使得在多刚体规划和控制中优化变得复杂。2)基于学习的控制:是指利用数据驱动技术使机器人能够从经验中学 习运动策略。基于学习的方法特别适用于传统模型可能难以捕捉与未结构化或不可预测地形互动复杂性的环境。二者相结合的混合控制方式则通过数学模型提供基础控制框架,利用数据驱动方法增强适应性和鲁棒性,兼顾了控制精度和适应性,大大提高了人形机器人的运动和作业能力。 头部企业运控表现亮眼,多环节有望受益。以特斯拉Optimus、宇树G1及波士顿动力Atlas等为代表的人形机器人产品由于硬件方案的差异化,各自擅长的领域有所差异,但均展现出了优秀的运控能力。一般而言,涉及运动控制相关的软件算法开发是由机器人主机厂自研完成。运动控制相关硬件本体(如控制器、执行器、传感器等)的开发分工差异则较大,自研或采购第三方供应商的形式均有。另外,涉及到机器人训练相关的硬件,如动捕设备、遥操设备、仿真软件工具,多为第三方供应商或开源平台提供。 【投资建议】 人形机器人的运动控制是实现其动态步态、精细操作和环境适应的核心技术,也是涉及硬件设备、软件工具和开发套件的综合应用。本文聚焦在人形机器人运动控制软件算法及数据训练的研究,建议关注如下受益环节及标的。 ①运控系统:固高科技、雷赛智能。 ②软件及仿真工具:NVIDIAIsaacSim、PyBullet、Gazebo。 ③动作捕捉设备:Xsens、Vicon、凌云光、诺亦腾。 【风险提示】人形机器人产业发展不及预期、数据训练效果不及预期、运控算法迭代不及预期。 请务必仔细阅读报告尾部的投资评级说明和声明2 01人形机器人概述 录 NTS 02人形机器人运动控制 CONTENTS 录 目 03相关企业 04投资建议 05风险提示 人形机器人行业概述 定义:人形机器人,又称仿人机器人或类人机器人,是指具有仿人的形态和功能的机器人,具备一定的感知、学习和认知能力。 特征: 高度仿人的外形结构:拥有与人类相似的躯干、四肢和头部。腰部灵活,可轻松实现转身、弯腰等动作。手臂的肩部、肘部和腕部关节活动范围大,能完成复杂的伸展、抓取和操作任务;腿部的膝关节和踝关节使机器人能够稳健行走,步伐节奏与人类相近。手部通常具有多个灵活的手指,可实现精细的抓握动作。 强大的环境感知能力:配备多种先进的传感器,包括视觉、听觉、触觉等,能够全面感知周围环境信息。 智能决策与学习能力:借助计算机科学和人工智能技术,它们能够对感知到的大量环境信息进行快速分析和处理。当面对复杂的任务时,人形机器人会根据预设的算法和模型,结合实时的环境信息,制定出最优的行动方案。它们还能通过机器学习算法,从过往的经验中吸取教训,不断优化自己的行为。 应用场景:当前人形机器人主要应用于医疗护理、家庭服务、教育娱乐、工业生产和公共服务等领域中,替代人类完成危险或重复性高的工作,进一步释放劳动力,提高社会生产力。 图表:人形机器人在家庭和制造领域的应用图表:人形机器人在应急领域的典型应用 人形机器人产业面临的挑战 技术挑战: 数据采集与标注复杂且成本高昂:特别是人类动作数据的收集,需要高精度的传感器和专业的标注团队来确保数据准确性。 多模态信息融合鲁棒性与实时性不足:将视觉、听觉、触觉等多种信息有效融合以形成统一的环境认知,在鲁棒性和实时性方面仍有不足,尤其在复杂多变环境中,机器人难以准确理解和应对变化。 自主学习与适应性不足:现有机器人虽能进行一定程度的自主学习,但在处理未知或复杂任务时,适应性和泛化能力不足。需要更有效的学习算法以从少量样本中快速学习并适应新环境。 学习过程中的安全问题:需要确保机器人在学习过程中不会产生偏差或做出有害行为。 能源效率与续航能力:尽管电动驱动系统有所改进,但如何进一步降低能耗、延长工作时间仍是亟待解决的问题。 市场挑战:成本高昂、应用场景不明确、相关的法规政策有待完善、社会接受度有待提高。 目前国内智能感知和运动控制等核心关键技术仍与国际存在较大差距,核心零部件尚不能完全自主生产。 图表:人形机器人发展阶段图表:人形机器人相关专利分布情况 01人形机器人行业概述 录 NTS 02人形机器人运动控制 CONTENTS 录 目 03相关企业 04投资建议 05风险提示 人形机器人技术框架及软件架构 技术框架: a)硬件层:机械结构(手臂、头部、腿部)、动力系统(伺服电机、液压)、传感器等。 b)算法/软件层:运动控制(通信、操作系统、控制器)、环境感知(触觉、GPS、视觉)。 软件架构: a)操作系统层:RTOS进行精密、及时的运动控制,处理高频传感器输入、协调多关节同步。开源框架ROS提供工具、库和组件间通信,实现通信、控制、感知。 b)通信方案层:高性能工业以太网协议EtherCAT(主从式架构),实现了低延迟(微秒级刷新率)、分布式时钟同步(实现精确协调运 动)、高可扩展性(支持数百设备)。 c)硬件接口层:传感器节点(提供输入数据)、执行器(接收控制指令并执行)。 图表:人形机器人技术框架 图表:人形机器人软件架构 人形机器人运动控制系统框架 运动控制是人形机器人能够在复杂环境中灵活移动的基础。人形机器人运动控制系统一般可分为硬件和软件算法两部分。 硬件部分:主要包括控制器、伺服驱动器和传感器。 控制器:运动控制的核心部件,负责协调机器人的运动。 驱动器:作为执行部件,负责接收控制器的指令并驱动机器人的运动。 传感器:在运动控制中起到关键作用,它们负责监测机器人的运动状态和环境信息。 软件算法部分:历经迭代,1)基于模型的控制算法;2)MPC+WBC融合控制;3)强化学习和模仿学习等AI技术引入。 图表:人形机器人运动控制系统框架 人形机器人运动控制的典型方法 运动控制分类:人形机器人的运动控制领域可以分为基于模型的控制方法和基于学习的控制方法,每种方法都有其独特的优势,解决不同的控制 问题。 基于模型的运动控制方法:核心是平衡控制器,平衡控制器接收机器人的状态和用户的命令,以控制机器人的平衡。电机控制器将平衡控制器的输出动作转换为位置或扭矩,以控制机器人。基于模型的方法具有高可解释性等独特优势,但它们主要依赖于准确的建模和手动参数调整,这使得在多刚体规划和控制中优化变得复杂。 基于学习的运动控制方法:是指利用数据驱动技术使机器人能够从经验中学习运动策略。基于学习的方法特别适用于传统模型可能难以捕捉与未结构化或不可预测地形互动复杂性的环境。 模型预测控制 (MPC) 基于模型的方法 全身控制 (WBC) … 运动控制方法论 强化学习(RL) 基于学习的方法 模仿学习(IL) … 固有不稳定性 人形结构,依赖间歇足部支撑,稳定裕度小。 高自由度(DOF)多达20-40+个关 运动控制 核心挑战 协同 节,运动学/动力 学耦合复杂。 动态环境适应 地面不平、任务/负载变化、人机交互等扰动。 实时性要求 快速响应以维持 平衡和执行任务。 图表:机器人运动控制的分类图表:运动控制的核心挑战 基于模型的运动控制:核心思想与基本框架 核心思想:通过建立机器人的运动学和动力学模型,进行运动轨迹规划和平衡控制,特点是身体控制稳健,步频较慢。 基本框架: 输入:用户指令,包含位置指令、速度指令、参考轨迹。 核心:平衡控制器(BalanceController),包含稳定性判据、质心规划、HZD/MPC等先进控制策略。 输出:期望的关节动作(位置/速度/力矩)。 执行:电机控制器(MotorController)将期望的关节动作转换为底层电机指令。 图表:基于模型的运动控制框架 基于模型的运动控制:稳定性判据 稳定性判据(StabilityCriteria):定义了机器人在执行运动或与环境交互时如何维持平衡和避免跌倒的标准和方法。 核心思想:将复杂的机器人动态平衡问题简化为一些可测量、可计算或可控制的指标。通过监控这些指标是否在安全范围内,或者通过控制策略 主动使这些指标保持在安全范围内,来实现机器人的稳定运动。 常见稳定性判据: 零力矩点(ZeroMomentPoint-ZMP):物体所受重力与惯性力的合力的延长线与支撑面的交点。如果ZMP始终保持在机器人的支撑多边形 (通常是脚底形成的区域)内部,机器人就能在动态过程中保持平衡。 捕获点(CapturePoint)/捕获区域:如果机器人从当前状态开始不再施加任何额外的控制力(例如,关节力矩保持不变或为零),机器人质心(CoM)的水平投影最终会停止的点。如果捕获点在支撑区域之外,机器人将会跌倒。控制器通过调整落脚点或身体姿态,使捕获点始终保持在未来的支撑区域内。 图表:基于ZMP判据的运动控制图表:基于捕获区域的推力恢复迈步策略 基于模型的运动控制:模型预测控制 原理:模型预测控制(ModelPredictiveControl,MPC)使用机器人系统的动力学模型来预测机器人在未来有限时间范围内的行为,并通过优化一 个目标函数来计算当前的最优控制输入。 模型预测:通过测量机器人的状态(如机身位置、速度和角速度),结合机器人动力学模型,预测出一个时间序列内的机身状态。 优化求解:将一个时间序列内的参考状态与实际测量值输入优化求解器,并结合约束条件,求得一段时间内的控制指令。 实时控制:选取第一个控制指令作为期望的末端接触力与力矩,再输入到下一个控制模块中。 应用:MPC早期用于在线步行模式生成,以提高对干扰和用户命令的响应能力;DARPA机器人挑战赛后,MPC主要用于在线轨迹生成以及全身 控制。人形机器人平台如HRP系列、Atlas、TORO、TALOS、E2-DR等。 优点:可以在非线性域中生成轨迹,充分利用运动学可动范围和扭矩极限;通过频繁地根据当前状态重新规划运动,使机器人对扰动更具鲁棒性。 缺点: 高计算复杂度、实时性不足:非线性MPC需在短采样时间内求解复杂NLP问题,计算量大;通用求解器和SQP方法难以满足实时需求。 模型依赖性强:性能依赖动态模型准确性,模型误差易降低