行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

人形机器人行业专题报告：人形机器人赛道深度之运动控制，制约商业化落地进程的关键环节

机械设备2025-06-24西部证券坚***

AI智能总结

人形机器人运动控制是人形机器人能够在复杂环境中灵活移动的基础，也是制约其商业化落地进程的关键环节。人形机器人运动控制系统一般可分为硬件和软件算法两部分。硬件部分主要包括控制器、伺服驱动器和传感器；软件算法部分历经迭代，包括基于模型的控制算法（如模型预测控制MPC和全身控制WBC）和基于学习的控制方法（如强化学习RL和模仿学习IL）。

基于模型的运动控制方法核心是平衡控制器，通过建立机器人的运动学和动力学模型进行运动轨迹规划和平衡控制，特点是身体控制稳健，步频较慢。主要方法包括：

稳定性判据：如零力矩点ZMP和捕获点，用于定义机器人在执行运动或与环境交互时如何维持平衡和避免跌倒的标准和方法。
模型预测控制MPC：使用机器人系统的动力学模型预测未来行为，并通过优化目标函数计算当前最优控制输入，主要用于在线步行模式生成和在线轨迹生成。
全身控制WBC：协调机器人多自由度的全身运动，在多任务和复杂约束条件下完成高效、鲁棒的控制，通常接收MPC输出的操作空间任务。

基于学习的运动控制方法是指利用数据驱动技术使机器人能够从经验中学习运动策略，特别适用于传统模型可能难以捕捉与未结构化或不可预测地形互动复杂性的环境。主要方法包括：

强化学习RL：通过与环境交互、根据奖励和惩罚信号自主学习运动技能，特别适用于复杂全身运动协调和特定任务微调，但存在Sim-to-Real差距、奖励函数设计困难、样本效率低下等问题。
模仿学习IL：从专家演示中训练策略，包括行为克隆BC、动作分块ACT、扩散策略、逆强化学习IRL等，特别适用于学习复杂技能，但存在机器人经验数据稀缺、泛化受限等问题。
混合学习：结合RL和IL或基于模型的方法和学习方法，如RL教师-IL学生范式、IL预训练-RL微调、轨迹参考跟踪学习、轨迹参考增强学习等，旨在利用各自优势实现更有效的模拟到现实的转移。

人形机器人运动控制领域主要厂商包括特斯拉、图灵AI、1XTechnologies、智元机器人、波士顿动力、宇树科技等。特斯拉Optimus采用纯视觉方案和端到端神经网络实现机器人任务处理，并建立AI计算集群Cortex和研发专用芯片Dojo；图灵AI推出通用的视觉-语言-动作（VLA）模型Helix，实现全身控制、多机器人协作和基于自然语言提示的任务执行；1XTechnologies的NEO机器人采用强化学习和海量人体动作数据训练，实现自然行走和操作；智元机器人推出AgiBotDigitalWorld大型仿真框架，为机器人技术提供高保真模拟与数据支持；波士顿动力Atlas通过MPC与扩展动力学模型实现机器人本体与外部物体的动态协同优化；宇树科技推出H1/H1-2、G1等系列产品，采用自研高性能电机直驱和AI驱动的运动控制与智能化。

投资建议关注受益环节及标的：运控系统（固高科技、雷赛智能）、软件及仿真工具（NVIDIAIsaacSim、PyBullet、Gazebo）、动作捕捉设备（Xsens、Vicon、凌云光、诺亦腾）。

风险提示：人形机器人产业发展不及预期、数据训练效果不及预期、运控算法迭代不及预期。

人形机器人行业专题报告：人形机器人赛道深度之运动控制，制约商业化落地进程的关键环节

人形机器人运动控制相关企业投资建议0203风险提示0405 CONTENTS目录CONTENTS目录 定义：人形机器人，又称仿人机器人或类人机器人，是指具有仿人的形态和功能的机器人，具备一定的感知、学习和认知能力。高度仿人的外形结构：拥有与人类相似的躯干、四肢和头部。腰部灵活，可轻松实现转身、弯腰等动作。手臂的肩部、肘部和腕部关节活动范围大，能完成复杂的伸展、抓取和操作任务；腿部的膝关节和踝关节使机器人能够稳健行走，步伐节奏与人类相近。手部通常具有多个灵活的手指，可实现精细的抓握动作。强大的环境感知能力：配备多种先进的传感器，包括视觉、听觉、触觉等，能够全面感知周围环境信息。智能决策与学习能力：借助计算机科学和人工智能技术，它们能够对感知到的大量环境信息进行快速分析和处理。当面对复杂的任务时，人形机器人会根据预设的算法和模型，结合实时的环境信息，制定出最优的行动方案。它们还能通过机器学习算法，从过往的经验中吸取教训，不断优化自己的行为。应用场景：当前人形机器人主要应用于医疗护理、家庭服务、教育娱乐、工业生产和公共服务等领域中，替代人类完成危险或重复性高的工作，进一步释放劳动力，提高社会生产力。资料来源：徐程浩《人形机器人技术与产业发展研究》、茶派科技、IT之家、中国机器人网、人形机器人场景应用联盟公众号、西部证券研发中心人形机器人行业概述图表：人形机器人在家庭和制造领域的应用请务必仔细阅读报告尾部的投资评级说明和声明图表：人形机器人在应急领域的典型应用 特征： 4 技术挑战：数据采集与标注复杂且成本高昂：特别是人类动作数据的收集，需要高精度的传感器和专业的标注团队来确保数据准确性。多模态信息融合鲁棒性与实时性不足：将视觉、听觉、触觉等多种信息有效融合以形成统一的环境认知，在鲁棒性和实时性方面仍有不足，尤其在复杂多变环境中，机器人难以准确理解和应对变化。自主学习与适应性不足：现有机器人虽能进行一定程度的自主学习，但在处理未知或复杂任务时，适应性和泛化能力不足。需要更有效的学习算法以从少量样本中快速学习并适应新环境。学习过程中的安全问题：需要确保机器人在学习过程中不会产生偏差或做出有害行为。能源效率与续航能力：尽管电动驱动系统有所改进，但如何进一步降低能耗、延长工作时间仍是亟待解决的问题。市场挑战：成本高昂、应用场景不明确、相关的法规政策有待完善、社会接受度有待提高。目前国内智能感知和运动控制等核心关键技术仍与国际存在较大差距，核心零部件尚不能完全自主生产。资料来源：徐程浩《人形机器人技术与产业发展研究》、痛点设计公众号、机器人大讲堂公众号、西部证券研发中心人形机器人产业面临的挑战图表：人形机器人发展阶段请务必仔细阅读报告尾部的投资评级说明和声明图表：人形机器人相关专利分布情况 5 人形机器人运动控制相关企业投资建议010203人形机器人行业概述风险提示0405 CONTENTS目录CONTENTS目录 技术框架：a)硬件层：机械结构（手臂、头部、腿部）、动力系统（伺服电机、液压）、传感器等。b)算法/软件层：运动控制（通信、操作系统、控制器）、环境感知（触觉、GPS、视觉）。软件架构：a)操作系统层：RTOS进行精密、及时的运动控制，处理高频传感器输入、协调多关节同步。开源框架ROS提供工具、库和组件间通信，实现通信、控制、感知。b)通信方案层：高性能工业以太网协议EtherCAT（主从式架构），实现了低延迟（微秒级刷新率）、分布式时钟同步（实现精确协调运动）、高可扩展性（支持数百设备）。c)硬件接口层：传感器节点（提供输入数据）、执行器（接收控制指令并执行）。资料来源：《A Comprehensive Review of Humanoid Robots》、西部证券研发中心人形机器人技术框架及软件架构图表：人形机器人技术框架图表：人形机器人软件架构请务必仔细阅读报告尾部的投资评级说明和声明运动控制是人形机器人能够在复杂环境中灵活移动的基础。人形机器人运动控制系统一般可分为硬件和软件算法两部分。硬件部分：主要包括控制器、伺服驱动器和传感器。控制器：运动控制的核心部件，负责协调机器人的运动。驱动器：作为执行部件，负责接收控制器的指令并驱动机器人的运动。传感器：在运动控制中起到关键作用，它们负责监测机器人的运动状态和环境信息。软件算法部分：历经迭代，1）基于模型的控制算法；2）MPC+WBC融合控制；3）强化学习和模仿学习等AI技术引入。资料来源：劢的科技公众号、《Highly Dynamic Quadruped Locomotion via Whole-Body Impulse Control and Model Predictive Control》、创业邦、西部证券研发中心人形机器人运动控制系统框架图表：人形机器人运动控制系统框架请务必仔细阅读报告尾部的投资评级说明和声明 运动控制分类：人形机器人的运动控制领域可以分为基于模型的控制方法和基于学习的控制方法，每种方法都有其独特的优势，解决不同的控制基于模型的运动控制方法：核心是平衡控制器，平衡控制器接收机器人的状态和用户的命令，以控制机器人的平衡。电机控制器将平衡控制器的输出动作转换为位置或扭矩，以控制机器人。基于模型的方法具有高可解释性等独特优势，但它们主要依赖于准确的建模和手动参数调整，这使得在多刚体规划和控制中优化变得复杂。基于学习的运动控制方法：是指利用数据驱动技术使机器人能够从经验中学习运动策略。基于学习的方法特别适用于传统模型可能难以捕捉与未结构化或不可预测地形互动复杂性的环境。资料来源：人形机器人产业通公众号、《A Comprehensive Review of Humanoid Robots》、西部证券研发中心人形机器人运动控制的典型方法图表：机器人运动控制的分类运动控制方法论基于模型的方法模型预测控制(MPC)全身控制(WBC)…基于学习的方法强化学习(RL)模仿学习(IL)… 请务必仔细阅读报告尾部的投资评级说明和声明问题。图表：运动控制的核心挑战运动控制核心挑战固有不稳定性人形结构，依赖间歇足部支撑，稳定裕度小。高自由度(DOF)协同多达20-40+个关节，运动学/动力学耦合复杂。动态环境适应地面不平、任务/负载变化、人机交互等扰动。实时性要求快速响应以维持平衡和执行任务。 9 核心思想：通过建立机器人的运动学和动力学模型，进行运动轨迹规划和平衡控制，特点是身体控制稳健，步频较慢。基本框架：输入：用户指令，包含位置指令、速度指令、参考轨迹。核心：平衡控制器(BalanceController)，包含稳定性判据、质心规划、HZD/MPC等先进控制策略。输出：期望的关节动作（位置/速度/力矩）。执行：电机控制器(MotorController)将期望的关节动作转换为底层电机指令。资料来源：《A Comprehensive Review of Humanoid Robots》、中国信通院《人形机器人产业发展研究报告(2024年)》、西部证券研发中心基于模型的运动控制：核心思想与基本框架图表：基于模型的运动控制框架请务必仔细阅读报告尾部的投资评级说明和声明 稳定性判据(StabilityCriteria)：定义了机器人在执行运动或与环境交互时如何维持平衡和避免跌倒的标准和方法。核心思想：将复杂的机器人动态平衡问题简化为一些可测量、可计算或可控制的指标。通过监控这些指标是否在安全范围内，或者通过控制策略主动使这些指标保持在安全范围内，来实现机器人的稳定运动。常见稳定性判据：零力矩点(ZeroMomentPoint-ZMP)：物体所受重力与惯性力的合力的延长线与支撑面的交点。如果ZMP始终保持在机器人的支撑多边形（通常是脚底形成的区域）内部，机器人就能在动态过程中保持平衡。捕获点(CapturePoint)/捕获区域：如果机器人从当前状态开始不再施加任何额外的控制力（例如，关节力矩保持不变或为零），机器人质心(CoM)的水平投影最终会停止的点。如果捕获点在支撑区域之外，机器人将会跌倒。控制器通过调整落脚点或身体姿态，使捕获点始终保持在未来的支撑区域内。资料来源：《A Comprehensive Review of Humanoid Robots》、杨东超《基于ZMP的拟人机器人步态规划》、《Capture Point: A Step toward Humanoid Push Recovery》、熊蓉《人形机器人研究进展与发展挑战》、西部证券研发中心基于模型的运动控制：稳定性判据图表：基于ZMP判据的运动控制请务必仔细阅读报告尾部的投资评级说明和声明图表：基于捕获区域的推力恢复迈步策略 11 原理：模型预测控制(ModelPredictive Control,MPC)使用机器人系统的动力学模型来预测机器人在未来有限时间范围内的行为，并通过优化一个目标函数来计算当前的最优控制输入。模型预测：通过测量机器人的状态（如机身位置、速度和角速度），结合机器人动力学模型，预测出一个时间序列内的机身状态。优化求解：将一个时间序列内的参考状态与实际测量值输入优化求解器，并结合约束条件，求得一段时间内的控制指令。实时控制：选取第一个控制指令作为期望的末端接触力与力矩，再输入到下一个控制模块中。应用：MPC早期用于在线步行模式生成，以提高对干扰和用户命令的响应能力；DARPA机器人挑战赛后，MPC主要用于在线轨迹生成以及全身控制。人形机器人平台如HRP系列、Atlas、TORO、TALOS、E2-DR等。优点：可以在非线性域中生成轨迹，充分利用运动学可动范围和扭矩极限；通过频繁地根据当前状态重新规划运动，使机器人对扰动更具鲁棒性。高计算复杂度、实时性不足：非线性MPC需在短采样时间内求解复杂NLP问题，计算量大；通用求解器和SQP方法难以满足实时需求。模型依赖性强：性能依赖动态模型准确性，模型误差易降低控制精度。资料来源：OpenLoong开源社区公众号、《Model predictive control of legged and humanoid robots: models and algorithms》、《Design and Implementation of ModelPredictive Control for a Gyroscopic Inverted Pendulum》、PAL Robotics官网、Boston Dynamics官网、西部证券研发中心基于模型的运动控制：模型预测控制图表：MPC的通用框图请务必仔细阅读报告尾部的投资评级说明和声明缺点：图表：基于MPC的人形机器人实例(TALOS,Atlas) 原理：全身控制(Whole-BodyControl,WBC)是一类产生关节力矩、约束力和广义加速度的控制器，以实现给定的一系列期望动态任务。建模系统动力学和约束：建立机器人的全阶Euler-Lagrangian动力学方程，该方程关于决策变量(广义加速度q̈、外部力λ和关节扭矩τ)是线性的；定义与环境之间的物理接触约束。定义动态任务：获得所需的机器人行为或目标(如跟踪关节加速度、避免碰撞等)，将其表达为关于决策变量(q̈,λ,τ)的线性方程。构建并解决控制问题：将系统动力学、接触约束和动态任务结合起来，形成一个数学问题来求解当前的决策变量(q̈,λ,τ)。有闭环形式方法和基于优化的方法。输出控制信号：输出计算得到的决策变量，发送到机器人的执行器，驱动关节运动。应用：通常接收MPC输出的操作空间任务(如质心/末端执行器轨迹)，也支持遥操作/VR界面生成动态任务(姿态、行走方向、抓取目标)。优点：通常采用线性化动力学方程，计算高效；闭环形式的WBC计算成本较低；基于优化的WBC增强了灵活性，可以模块化地添加和移除动态任务，并能有效地处理不等式约束(如关节限制、障碍物避免)。缺点：依赖模

点击免费查看完整报告

你可能感兴趣

人形机器人行业专题报告：人形机器人赛道深度之运动控制，制约商业化落地进程的关键环节

你可能感兴趣

人形机器人赛道深度之运动控制：制约商业化落地进程的关键环节

人形机器人行业专题报告：人形机器人赛道深度之减速器，减速增扭，需求倍增

运动控制行业研究：人形机器人“小脑”有望成为主赛道

人形机器人行业快评报告：人形机器人赛道融资火热，商业化进程持续推进

机械行业周报：华为、宁德等入局机器人，人形机器人商业化落地进程加速