您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [民生证券]:机械一周解一惑系列:具身智能时代各本体公司最新进展 - 发现报告

机械一周解一惑系列:具身智能时代各本体公司最新进展

机械设备 2025-03-24 李哲 民生证券 Cc
报告封面

本周关注:合锻智能、灿勤科技、恒立液压、中大力德、浙江荣泰 宇树科技:H1工业级机型(47kg航天材料+ 22关节动力)搭载360N・m电机及SLAM 3.2算法,实现15°斜坡跳跃±0.5N・m精准控制;G1通用平台通过43自由度关节、120N・m扭矩及ROS架构,以十万元级成本突破消费端。二者共享90%自研技术,依托四足技术迁移。央视春晚应用推动品牌指数激增50倍,标志人形机器人从实验室参数向生产力革命跨越。2025年3月12日,杭州宇树科技有限公司与上海同济大学签订《通用人形机器人训练平台设备采购合同》,采购合同金额为825.66万元,包含了10台宇树H1-2通用人形机器人(每台售价70万元)和高精度深度相机、激光雷达等8项价值125.66万元的零配件。 Figure AI:Helix模型是一种通用视觉-语言-动作(VLA)模型,采用“系统1+系统2”架构,实现高效的人形机器人控制。S1负责200Hz高频实时动作控制,S2则基于70亿参数进行7-9Hz的语义推理,二者协同工作,使机器人能够精准执行复杂任务。Helix具备出色的物体泛化能力,仅凭简单指令即可拾取多种物品,并支持多机器人零成本协作。BotQ制造工厂采用高效制造工艺,垂直整合供应链,并利用Helix赋能机器人参与生产,实现更高的自动化水平,预计可年产12000台机器人。Figure的目标是在未来四年内将供应链扩展到每年生产100,000台机器人或3,000,000个执行器的能力。 银河通用:GraspVLA模型完全基于十亿帧合成数据进行预训练,实现从模拟到现实(Sim2Real)的零样本迁移,展现出光照、背景、动态干扰等七大泛化能力。模型采用端到端学习,避免传统模块化方法的误差累积,同时通过少量真实数据的后训练,快速适应特定场景需求。该模型突破了传统依赖真实数据的瓶颈,显著降低成本,并实现“一人一天完成产品部署”的通用机器人落地愿景。 星动纪元:通用人形机器人星动STAR1基于原生通用具身智能体理念打造,即“原生机器人大模型”ERA-42协同“为AI打造的硬件平台”灵巧手XHAND1共同研发应用,使其人形机器人具备了卓越运动性能和学习能力,能够在复杂环境中执行多种任务,在多个领域展现出广泛的应用潜力,已达到国际先进水平。 小米:2025年2月小米SU7 Ultra上市,搭载三电机系统,最大马力1548PS,0-100km/h加速仅需1.98秒,配备赛道级电池包和碳陶制动系统。2025年2月27日,小米发布小米15 Ultra,代号“夜神”。2025年2月,小米取得两项机械手及机器人专利,灵巧手布局进一步深化。 小鹏汽车:2025年3月,小鹏推出2025款G6与G9。标配图灵AI智驾与5C超充AI电池,座舱升级并接入X-GPT大模型,基于800伏平台,全系后驱。小鹏Iron机器人亮相CES 2025,搭载自研芯片,拥有15个可动自由度,支持触控反馈的拟态双手,已在小鹏工厂实际应用。 投资建议:关注国产链、海外链本体机器人公司催化下,各零部件环节逐步受到市场认可的新锐公司,比如减速器领域中大力德、翔楼新材,丝杆领域浙江荣泰,组装总成公司恒立液压、领益智造、震裕科技。 风险提示:具身智能相关模型算法进步不及预期、机器人技术迭代路线出现变化。 1宇树科技 1.1宇树科技最大进展 1.1.1 H1机器人 2025年央视春晚的舞台上,宇树科技16台H1人形机器人以精准的机械美学演绎《秧BOT》群舞,其表演过程中实时投射的核心技术参数引发全民技术狂欢。这场由国家级舞台背书的技术曝光事件,不仅成功吸引大量观众对其技术细节的探究与讨论,更推动工业级人形机器人首次突破专业领域壁垒,在公众认知层面实现里程碑式跨越。 H1整机分为上半身和下半身,具备多个自由度。单手臂拥有4个自由度,包括身肩关节、肩关节、上臂关节和手肘关节。单腿拥有5个自由度,包括髋关节、挺节、腿关节、膝关节和踝关节。腰部具备1个自由度,即腰关节。整机共有19个自由度,由19个关节电机组。 图1:H1机器人架构图 作为技术突破的核心载体,H1机器人通过全栈自研架构重新定义工业级人形机器人的性能边界。在硬件架构层面,其采用航天级材料复合方案——碳纤维与7075航空铝的轻量化组合将整机质量控制在47kg量级,却支撑起22关节动力系统的极致输出。以关键膝关节组件为例,M107自研电机通过创新磁路设计实现360N·m峰值扭矩,配合双编码器+谐波减速器的精密传动体系,在连续动态运动中仍能将力位混合控制精度稳定在±0.5N·m范围内。这一突破性设计使其运动控制性能超越传统工业机械臂的刚性范式。 多维感知系统的深度融合进一步拓展了H1的场景适应性。基于大疆Livox Mid-360激光雷达与Intel RealSense D435i的异构传感方案,在宇树自研SLAM 3.2算法驱动下实现厘米级建图精度与复杂地形实时路径规划。这种技术特性直接转化为工业应用价值:在蔚来汽车的合肥工厂,H1机器人可以以极快的速度高效在生产线间精准搬运零部件, 技术迭代路径凸显产业化野心。H1的3.3m/s运动性能源于宇树四足机器人动力系统的拓扑优化,通过电机散热结构重构实现功率密度40%提升。这种从实验室到量产场景的技术迁移逻辑,正在智能制造、高危巡检等领域形成可复用的参数化落地范式。 在上述多种先进技术加持下,H1机器人倍受国内高校的青睐。2025年3月12日,杭州宇树科技有限公司与上海同济大学签订《通用人形机器人训练平台设备采购合同》,采购合同金额为825.66万元,包含了10台宇树H1-2通用人形机器人(每台售价70万元)和高精度深度相机、激光雷达等8项价值125.66万元的零配件。此前,清华大学、重庆大学、东南大学、华南理工大学、西湖大学、电子科技大学、上海大学、深圳大学、浙江理工大学、宁波大学等数十所知名高校均公开采购过宇树科技系列机器人产品。 1.1.2 G1机器人 图2:G1机器人 宇树G1机器人是一款高自由度人形机器人,其硬件设计以灵活运动为核心。 EDU版本提供23至43个自由度,关节采用高扭矩设计,核心关节最大扭矩达120N·m,搭配全行星减速器与齿轮传动系统,实现精准运动控制。机身集成深度相机与3D激光雷达,支持环境感知与自主导航;计算单元采用双系统架构,包括运控计算单元PC1(实时控制)与开发计算单元PC2,提供强大的实时运算与AI处理能力。 G1机器人基于分层软件架构,底层依托机器人操作系统(ROS)实现硬件抽象、通信与模块化开发。运动控制层通过动力学模型与强化学习算法(如OpenAI Gym框架)优化步态生成、平衡调节及避障能力;感知层融合多传感器数据,结合深度学习模型完成物体识别与环境建模。安全机制涵盖碰撞检测、急停功能及障碍物识别,确保交互安全性。通信协议采用ROS原生标准与DDS,保障各模块高效协同。 G1通过多关节协同旋转实现复杂动作,如步行、舞蹈及功夫表演,无需直线执行器(如丝杠),仅依赖电机协调与重心调节完成动态平衡。其仿生关节设计支持偏航、横滚等多轴自由度,踝关节独特关联结构进一步增强运动灵活性。应用层面,G1适配家庭服务、商业导览、科研开发等场景,支持云端数据同步与远程升级,未来可通过扩展模块实现安防、物流等多样化服务,代表高动态人形机器人的前沿探索。 1.1.3双足矩阵:技术同源下的产业化突破与场景重构 宇树科技2025年最新进展的核心逻辑,在于构建H1与G1双足机器人的技术同源矩阵。二者共享超90%自研率的电机、减速器技术,其运动控制算法直接继承自四足机器人Go4的百万公里路测数据库。H1的3.3m/s奔跑速度世界纪录,正是基于Go4电机散热结构优化实现的功率密度40%提升,而G1的720°回旋踢动作则完全复用H1春晚舞蹈的强化学习框架。这种"技术升维研发+产业降维落地"的双轨策略,推动产品矩阵实现场景分化。 正如创始人王兴兴所述:"当H1的参数超越博尔特速度,当G1的成本击穿十万元门槛,机器人正在从技术参数表走向生产力革命。"宇树科技通过官网实时更新的142项技术参数与可溯源的实测数据,构建起"硬核参数驱动场景"的新范式——从春晚的技术秀场到高校的实验室,从工业流水线到教育开放平台,双足机器人矩阵正在重新定义中国智能制造的技术坐标与产业边界。 1.2宇树科技合作公司 3月5日晚间,宝通科技发布投资者关系活动记录表公告称,将与宇树科技开展合作,合同已经进入签约流程,除了明确采购合作的型号,也就机器人在工业场景联合开发及应用项目达成一致意见。 宝通科技作为工业物料输送解决方案提供商,与宇树科技合作旨在推动工业机器人技术的创新与落地,助力工业智能化转型。合作内容涉及机器人在工业场景的落地应用,如矿山开采、金属冶炼、水泥建材、码头转运等。宝通科技表示公司不是简单的采购,而是共同研发,提供行业解决方案。 2 Figure 2.1 Figure AI:Helix模型和BotQ制造工厂 2.1.1 Helix概述 2025年2月20日,Figure正式发布Helix模型,这是一种通用的视觉-语言-动作(VLA)模型,主要实现了以下几个方面的突破:1.上半身的完全控制;2. 多机器人协作;3.捡起未遇到过的任何东西;4.通过一组神经网络学习行为;5.在嵌入式低功耗GPU上运行,具备商用条件。 2.1.2模型架构:双系统协同的端到端模型 Hliex采用“系统1+系统2”架构的VLA模型,解决了VLM主干是通用但不是快速的,机器人视觉策略是快速的但不通用的权衡问题,使得机器人模型的通用性和实时性得到了兼容。具体而言,系统1(S1)是一种快速反应性视觉运动策略,能够以200Hz高频输出完整的上半身人形控制,包括所需的手腕姿势、手指屈曲和外展控制,以及躯干和头部方向目标。系统2(S2)是一个基于70亿参数的VLM模型,以7-9Hz频率解析自然语言指令与场景语义,生成高层任务目标。 双系统分别运行于独立GPU,S2专注于深度语义推理,S1保障实时控制需求。 这种解耦架构使得每个系统能在其最佳时间尺度上运行。在实际运行过程中,S2可以“慢思考”高层次目标,接受语音命令,处理视觉信息,将相关信息生成一个潜在语义向量,通过共享内存以7-9Hz的频率传递给S1。S1可以实现实时控制的“快反应”功能,以200Hz的频率将S2的语义表征转化为精确、连续的机器人动作,同时可以在保持S2语义目标不变的前提下调整行动。 图3:Helix双系统S1、S2 在训练过程中,Helix的双系统VLA模型有出色表现。Figure仅用500小时高质量监督数据来训练Helix,这只是以前收集的VLA数据集大小的一小部分(<5%)。在小部分数据训练的情况下,Helix仍能实现全上半身人形控制,并且具有高速、高维输出。根据训练结果和视频演示,在不基于任何事先演示或定制编程的情况下,配备Helix的Figure机器人表现出很强的物体泛化能力,只需通过简单的“捡起”命令,就可以拾取数千种形状、大小、颜色和材料特性各不相同的家居用品,这减少了训练机器人行为的时间和金钱成本,对机器人在家庭中的应用有重要意义。 图4:配备Helix模型的Figure机器人拾取物品 此外,Helix模型也能在互联网级的语言理解和精确的机器人控制之间架起桥梁。根据Figure公布的视频显示,当提示“捡起沙漠物品”时,Helix不仅能识别出玩具仙人掌符合这个抽象的概念,还能选择最近的手执行精确的运动命令。 图5:配备Helix模型的Figure机器人识别抽象概念 2.1.3零成本多机器人协调 Helix是首款可以在人形机器人上协同运行的AI模型,使得两台机器人可以协作解决一个共享的、长期的操作任务。Helix采用单一神经网络权重集支持多机器人协作,所有机器人共享同一组模型参数(S2使用70亿参数,S1使用8千万参数),确保行为逻辑的一致性,每个机器人配备独立的嵌入式GPU,分别运行S1和