您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[美国银行]:人形机器人101 - 发现报告

人形机器人101

机械设备2025-04-01美国银行任***
AI智能总结
查看更多
人形机器人101

人形机器人101 要点 •我们是否已经来到了人形机器人的时代?全球科技巨头们都已经开始研发人形机器人(HR),在如此重量级的支持下,美国银行全球研究认为,人形机器人将在本世纪末从概念验证阶段过渡到多行业应用。 •怎么?得益于1)全球人工智能的稳健发展;2)更先进的3D感知和控制技术;以及3)计算能力和机器人组件成本的下降,人形机器人开发可能会开始加速。 但在拥有与汽车一样多的人形机器人之前,让我们先了解未来的邻居机器人——它们与工业机器人有何不同,它们是由哪些部件组成的,它们可能的价格是多少,以及要实现大规模普及需要发生什么? 计算一下:人形机器人正在路上 人形机器人(HRs),在近年来取得了巨大的发展进步,这得益于人工智能技术的激增,尤其是大型语言模型(LLM)和视觉语言模型(VLM)的不断迭代。虽然科技巨头已开始研发人形机器人,但近年来其他人形机器人初创企业也加入了这场竞争,同时现有的工业机器人和汽车原始设备制造商(OEM)也参与了进来。在得到对发展人形机器人的支持并增加关注后,摩根大通全球研究认为,人形机器人有望在本十年末从概念验证迈向多行业应用,随着机器人设计的改进、应用范围的扩大以及越来越多的新进入者加入竞争。 但是什么是人形机器人?它是一种模仿人类行为和交互的服务机器人。它通常被设计用来取代在枯燥、危险和/或肮脏的工作环境中的人类劳动力,但与在高度结构化和统一环境中运行的工业机器人不同,人形机器人通常在具有高度不确定性的非结构化环境中工作。人形机器人的典型应用可能包括安全、医疗保健和仓库管理。它们也可以用于家庭应用程序,例如照顾老人或做家务(参见我们最近的文章,家务:当时间就是金钱时,关于此主题,请查看更多内容)。 但与其他类型的机器人相比,人形机器人通常面临更复杂的工作环境,这需要复杂的AI功能来支持它们的感知、运动控制和与人类的交互(图1)。它们也比典型的服务机器人具有更高的灵活性,通常具有>20个自由度(DoF,或解释机器人运动能力的方式)并且能够执行各种(通常是非结构化的)任务。这转化为对运动控制更高的要求,并限制了人形机器人的高度和重量。 机器人积木 典型人形机器人的结构可以分为三个主要层次:人工智能系统、运动控制系统和机器人body(附件2): •人工智能系统它是人形机器人的“大脑”,主要由人工智能芯片和人工智能算法组成。它负责高级信息处理和决策制定(包括任务分解、理解周围环境和模型推理等),以及与人类的互动。 •运动控制系统它是人形机器人的“小脑”,主要包括控制器和运动控制算法。它主要负责运动协调、身体平衡和路径导航。 •并且身体包含用于环境数据收集和执行运动的主要硬件,包括视觉系统、感觉系统、执行器、灵巧手、能源系统和结构材料。 控制系统 人形机器人的控制系统包括两层:一个负责高层控制(信息处理、决策)的人工智能系统,由人工智能芯片和人工智能算法支持;以及一个负责低层控制的运动控制系统,例如运动协调和身体平衡,由控制器和运动控制算法支持。 •芯片:在 humanoid 机器人 (HR) 中使用的芯片主要包括处理器芯片、控制芯片和总线管理芯片。其中,处理器芯片构成了 humanoid 机器人“大脑”的核心,主要用于模型推理和计算。目前,HR 处理器芯片的主流技术是 CPU(中央处理器)加上 GPU(图形处理器)的结构,这也是最成熟的技术。 •控制算法/具身人工智能:控制算法是机器人控制系统的核心,使机器人能够感知环境、处理大量传感器数据、实时决策和执行动作。人形机器人的传统控制算法在AI系统(“大脑”)和运动控制系统(“小脑”)之间采用分层方法。 另一方面,一些领先的人形机器人公司现在正迁移到端到端模型,该模型根据输入的感官数据(包括视觉、语言、力等)直接生成动作指令,无需复杂的中间处理步骤,并由单一神经网络实现。与分层方法相比,端到端模型的优势在于泛化能力强、效率更高以及特征工程要求较低。话说回来,它通常需要大量训练数据,这在短期内可能是一个瓶颈。 执行器模块 驱动系统是人形机器人运动控制的核心部件。可以采用电动、电液和气动驱动器,它们通过将能量转化为物理运动来驱动或控制系统中的组件。电液驱动器输出扭矩最大,但也最昂贵,并且存在油泄漏的风险。另一方面,气动驱动器成本较低,但精度和输出力也较低。电动驱动器由于其高精度、快速速度和合理的价格,已成为人形机器人的主流技术路线。 一个电动执行器包括一个用于运动控制的伺服驱动器、一个用于输出扭矩的伺服电机(通常是无框力矩电机)、一个用于将扭矩转换为所需用途的传动系统(旋转执行器使用谐波/行星减速器,线性执行器使用行星滚珠丝杠)、以及一个用于收集系统数据的传感系统(编码器和力矩/力传感器)。根据用途,电动执行器可以分为旋转执行器或线性执行器,用于机器人的旋转关节(颈部、肩部、手腕、肘部等)和线性关节(手臂、脚踝、膝盖等)。 灵巧的手 灵巧手是人形机器人的一个关键末端执行器,可以执行复杂和精细的任务,包括捡拾小物品和处理易碎物体。目前,不同人形机器人OEM厂商设计的灵巧手自由度(DoF)范围从6到42个,而人手有27个DoF。一般来说,一个6-DoF灵巧手设计可以支持人手60-70%的功能。 状态管理器 减速器是人形机器人、工业机器人和机床中使用的机械装置,用于降低电机或发动机的速度并增加输出扭矩。减速器主要有三种类型:行星减速器、谐波减速器和RV(旋转矢量)减速器。目前,主流人形机器人设计采用谐波减速器或行星减速器作为其旋转执行器。 行星滚珠螺杆 行星滚珠丝杠是用于直线执行器的具有高性能的机械元件,用于将伺服电机的旋转扭矩输出转换为线性运动。与滚珠丝杠相比,行星滚珠丝杠具有寿命更长、负载更高、传递效率更高和刚性更高的优点。因此,行星滚珠丝杠通常用于人形机器人、航空航天和重载荷机床行业。 无边框力矩电机 无框力矩电机是一种永磁电机。与传统电机相比,它仅由转子和定子组成,没有机架、外壳、轴、轴承或反馈系统,这消除了对齿轮或轴等机械传动部件的需求,通过磁力直接驱动负载。这可以在紧凑的结构内实现高转矩密度和高动态性能,因此通常用于对高转矩和低速性能要求关键的应用,例如机器人关节、医疗设备和航空航天系统。 感觉系统 人形机器人的感知识觉系统从周围环境收集数据,这些数据传输给运动控制模块以调整机器人的运动。它包括摄像头、激光雷达(光探测与测距)和多种类型的传感器。人形机器人中传感器的数量可能在30到200之间,具体取决于机器人的功能。 •视觉系统:人形机器人的视觉系统是一个复杂而智能的系统,它使用各种类型的相机和激光雷达来捕捉周围环境的视觉信息,从而增强了机器人的感知、导航和运动控制能力。主要技术包括立体相机、飞行时间(ToF)相机、结构光相机和激光雷达。 •力和力矩传感器:力传感器测量作用在物体上的力或压力,并将其转换为电信号以测量、控制和监控执行器。它主要用于线性执行器。同时,扭矩传感器测量作用在物体上的扭矩或旋转力。 •惯性测量单元(IMU):惯性测量单元(IMUs)用于人形机器人,以测量机器人的加速度、角速度和其他运动参数,这有助于机器人感知其自身的姿态和运动状态并维持身体平衡。除了人形机器人之外,惯性测量单元(IMUs)也用于消费电子、汽车和航空航天领域。 •触觉传感器:触觉传感器通常用于人形机器人的灵巧手中(每个机器人通常有10个单元,每个手指一个),测量传感器与物体之间的力和压力。它模拟了人类手指中的感受器,这些感受器是人类皮肤的重要组成部分。 机器人:仍在处理 在所有主要人形机器人组件中,博富全球研究认为,人工智能芯片、无框力矩电机、无核心电机和电池在技术路线方面将具有较强的确定性。然而,考虑到人形机器人发展仍处于初创阶段,其他组件的设计或选择在未来几年内可能会发生重大变化。潜在的变化主要包括: •线性执行器的使用一些类人机器人设计可能采用全旋转执行器方案,不使用线性执行器。此外,一些类人机器人有潜力使用滚珠丝杠替代行星滚柱丝杠以降低成本。 •谐波减速器与行星减速器:行星减速器通常比谐波减速器具有更高的抗冲击能力和更低的价格,因此一些人形机器人公司可以使用行星减速器来替换机器人腿中的谐波减速器。 •灵巧手设计:灵巧手的设计在未来几年内可能会发生重大变化,包括自由度的数量、传动系统的设计以及触觉传感器和电子皮肤的技术路线。 •传感器使用:传感器在 humanoid 机器人不同设计和应用功能中可能会有所不同。值得注意的是,受益于价格下降,6D 力和力矩传感器的渗透率在未来几年可能会增加,这将支持 humanoid 机器人的更好的感知功能。 •相机与激光雷达:一些拟人化机器人可能会采用全摄像头设计用于视觉系统,而另一些则可能使用深度摄像头和激光雷达的组合。一般来说,激光雷达在远距离测量方面表现更好,对阳光的鲁棒性更高,通常用于户外场景。 从零件到价格标签 需要注意的是,人形机器人目前还不是标准规格产品,因此难以预测其成本。据博亚全球研究在2025年3月估计,如果大部分组件在中国生产,到2025年底,典型人形机器人的物料清单(BOM)成本(或硬件成本)每台应约为35,000美元。这一估计基于以下假设:1)人形机器人使用16个旋转执行器和14个线性执行器;2)其旋转执行器使用谐波减速器;3)其线性执行器基于行星滚珠丝杠;4)其灵巧手有6个自由度;5)其视觉系统包括一个深度相机和一个激光雷达;以及6)人形机器人尽可能主要使用中国制造的组件以降低成本。 展望未来,美国银行全球研究预计,到2030-2035年,人形机器人的BOM成本将因规模经济和组件设计的改进降至每台13,000-17,000美元(图表4)。这相当于未来五年BOM成本下降超过50%,相当于年复合增长率约为14%。 隔壁的机器人:2060年实现30亿根据美国银行全球研究,人形机器人将在未来十年内因人口老龄化、劳动力短缺导致的需求增长、技术进步(尤其是人工智能和运动控 制)以及产品设计改进、BOM成本下降和终端应用拓展而实现强劲的出货量增长。 美银全球研究对拟人化机器人的长期需求持乐观态度,因为它们在家庭和服务应用中开始大规模采用。事实上,美银全球研究认为,到2025年全球拟人化机器人的出货量将达到18,000台。而且,在2030-2035年,他们预计拟人化机器人的年出货量将达到100万台(此前为40万台)/全球1000万台,这对应着2025-2035年的88%复合年均增长率。 然而,行业需求增长可能存在不确定性。一方面,在近期内,人形机器人公司优化其产品设计并扩大其终端应用仍需要时间。此外,在近期内,技术复杂性和生产成本仍然很高,并且关键组件(如行星滚珠丝杠)可能会面临近期的生产产能限制。 然而,尽管存在潜在挑战,美银全球研究认为,在接下来的十年里,人形机器人的采用将遵循一个三阶段发展轨迹,从工业和物流应用开始,然后转向商业服务,最后用于家用: •第一阶段——开发(2025-27)人形机器人将最初在结构良好或半结构化的环境中小批量使用,例如工业生产和物流,它们将主要用于物料搬运、组装、分拣和质量检查任务。这将帮助人形机器人积累现实世界数据,以便进行进一步培训和模型校准。一些人形机器人公司在过去一年中已经开始了现实世界的应用。 •第二阶段——商业应用的大规模推广(2028-2034):经过几年工业和物流应用的训练,人形机器人的设计和控制算法将得到显著提升。同时,人形机器人将越来越多地与大型语言模型整合,这将实现与人类的实时交互。随着设计和功能的改进,人形机器人在商业应用中将开始大规模普及,包括教育和商业服务。它们还可以在结构化程度较低的环境中进行工作,例如柔性制造和户外工程,所有这些都将支持每年超过100万台设备的出货量。 •第三阶段——全面普及(2035年起):仿人机器人将在高度非结构化的工作环境中实现大规模的通用应用,例如在家庭和老年服务领域。这得益于其功能完善,与人类交互流畅,以及生