
人形机器人发展高峰论坛要点20230706 工信部评人形机器人发展 十四五规划纲要指出,在前沿科技和产业变革领域谋划布局一批未来产业。人形机器人是人工智能、集成电路、新材料、先进制造等前沿技术系统集成的产品,是未来产业发展的重要方向之一。工业和信息化部高度的重视人形机器人的产业发展,加强政策引导,印发了十四五机器人产业发展规划机器人加应用行动实施方案等文件,创建了机器人智能传感器等国家制造业创新中心,推动了关键的零部件、软件等共性技术的供给以及示范应用。 人形机器人发展高峰论坛要点20230706 工信部评人形机器人发展 十四五规划纲要指出,在前沿科技和产业变革领域谋划布局一批未来产业。人形机器人是人工智能、集成电路、新材料、先进制造等前沿技术系统集成的产品,是未来产业发展的重要方向之一。工业和信息化部高度的重视人形机器人的产业发展,加强政策引导,印发了十四五机器人产业发展规划机器人加应用行动实施方案等文件,创建了机器人智能传感器等国家制造业创新中心,推动了关键的零部件、软件等共性技术的供给以及示范应用。组织成立了人形机器人的专家组,编制了人形机器人制造业技术创新体系,系统梳理了人形机器人的技术产业链。 在各界的共同努力下,我国机器人产业规模以具全球的首位基础的核心技术持续取得突破,人工智能进入了全球的第一梯队,这些都为人形机器人的产业发展奠定了坚实的基础。人形机器人是重要的新赛道之一,蕴藏着巨大的发展的空间和无限的机遇。工业和信息化部把人形机器人作为培育未来产业发展的重要方向,坚持应用牵引、整机拉动、软件协同、生态培育的工程化路径,充分发挥我国的超大规模市场优势,统筹资源力量,加快推进人形机器人的创新发展。 一是加强系统谋划和政策布局。加快研究制定人形机器人产业发展行动计划,明确发展目标和主攻的方向,结合我国发展的基础和特色优势,找准工作的着力点,系统的谋划人形机器人的发展的重点任务。二是要加快关键核心技术补短断长,加强布省协同,加快布局人形机器人的国家制造业创新中心,用好相关的国家实验室、高校、科研机构以及企业的创新中心、研发中心等等战略科技力量,突破相关的例如像基础材料、传感器、智能系统、液压控制等等关键的核心技术,把握通用人工智能发展的机遇,提升人形机器人的智能化水平。 上海智能机器人发展情况及战略 三是以场景牵引来打造产业生态,开发人形机器人的应用需求,拉动人形机器人在安防、制造业、公共服务等领域的深度应用,加快推进产业化落地,培育生态型的领军企业和专精特新的中小企业,构建产业链上下游协同、大中小企业融通的产业生态。四是深化产业创新的国际合作。坚持开放合作、国际视野,用好世界机器人大会、世界机器人合作组织等等国际化的产业交流的平台,持续深化全球人形机器人的产业创新发展。 机器人是先进制造、先进装备与新一代信息技术融合的前沿产业,被誉为制造业皇冠上的明珠,上海紧紧围绕中央、国务院的部署,牢牢把握产业发展的趋势,结合人工智能高地建设,加快推动智能机器人的布局和发展。一是在技术端加快创新突破,促进大中小企业、高等院院校以及研究机构联合创新,建设人形机器人制造业创新中心等相关的平台,协同长三角打造自主可控机器人产业链。本届人工智能大会有20多款智能机器人亮相。二是在产业端加快企业的集聚,支持国际机器人领军企业在上海持续布局投产,本土的机器人龙头企业不断的成长壮大。目前上海工业机器人产量居国内城市的首位,规上工业企业的机器人密度达到每万人260台,达到国际平均水平的两倍以上。三是在应用端加快示范推广。落实工信部等部门提出的机器人应用行动,发布首批智能机器人标杆企业与应用场景,41家企业、52个场景都入选。支持机器人在工业、医疗、建筑、商业、应急等领域加快落地应用。面向未来,上海将牢牢把握新一轮科技革命和产业变革的趋势,把握通用人工智能发展的重要 的机遇,深耕人形机器人新领域、新赛道,打响机器人产业的上海品牌。上海将持续推动技术自主创新,通过首台突破人工智能等专项支持政策,促进产业链上下游的集聚,支持机器人本体、伺服电机等一些关键技术的攻关。 受人启发机器人系统和通用人形机器人 上海大力实施制造业高质量发展智能终端产业的三年行动计划,加快建设上海机器人产业园、张江机器人谷等一些特色产业园区。上海已经布局了若干个着眼于机器人特色的产业园区,力争到2025年打造10家行业一流的机器人头部品牌,形成1000亿元以上的机器人关联产业的规模。 人形机器人需要做的三个原因。第一个原因就是如果不应对的话,那么我们国家工业机器人的劳动力的优势、成本优势就受到了冲击。第二个在国防领域里面,像士兵机器人,实际上是一个新的装备,所以也是非常重要。第三个人形机器人牵扯到非常多的相关领域,如果现在不做的话,就会影响新的赛道对我们国家的机器人软硬件发展的一个刺激。除此之外ChatGPT实际上也做了通用机器人大模型,这个PaLM-E实际上相当于把文本图像,还把机器人的状态、机器人的任务放进去,就相当于这个机器人可以和人非常自然的互动。 我们在做的人形机器人分为五个部分:第一个部分,就是软硬件一体化,软硬件一体化,实际上后面会形成一个硬件系统和一个软件的部分。第二部分,触觉和视觉的融合,包含人机交互这个部分都积累到这个工作里,。那么在这个工作里面我们又做到了VLN(Vision-LanguageNavigation),和VLM(Vision-LanguageManipulation),第三部分,我们从里面往外开始研究人的这个神经机制是怎么的,人的肌肉是怎么的,人为什么有这样的通用性?人又为什么这样省能量,这是研究基础。 要将人模型化做相关的功能,需要理解人体神经与肌肉的协同,人体的感认知在腹背侧通路,人体的决策以及情绪跟前额叶与杏仁核有关,基底神经节控制人体的反映以及与皮层小脑一起实现肌肉协同,最后面一部分人体的肌肉和电机也不同,这样一个系统如果模拟出来按理说是能够实现高精度的,而它整个又能够泛化,比现在机器人的大模型还要做得更好。把高精度、高可靠这个机器人必须做到的事情和通用性结合,我认为才是我们做的人形机器人的目的。 我们前期的工作里面包含对于人的腹背侧通路的模拟,还有决策里面前额叶和杏仁核的模拟,以及神经素,就相当于人在不同的情况下,它的反应的激素水平是不同的和习惯动作等等。进行一系列模拟以及后面对肌肉骨骼系统模拟,在仿真环境里面可以证明这样的系统确实可以实现,它的传感精度不高,本体精度也不高,但是它的作业精度很高。软的之外,做机器人的肯定要做硬的,所以一层层的在换材料,从气动的到一般的这种系统的,然后把摩擦系数尽量降下来了,然后又做了一版,这版就慢慢的有性能了,然后软的全部就是用URDF,相当于非常接近真实的系统,做了所有的仿真和控制。 之前说到一个部分就是我们的硬件系统和软件系统是要相通的。就是说我们在软的里面可以说得很好,很通用,但是硬的时候实际上是有难度的,是要CKN他们在做,第二部分就是我们重新做了这个机器人大模型,这个里面最大的特点就是前面是通用的,后面是精准的,要把连续系统放到这里面,不能完全用人工智能的这种离散系统来做 目前设计的机器人应用有与立信集团合作,他们需要这个这种机器人去做很多工作,目前在签合同,此外已经运用到国防领域与农业领域。 人形机器人仿生感知运动控制技术 我想在技术层面上介绍当前在运动控制方面的一些研究,首先关于人形机器人与一般机器人的不同有几个方面:一是它的本体紧凑,跟特斯拉那么细的腿,那么高的动力,能够牵滚翻后滚翻第二,尤其在这个驱动单元,它高动态的爆发力极强,一瞬间翻起来是难点。第三就是高动态的全身的运动规划,跟工业级也不一样,高动态是它最重要一个特征,接下来才进入到对机器人人性的期望。 从本体设计来看,从这张图片来看,搞工业机械也同样遇到了这些问题,但传统的问题主要是加工难度、体积大,而且密度不够高。那这个问题上,近期团队国内包括乐居、哈工大,还有很多团队都在研究。从这个电机来看,过去是一个定子转子,现在利用有效的空间双定子,它能量密度肯定大。第二,减速器摆线结构,一般我们的工业机型是一个线在接触,但高动态的时候力肯定不够,就研究多次、同时驱动这两个技术解决了,有可能在高能量密度方面有所突破 接下来在地图构建、人形在复杂的场景上,包括物理特性、空间特性都要研究,以及物体的感知,真正改变人形机智能化,可能要从神经的角度在发展它的感知、时空两个维度来进行变换,才提高它的速度和分辨率。 那么系统建模来看,过去我们是以这个关节来跟工业机械关节来控制,现在是全身运动控制,跳高,包括所有的动作跟全身动力学有关,在动力学建模方面就发生了根本性的变化,包括主动、柔顺、利位混合到拟人化的多重控制,这就是它发展的路线图。 释放潜力人形机器人软硬解耦的关键技术 我们从生理学角度建立了神经元的物理模型,这个建成那这件事情我觉得很有意义,真正面向人的神经反射,这个模型的机理建成在逐渐硬件化我认为未来就是数据经验、AI结合,再回到机器人,无论是服务机器人还是我们的人形机器人,GPT显得更为重要. 我们得出一个结论,就是原来软硬件耦合在一起的,通过这个非常强的这个动力学特性来控制的这个机器人像走上产业和工业界很很难,怎么来破解这个问题?就是两个途径,一个是控制降维,这个硬件超配就是目前我们正在做的,我们不断把机器人的这个关节和执行器和它的这个控制做得越来越精巧,越来越精确。第二个就是我们把它软硬进行解耦,我们换一个方式来解决这个问题。过去十年我们这个不管是阿特拉斯也好,包括国内我们做四足机器人,做双足机器人的模式基本都是这么一个常态,就软件工程师一直在等待,硬件工程师一直在维修。 第二个问题就是现在价格特别贵,按那个阿西莫,成本200多万美金美金,阿特拉斯博人动力的200多万美金,那么擎天柱现在发布目标多少钱?2.5万美金,就是最便宜的一个特斯拉的价格,相当于原来我们阿西莫和阿特拉斯的1/100。 那么怎么去实现?行业里有一个数据,把人形机器人擎天柱做了一个分解,现在最贵的是线性执行器,剩下就是电池、灵巧手等等这个这些,那么就有一个新的问题,我们怎么来降成本? 那我们是用传统的产业链降建成本,就是我们大规模化的规模制造,或者通过增材制造一些新的工艺,这是一种路径。 第二个就是产业基础再造,就是我们再造一个新的产业。我们这个团队是从2003年开始搞无人车,那个包括月球车的行走系统都是姜磊他们这个团队设计的。那么10年前、12年前、2011年我们开搞四足机器人,我们现在有13年的经验,那么我们就在这些年的过程中,我们主要做两件事,一个是打造核心零部件,一个是打造控制模型。 咱们国家大多人形机器人还是原线电机的,现在典型的有20个到40个电机,就是电关节,但特斯拉有14个旋转执行器就是咱们传统的电关节,还有14个这个直线执行器就是电推缸。 人形机器人应该是一个通用的人形机器人,这个产业链不仅仅是我们以前的工业机器人的什么减速器、电机执行器,重点是要通过AI进行智能赋能。 传统的工业机器人由四大家族主导,他们掌握着电机减速器、控制器这个核心部件,所以就统治了整个工业机器人的市场。那么到了腿足式机器人以四足为代表,发展到了电关节、行走控和感知头,要执行任务,还要灵巧臂。再往后到了人形机器人的产业链,它的核心是高端的芯片、超算中心操作系统、大模型。 大家可以看到这个ANYmalC,它是把神经网络移植到了机器人,再移植到四足或双足,那么就实现了软硬件的解耦,通过神经网络,机器学习驱动的机器人就进入了快速迭代。 我们就要下一步要干什么?就是我们要做好我们的这个根技术,我们把2020年当做人形机器人的一个元年或者元点,因为这一年波士顿动力也成立了AI研究所,擎天柱发布了,包括ChatGPT,包括这个阿特拉斯新的这个动作等等,包括OpenAI都收购了挪威的公司。现在我们国内的很多互联网企业、人工智能企业都部署人形机器人。现在我们通用人工智能一个