您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:ICRA2024大会主席王志东谈具身智能20240531 - 发现报告

ICRA2024大会主席王志东谈具身智能20240531

2024-05-31 未知机构 一切如初
报告封面

谈具身智能:在时代风口把握方向 Q: 对于现在讨论度很高的具身智能,您怎么看待这股热潮? 王志东:具身智能现在热度很高,但我认为如果机器人本体做得不够好,那么这个瓶 颈就在那儿了,即使有智能层面的加成,也还是没办法实现突破性的进展。 个 application 作为落点,让大家比较容易知道,其实所谓的系统模型很早就开始做了,是已经做到一定程度了才有了重大进展。 然后这个行业跟风涌进来了几百个公司,但一年之后这些公司百分之八十、九十都不 存在了,这个说明什么?说明怎么运用好这个技术才是关键,有哪些东西能真正延续 下去,这个才是我们需要思考的大模型的真正意义。 从我参加各种各样的论坛经验来看,发展就是不断寻找道路的过程。现在大家都在思 考如何将大语言模型和机器人融合,其中机器人的运动控制是个挑战。我在这次 ICRA 2024 会议里已经听到有一些新的想法在冒头了,估计两三年肯定又有一套新的东西出 来了。 第二个就是机器人的控制问题。具身是 embodied,顾名思义,和身体相结合的东西。机器人的体型是高是矮,动作设计都不尽相同,这些都和整体的控制相关。 在方面,其实有很多东西可以做。就像波士顿动力所展示的产品视频一样,看起来可 能没什么,但背后有很高的技术含量,至少以国内现有的水平要做到像他们那样,还 有很多工作要做。 但就像我经常和日本学生说的那样,因为中国有人口优势,所以只要继续朝着这一方 面努力钻研,会有超越世界的一天,对此我比较有信心。 当下需要注意的是,如何把一项东西研究透,这点很重要,然后就是把握好机器人领 域的方向性。如果把目标定为“超过 Boston Dynamics ”,那这样的想法只会让你成为另 外一个 Boston Dynamics。这个行业最终要往哪个方向走?怎么做得更好?这是需要思 考的问题。 Q: 相较于机器人本体,ICRA 2024 大会会更侧重于对机器人智能的研究吗?现在行业的目光都聚焦在哪些方向? 王志东:从会议收录的论文来看,机器人学习与智能这一方向确实是最多人关注的。其中可以提炼出三个 keywords——医疗、机器人的作业和导航。这些方向在如今大热 的汽车自动驾驶或者是别的方面都能体现出来。 但是像人形机器人,大家对它的想象中还停留在和机器人对下象棋,可这不是一个目 标,这只是一个基准。我的夫人有时候会和我说,你赶紧设计一个能和我爸聊天的机 器人,这就是一个助老助残机器人的方向,但这个产业能不能形成,还有很多因素影 响,比如系统控制的技术能不能达到设想的水平 据我对 ICRA 大会的观察,现在大家都在关注,怎么把人工智能领域的新方法运用在机 器人上,并对其进行改造发展,我觉得这是很大的尝试。有人说这不算创新,我不认 为会是这样。所有的行业都是通过把别的领域的东西拿过来,通过改造发展才成为了 自己的东西。 我觉得最大的方向不在于怎么提高智能,而是如何把现在人工智能的好模型、好的方 向性拿到机器人这个领域里头,如何在实际场景中真正应用起来,把它能做到就像是 一个新的方向性,新的产业出来,我个人感觉这是这个行业最大的挑战。这就是我们 所讲的具身智能。因为我的研究的方向主要是机器人和人之间的协调。在我看来,在 机器人和人之间的协调是很重要的东西。就像讲到蚂蚁,很简单的智能,但可以做很 多事。现在人工智能这些系统不断的增加,对我们有很大的帮助。所以现在大家都很 努力地想把这些东西拿出来,我觉得这是目前行业最大的一个方向性。Q: 您怎么看待 具身 话,我相信它也是分开来看的,并不是说将来全人类全部适用一个通用的大 脑,对不对?特别是搞研究的人,也有存在不同的方向性或者不同的特点。我的一些 研究人工智能的朋友,他们也不是除了人工智能之外的事都不关注,他们也在不断询 问如何实现实际应用。 其次,从机器人厂商出展的情况来看也可以了解到,虽然他们没有必须线下参加的必 要,但他们还是来了,为什么呢?因为这是机器人领域的顶会,他们可以借此机会了 解到很多领域内的发展趋势。举个例子,小孩走路的老摔或者拿东西老倒,但人长大 后现在不倒了。这学习的实质,这其中的逻辑,其实对人工智能是很大的一个方向。对于机器人厂商而言,他们也会不断和这方面接触,所以这方面的融合是肯定存在 的。 所以,并不是说研究人工智能和研究机器人完全是分开的两拨人。更何况,机器人内 里有很多互相嵌入的东西,没有办法完全独立开来,包括 planning 类的东西。 Q: learning 等于 intelligence 吗?王志东:并不是。因为我是研究机 器人抓取手这一方 面的,我们在研究的时候就发现,对在确定位置上的物体,机器人是可以很好做到抓 取的动作,但是如果位置不确定不精准,对于机器人就很难实现这个动作。可人能在 物体还没到固定位置的时候,就预判其动线,在有不确定因素的情况下也能实现抓取 动作,这是人类很强的一个智能表现,这个动作本身就蕴含了策略的智慧和控制的智 慧。 所以智能并不是说一定要通过 AI 或者算出来的才是智能,这些东西也都是智能。从控 制上来看,包括走路、拿东西的动作,人的惯用动作都是最省力稳定的,这里面有大 学问,是有很多“智能”在里面的。 所 以 如 果 说 learning 是 intelligence , 这 是 不 对 的, 但 是 通 过 learning 可 以 增 加 intelligence,可以在learning 的过程中提高 intelligence 的质量。 人形机器人: 一个集成技术试验台 Q: 单就机器人这个领域而言,对于现在人形机器人的研究浪潮,您是怎么看的?王志东:我认为,要搞好人形机器人比起单纯地做好 vision 或者 ChatGPT 要难得多。因为一个人形 机器人集合了很多领域的东西,包括 hardware、control 以及 system integration。怎么能把这些东西都做好,这不是个简单事儿。 我也有了解到一些人形机器人产品,比如国内的 Unitree 就做得很不错,但是要说它完 全能够达到和人一样自由自在的动态行动,还有一些距离。就机器人公司来说,我个 人观点认为,Boston Dynamics 相较于 Unitree,在控制上会做得更精细。 Q: 像宇树他们把那个机器人成本降到九万九的价格,这个在中国的媒体上也引起了比 较多的讨论,您怎么看待硬件成本下降这一情况?王志东:对于机器人这个领域而 言,硬件成本下降是非常重要的内容。我个人觉得,降成本会让更多人参与进这个领 域,以后更多人使用,就可以做出更多的平台。人工智能为什么能发展?因为大家都 把东西放在 GitHub 上去,谁都可以用了,所以大家都可以不断地把这项技术提升。但 硬件你不可能免费共享,对吧?如果能把参与门槛降低,到大家都可以用的程度的 话,这自然最好。 英伟达的发展也是如此,他们在过去把 GPU 研究出来,然后利用这个从各方面把 application 积累出来。硬件做得好,做得便宜,用的人多了,发展方向自然也就多了,将来肯定会有突破性进展。我个人认为,宇树这种产品的出现是一个很好的现象。因 为国内也有很多厂家在做人形机器人,不同的水平,就意味着不同的状况,每一款人 形机器人之间都是有差异的,技术难度也会不一样,未来对于社会的影响也是不一样 的。但是可以预测到的是,越多人做,就越有可能实现行业新的突破口,这是向好的 趋势。同时,我也觉得在机器人方面,研究范围可以再扩宽一些,不一定要光盯着人 形机器人。 Q: 在 ICRA 2024 上,人形机器人的讨论度如何? 王志东:人形机器人是其中一个很重要的方向,但我个人觉得,这个大会讨论度更高 的其实是 learning 和人工智能。如何将最新的人工智能技术、最新的 vision 技术和机器 人技术进行融合,这个方向的发展是我觉得最关键的,也是大会最多讨论的。人形机器人并不是能够创造出新产业的一个方向。但是有关人形机器人的研究会影响 到整个机器人行业的 system integration 和 intelligent integration 水平。 比如要做一个人形机器人,这个机械臂要怎么设计?像工业机器人的技术怎么适配到 这种体型上,同时还要考虑机器人集成控制的能力。 人形机器人相当于一个万能的集合,包括优化设计和多任务处理能力,就像是个试验 台。你把人形机器人做好了,你要做好别的东西就游刃有余很多。 现在有些观点认为,做好了人形机器人,就可以创造出一个完全新的产业,甚至于可 以代替汽车的程 度。我个人觉得至少现在还看不出来。但如果是让人形机器人实现物 流行业的“最后一公里”,实现精准定位的送货上门,这个场景我觉得有可能实现。可 是会不会由此产生一个全新的产业,我保持怀疑态度。 3 寻找产业落地的出路 Q: 我看这次展会波士顿只派代理商过来,但没有实际展出产品,所以有人在讨论是不 是波士顿在走下坡路,您是怎么看待的?王志东:我不这样认为。从开发者的视角来 看,其实公司有新的产品,没有必要特意运过来参展,拍个视频在网上展示也是一样 的效果。他们现在更大的任务是将技术推广到实际,因为如果没办法投产应用,那么 就没办法盈利,结果可能又要面临出售公司的情况。这也是作为一个高科技企业的挑 战。 从另一方面来看,这个情况也说明了现在除了参展之外,还有很多方式可以展现产 品。所以这次中国很多企业愿意来参展,我非常惊喜。同时需要看见的是,在网上刷 屏赚足眼球并不能证明什么,很多东西是要扎扎实实干的。就像 Elon Musk 所宣传的人 形机器人目前还没看到真的动作展示,在网上声量却很大,却不一定是真的能做到宣 传的效果,说明这个人形机器人其实还是有很多富有挑战性的东西需要解决。 Q: 我还注意到在这次 ICRA 上有很多家庭机器人的研究,您之前也发表过关于深度交 互,机器人进入家庭生活这么一个趋势,您感觉今年有一些比较大的 Leap 吗?王志 东:我相信很快就会有。我个人观点现在预估有两个方向能实现快速发展。 第一个是 logistics 物流相关的,因为需求太多了。比如 Boston Dynami cs 就有在搞这些 卡车装载纸箱的自动卸货的系统开发。但是仓储电商的取货过程做得算是比较好了,而装盒这一环节却还没有大的进展。考虑到现在电商对于物流方面的需求,这些支脉 的自动化需求量也会非常大。 这个其实是和市场相关的,有 Eco(生态经济)就能够产生价值。所以说为什么 Amazon很早能够成功?他们在早期就收购了 kiva robot,一个能够载着台子到处跑的 机器人,这是革命性的东西,给电商网购行业的发展提供了非常重要的支撑。但却没 能带动革命了整个产业,现在还需要人工在环节中。所以现在大家都在强调方向性。因为我是搞辅助机器人的,所以我认为辅助机器人协调这一块如果能发展起来的话,会有很大的价值。 第二个就是刚刚讲到的家庭机器人。对于这个东西,大家关注度都很高。大家会开始 想在家庭或者各种情况下怎么进行 planning,怎么进行 manipulation?怎么进行 task ?我听到有一个 workshop 大部分都讲这事,所以看得出大家对这些比较热心。但你说明年就会实现重大进展吗?我不敢打包票,但不远的将来肯定会有发展。 Q: 我注意到日本它有一个 moonshot 登月计划,大会上也围绕着这个计划做很多相关的展览,现在日本的机器人行业是什么样的现状?对于中国机器人行业的发展有何建 议? 授研究员的团队。日本的这个登月计划是给出了一个方向,就是要瞄准我们现在 还完全不可能实现的目标,希望多年以后在一些领域有突破性的技术。 较有紧迫 感,他希望在今后十年里头,通过集智聚力在几个技术层面的冲刺,能够把日本机器 人领域的研究水平拉上去,提高到一定的水准。 据我观察,国内现在很多研究的方向性很好。人形机器人也是一个很好的方向,但我 还没搞清楚它背后的技术难题。做好人形机器人这