AI智能总结
2025年9月11日R1.0版 鲜枣课堂 版权所有侵权必究 具身智能的基本概念 具身智能的发展演进 目录 具身智能的核心技术 CONTENTS 具身智能的产业链 具身智能的未来发展 PART具身智能的基本概念 ■具身智能的基本概念 □具身智能的定义 >具身智能(EmbodiedIntelligence),是一种基于物理身体进行感知和行动的智能系统。 它通过实体智能体与环境的动态交互,获取信息、理解问题、做出决策,并实现行动,从而产生智能行为和适应性。 >具身智能是人工智能与机器人学交叉的前沿领域,其核心在于将感知、行动与认知深度融合。 ■具身智能的基本概念 □什么是“具身” >“具身“是一个很小众的名词,通常都出现在哲学、认知科学领域。 >“具身”的英文叫Embodied,是embody的过去式和过去分词。em-表示进入,使……”,-body表示身体”。组合起来,就是“使……进入身体”。 EmbodiedInteligence(具身智能),顾名思义,就是“使智能进入身体”、“给智能一个身体”的意思。 ■具身智能的基本概念 □具身智能与传统Al对比 ■具身智能的基本概念 □具身智能、离身智能、反身智能 >具身智能(EmbodiedIntelligence):强调智能体通过物理身体与环境的直接交互来产生认知和行动。其核心在于“感知-行动闭环,智能通过身体与世界的互动动态形成。 >离身智能(DisembodiedIntelligence):指不依赖物理身体,主要在虚拟或符号空间中通过计算和算法处理信息、进行推理的智能形式。 >反身智能(ReflexiveIntelligence):指智能体能够监控、评估并调整自身的内部状态、决策过程和行为策略,具备某种程度的“自我意识”和反思能力。 ■具身智能的基本概念 □具身智能的研究意义 宏观意义:研究具身智能,可以推动我国各个领域的数智化转型,为建设制造强国、网络强国和数字中国提供支撑,促进我国实体经济的发展。 科研意义:具身智能是通用人工智能未来的发展方向。它推动人工智能从虚拟世界走向物理现实,从专用任务迈向通用智能,有助于我们深入理解智能的本质。 应用意义:具身智能技术能够提升机器人、自动化设备的智能化水平,增强其环境适应性和任务执行能力,从而在服务、医疗、教育等多个行业实现广泛应用。 ■具身智能的基本概念 ■具身智能的发展演进 □具身智能的发展阶段 ■具身智能的发展演进 □具身智能的发展阶段——技术萌芽阶段 >1927年,第一个电驱人形机器人“Televox'诞生于美国西屋。>1950年,艾伦·图灵(AlanTuring)发表了经典的《ComputingMachineryandIntelligence(计算机器与智能)》一文,其中首次提出了具身智能概念。>1960年,首台工业机器人Unimate在美国通用汽车投入使用。>1968年,斯坦福研究院研制了世界上首台移动机器人Shakey。>1973年,日本早稻田大学研制第一台人形机器人WABOT-1。1985年,日本Epson公司推出了第一款家庭机器人“AlBO”。>1986年,日本本田公司的人形机器人ASIMO-E0问世。>1986年,美国计算机科学家罗德尼·布鲁克斯(RodneyBrooks)提出通过感知和动作驱动的环境交互来设计智能机器。智能体可以通过与环境进行直接的物理交互,以一种更加简单、有效的方式产生智能行为。>1991年,麻省理工学院(MIT)的Cog项目开始研究仿人形机器人的认知能力。>1991年,罗德尼·布鲁克斯发表论文《intelligenceWithoutRepresentation(无表征智能)》,认为智能可以通过行动与环境的交互而自然涌现。 ■具身智能的发展演进 □具身智能的发展阶段——技术积累阶段(1) >1990年,麻省理工学院推出一款模仿人头部的机器人Kismet。>1991年,布鲁克斯基于“感知-行动框架,研发可以自主行走的六条腿机器人Genghis,可以自主行走。>1999年,日本索尼公司推出犬型机器人爱宝。>2002年,丹麦IRobot公司推出世界上第一台家用扫地机器人Roomba。>2004年,Aldebaran发布了能够识别情感的机器人Nao。>2006年,HansonRobotics发布了能够模拟人类面部表情的机器人。>2009年,谷歌推出Prius自助驾驶汽车。>2010年,柳树车库(WlowGarage)发布了开源机器人操作系统ROS,促进了机器人领域的合作研究。 ■具身智能的发展演进 □具身智能的发展阶段——技术积累阶段(2) >2013年,美国波土顿动力发布机器人Atlas。>2015年,软银公司发布机器人“Papper”。>2016年,法国InriaFlower实验室开发的POPPY上市。>2016年,美国谷歌公司开源推出Tesorlow深度学习平台和Dopamine强化学习平台。>2018年,中国优必选WWalker系列机器人上市。>2020年,美国-敏捷机器人公司DIGIT,避障、上下楼梯,配会自动驾驶车辆送快递交付包裹。>2020年,中国达闼机器人发布CloudGingerXR-1。 ■具身智能的发展演进 □具身智能的发展阶段——技术突破阶段 >2021年,优必选WalkerX实现了中国双足机器人行走能力的突破。>2022年,小米发布CyberOne,Mi-Sense深度视觉模块及Al算法构造三维空间感知。>2022年,美国特斯拉发布机器人Optimus,搭载自动驾驶级FSD芯片,基于视觉神经网络预测能力的自动驾驶技术。>2023年,英伟达CEO黄仁勋表示,人工智能的下一个浪潮是具身智能。英伟达发布多模态具身智能系统VIMA。>2023年,李飞飞等提出VoxPoser系统,将大语言模型(LLM)接入机器人。>2023年,英国EngineeredArts为Ameca接入GPT-3/4增强了其语言的灵活性并增强了其面部表情。>2023年,中国傅利叶推出GR-1通用人形机器人,多模态大模型、高度仿生的躯干构型、拟人的运动控制;宇树科技UnitreeH1发布;智元机器人远征A1发布。>2023年8月,谷歌DeepMind推出机器人模型RoboticsTransformer2(RT-2)。>2024年3月,OpenAl与人形机器人初创公司Figure合作推出了Figure01机器人。>2024年,智元机器人发布“远征”与“灵犀”两大系列共五款商用人形机器人新品。>2025年,挪威公司1XTechnologies发布仿人体骨骼结构NeoGamma机器人。 ■具身智能的发展演进 □具身智能的爆发背景 >一方面,Al浪潮爆发,出现了功能强大的大模型和智能体,能够对大量的感知数据进行高效学习和处理。Al越来越强,但想要将Al能力真正用起来,就必须让它在物理世界落地。这肯定需要一个物理载体。另一方面,传统的自动化机械,只能完成死板的程序指令,大大限制了它的应用场景。引入强大的AGl(通用人工智能)大脑,能够提升泛化能力,让机器变得真正聪明,扩大应用场景和范围。 >Al需要身体,机器人需要大脑。两者双向奔赴,刺激了具身智能的全面爆发。我们也可以说,具身智能是Al发展到一定阶段的必然产物,是一种新的A范式。 ■具身智能的发展演进 □具身智能的五个阶段 >无智能阶段:只能执行简单的预设任务,缺乏自主性和适应性;基础智能阶段:开始具备基本的感知能力,能够对外界环境做出简单的反应;>中等智能阶段:能够进行更复杂的感知和处理任务,如图像识别和语音识别;>高度智能阶段:展现出较高的自主性和适应性,能够进行自我学习和优化,执行复杂的任务;>超级智能阶段:理论上将具备超越人类的智能水平,能够进行创新和自我意识的决策。 ■具身智能的核心技术 □具身智能的三大核心要素 >本体:智能体的物理载体,具备感知、运动和操作能力。本体的形态和功能直接影响智能体的任务执行能力。 >智能:负责感知、理解、决策和控制的核心模块,通常由多模态大模型(如LLM、VLM)驱动。通过整合视觉、语言、触觉等多种模态数据,生成适应环境的行动策略。 >环境:智能体交互的物理世界,包括动态变化的场景和任务目标。环境的复杂性和不确定性要求智能体具备强大的适应能力和实时学习能力。 ■具身智能的核心技术 □具身智能的分类(按功能用途) 工业机器人:应用于生产过程与环境的机器人。 ·搬运作业/上下料机器人、焊接机器人、喷涂机器人、加工机器人、装配机器人、洁净机器人等。服务机器人:个人/家用服务机器人及专业服务机器人。·家务机器人、教育机器人、娱乐机器人、养老助残机器人、餐饮机器人、讲解机器人、迎宾机器人等。特种机器人:可以在极端环境下(如高温、高压、辐射等)替代人类完成任务。·检查维修机器人、专业检测机器人、搜救机器人、专业巡检机器人、侦察机器人、排爆机器人、专业安装机器人、采掘机器人等。 ■具身智能的核心技术 □具身智能的分类(按形态) >人形机器人>固定式机器人>轮式机器人/履带式机器人>多足机器人>仿生机器人智能汽车/无人机/无人船 ■具身智能的核心技术 □具身智能的分类(按形态)——人形机器人 >人形机器人是目前最常见,也最引人瞩目的类别。 >人形机器人的最大优势——通用性强。>人形机器人因为有类似人类的身体结构,可以更方便地使用门把手、楼梯、工具等设施,也能够适应人类工作场景。>人形机器人在交互上也有天然优势。它们可以通过表情、动作与人类交流,比如点头、挥手,甚至模仿人类的情绪,更容易被用户接纳。 ■具身智能的核心技术 □具身智能的分类(按形态)——固定式机器人 >通常安装在固定位置执行任务。常用场景:安装在工业生产线上(如焊接、装配、搬运)。 ■具身智能的核心技术 □具身智能的分类(按形态)——轮式机器人 >轮式机器人主要依靠轮子进行移动,常见于仓储物流、巡检安防等领域。 >为了方便工作,制造厂商往往会开发那种“下面是轮子,上面是手臂”的轮式机器人,也叫做轮臂机器人。 >轮式机器人的优点主要是移动速度较快,能够快速穿梭在仓库或工厂中,完成货物的搬运、分拣等工作。它们具备较好的环境感知能力,能够在复杂环境中自主导航和避障。 ■具身智能的核心技术 □具身智能的分类(按形态)——多足机器人 >比较常见的机器狗,其实就属于多足机器人(四足机器人)。>多足机器人模仿了昆虫或爬行动物的行走方式,具备较强的地形适应能力,灵活性和稳定性更强,可以在崎岖不平的山路、废墟等环境中自由行走,执行勘探、救援等任务。>像机器狗这样的四足机器人,也适合扮演Al宠物这样的角色,用于家庭服务或特殊人群服务(导盲)场景。 ■具身智能的核心技术 □具身智能的分类(按形态)——仿生机器人 >仿生机器人是一类通过模仿生物体的结构、运动方式、感知机制或行为特性来设计和工作的机器人。>它们融合了生物学、机械工程、电子技术、控制科学和人工智能等多个领域的知识,旨在让机器人能够像生物一样灵活、高效地适应复杂环境并执行任务。>代表:水下仿生机器人、空中仿生机器人、地面仿生机器人、特殊仿生…… ■具身智能的核心技术 □具身智能的分类(按形态)——智能汽车/无人机/无人船 >智能汽车、无人机、无人船等设备,本质上也属于具身智能。它们通过传感器(摄像头、雷达等)实时感知周围环境,并利用Al算法进行数据处理和分析,从而实现自动驾驶、自主导航、自动避障等功能,符合前面说的具身智能定义。 ■具身智能的核心技术 ■具身智能的核心技术 □具身智能的组成部分 从整体来看,具身智能可以分为本体、大脑和小脑。 ■具身智能的核心技术 □具身智能的组成部分 脑也可以分为本地脑和云脑,也是快慢脑。 ■具身智能的核心技术 ■具身智能的核心技术 □具身智能的组成部分 本体 ·本体,包括头、躯干、四肢、关节、灵巧手等组成部