行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

中国人工智能系列白皮书—具身智能（2026版）

信息技术 2026-04-10 中国人工智能学会周剑

具身智能作为人工智能领域的重要研究方向，专注于智能体通过物理本体与外界环境的互动来实现智能的理论与技术研究。相比于静态、离身的人工智能，具身智能具有涉身性、情境性、主动性和交互性等特点，并兼具多技术融合与多学科交叉特性，与计算机科学、机器人学、神经科学、认知科学等不同领域都紧密相关。

具身智能的演进历程可追溯至20世纪50年代，其理论源自图灵的构想，并在20世纪80年代的行为主义AI学派中得到发展。随着深度学习、强化学习等先进算法模型的涌现，以及传感器与执行器等硬件技术的不断进步，具身智能迎来了快速发展的黄金时期。近年来，随着大语言模型（LLMs）的兴起，具身智能的发展迎来了新的高潮，大模型凭借其深厚的通用知识库和智能涌现能力，为机器人提供了更高层次的智能感知、自主决策和拟人化交互能力。

具身智能的关键技术涵盖物体操作、环境感知、任务理解与决策推理这四大核心部分，它们共同构成了机器人的“手-眼-脑”，协同支撑起智能体在现实场景中的自主行动能力。其中，具身感知、具身推理和具身操作是具身智能区别于传统机器人的核心技术，它们分别负责环境感知、任务理解和动作执行，并相互交织、相互促进。

具身智能目前形成了相对完备的技术体系，并逐步渗透到各个行业，包括工业制造、生活服务、医疗康养、农业、交通和能源与电力等。未来，具身智能研究将呈现从单一模态向多模态感知与交互的闭环机制发展、从静态场景理解向动态环境预测与适应演进、从限定场景训练向开放环境迁移、从单一智能体向多智能体协作拓展四大趋势。随着相关技术体系的持续完善和应用场景的不断丰富，具身智能将在未来十年内成为重塑人类生产生活方式的重要技术力量。

编委会主任：戴琼海执行主任：马华东副主任：赵春江何友王恩东郑庆华刘成林周志华孙富春庄越挺胡德文杜军平杨强委员：陈松灿董振江付宜利高新波公茂果古天龙何清胡清华黄河燕季向阳蒋田仔林浩哲梁吉业刘奕群潘纲石光明孙茂松孙长银陶建华王海峰王熙照王轩王蕴红吴飞于剑余有成张化光张学工章毅周鸿祎周杰祝烈煌 ·······················································1 1.1·····································································11.2····························································21.3·····································································3 ···························································5 2.1·················································································62.2·················································································82.3·················································································102.4·················································································132.5·················································································152.6·················································································162.7···········································································192.8···········································································202.9··············································································222.9.1· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·242.9.2· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·242.9.3· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·252.10·········································································26 ·······················································31 3.1········································································313.2········································································36 ······························································43 4.1··············································································444.2·······················································································464.3·······················································································484.4·······················································································554.5··············································································58 ·······················································60 5.1·························································605.2·························································635.2.1VLAWAM· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·635.2.2· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·645.2.3· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·665.3·························································665.3.1· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·665.3.2· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·675.3.3· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·675.4····························································68 ···················································································70 ·························································································72 ··················································································96 1.1 2050Alan Turing1950Computing Machinery and IntelligenceEmbodied Intelligence 2080AIRodney Brooks Deep LearningReinforcement Learning +Optimus-- Large Language ModelsLLMsDeepMindRTRT-H Meta AICortexBenchVC-1NVIDIAGPUAIGR00TJetson ThorIsaac 1.2 2080 1.3 1-1-Sim-to-RealGap [1–6]3D Gaussian Splatting- [7] residual policy [8–10] [11–13] [14–16] -- 2.1 - [17][18][19][20]MP5[21]MinecraftActiveGAMER[22]3DAPPLE[23] [24,25] [26][27][28][29]Metasensor[30]VTDexManip[31]-[32] [33][34][35][36][37][38] Transformer[39,40][41–43] 2.2 AIPDDL 1 2SayCan[44] affordance 3ReAct[45]Text2Motion[46]VLP[47]REFLECTLLM Code-as-Policies[48]APIRoboCodeX[49] Vox-Poser[50]OmniManip[51]ReKep[52]VoxPoserOmniManipReKepPalm-E[53]EmbodiedGPT[54]EGO4D[55]EGOCOT[53]RT-1[56]RT-2[57]RT-X[58]π0[58]-- 2.3 VoxPoser[50]OmniManip[51]ReKep[52] --Vision-Language-Action ModelVLA2-12026World-Action ModelWAMVLA VLA 1VLM + -Visual-Language Model, VLM 2VGM + Video-Generation Model, VGM 3VLM+Latent+Action Latent Action Tokens)- 2024-2025 VLM +2024Physical Intelligenceπ0VLM+RDT2025FigureVLAVLM VGM +VLM+VGM +GR-2+ATMFLIP VLM+Latent+Action2025Vision-Language-Latent-Action (ViLLA)VLAViLLALatent Action Tokens)-SOTAViLLAVLM+MoEVLMMoELatent PlannerMoEVLMLatent PlannerAction Expert VLAWAM-VLA

点击免费查看完整报告

中国人工智能系列白皮书—具身智能（2026版）

你可能感兴趣

中国人工智能系列白皮书—具身智能（2026版）

中国人工智能系列白皮书：具身智能（2026版）

中国人工智能学会系列白皮书——具身智能

2022中国人工智能系列白皮书-智能产品与产业

中国人工智能学会系列白皮书：分层分类人工智能通识教育课程体系

中国人工智能系列白皮书-智慧农业

中国人工智能系列白皮书--粒计算与知识发现

中国人工智能学会系列白皮书⸺教育研究中的AI4S

2023 中国人工智能系列白皮书——AI+Art

中国人工智能学会系列白皮书：元宇宙技术（2025版）