行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

基础模型邂逅具身智能体

信息技术 2025-02-25 - 西北大学&哥伦比亚大学&麻省理工&斯坦福 Man💗

第一部分：动机和概述

通才代理人的定义及重要性，通过图示和任务示例（如熨烫衣物、烹饪早餐等）说明典型具身智能体任务。
提出以马尔可夫决策过程（MDPs）作为基础模型分类的指导原则，并探讨“情境决策”的概念。

第二部分：MDPs与具身智能环境

回顾MDPs的核心要素：状态空间、观测、行动空间、转移模型、奖励模型和政策。
列举MDP环境实例（如MineCraft、MineDojo、GTA等），并强调Web代理环境在网页理解和多模态LLMs发展中的作用。
详细解析MDPs中的状态估计（从2D渲染场景到3D资产状态）、目标解释（如“设置表格”的属性和条件定义）以及子目标分解。

第三部分：基础模型与MDPs融合

MDP政策：通过LLM输出示例（如烹饪草莓的动作序列）展示政策生成过程，包括目标解释、子目标分解、动作序列转换和转移建模。
奖励模型：强调奖励模型在任务执行中的重要性，并引用相关研究（如https://arxiv.org/pdf/2305.10626）。
转型模型：以OmniGibson物理过渡为例，说明如何捕捉复杂物理现象，并介绍全渠道Gibson物理过渡界面。

第四部分：虚拟代理与物理代理对比

对比虚拟代理和物理代理在MDP实例中的应用差异，并引用相关研究（如https://embodiedqa.org/slides/eqa_matterport.slides.pdf）。

第五部分：报告概要

报告结构：分为5个部分，涵盖动机与概述、基础模型与虚拟/物理代理融合、高层与低层决策制定、机器人基础模型及余留挑战。
时间分配：主持人李曼玲（15分钟概述）、李曼玲（45分钟融合）、Mao（25分钟认知）、Li（30分钟基础模型）、Li（15分钟挑战）及QA环节。

李曼玲Northwestern 云珠·李哥伦比亚第一部分：动机和概述 Manling Li，西北大学教授 AAAI教程：基础模型遇见具身智能什么是通才代理人？图示来源：毛嘉元模拟和基准测试对人类重要的机器人任务 -1K 任务matterWhat您需要机器人来帮助您吗？清洁地板？任务matterWhat您需要机器人来帮助您吗？熨烫衣物？任务matterWhat您需要机器人来帮助您吗？烹饪早餐？任务matterWhat您需要机器人来帮助您吗？打开礼物？任务matterWhat您需要机器人来帮助您吗？清理一场狂欢派对后的残留？典型具身智能体任务 “情境决策”是什么？我们能否将MDP作为指导原则来对“基础模型”进行分类？让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。 MDP环境：MineCraft MDP环境：Web代理环境 VisualWebBench：在网页理解和接地方面，多模态LLMs发展有多远？ https://arxiv.org/pdf/2404.05955 让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。 : 观察（渲染的2D图像）环境 : 观察State (3D 资产 & 状态)环境！ 50场景 10000对象让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。 →: 机器人能否学会解决这些任务？行动让我们回到马尔可夫决策过程（MDPs）。感知 / 状态估计:o→s 观测！状态估计（资产与状态）观察（2D渲染场景）让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。设置表格。设置表格。使用这些板子。 : 定义一个任务? 目标开始与目标？哪些属性？ !applein冰箱!汉堡in冰箱!水瓶in冰箱!纸张袋oncounter https://behavior.stanford.edu/ 让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。保持食品行动轨迹保持食品行动轨迹保持食品行动轨迹保持食品行动轨迹让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。奖励模型让我们回到马尔可夫决策过程（MDPs）。让我们回到马尔可夫决策过程（MDPs）。转型模型ot,a→ot+1 \"世界建模\ class切割规则: 全渠道Gibson物理过渡界面让我们回到马尔可夫决策过程（MDPs）。 https://embodiedqa.org/slides/eqa_matterport.slides.pdf

点击免费查看完整报告

基础模型邂逅具身智能体

你可能感兴趣

第二部分：基础模型邂逅物理智能体

机械行业周报：英伟达推出人形机器人基础模型，具身智能有望加速落地

机器人行业周报：英伟达成立通用具身智能体研究部门，将在GTC 2024发布AI+机器人领域最新突破

机器人行业周报：逐际动力发布具身智能体系统LimXCOSA，机器人实现边思考边干活

从陆地到海洋的水生连续体的养分动态，转移和保留：走向生态和生物地球化学模型的整合

AIGC聊天机器人系列深度报告之技术篇：理解语言模型与推理能力，迈向具身智能新阶段

教育行业点评报告：从模型应用到具身智能，AI全方位引领教育跨越式迈步新时代

具身智能科技前瞻探索（第3期）：多任务操作、第一人称世界模型、低光照与模糊感知

国金计算机2025年具身智能模型发展到哪一步了

端到端模型赋能自动驾驶，机器人引领具身智能：从特斯拉FSD看人工智能

基础模型邂逅具身智能体

你可能感兴趣

第二部分：基础模型邂逅物理智能体

机械行业周报：英伟达推出人形机器人基础模型，具身智能有望加速落地

机器人行业周报：英伟达成立通用具身智能体研究部门，将在GTC 2024发布AI+机器人领域最新突破

机器人行业周报：逐际动力发布具身智能体系统LimXCOSA，机器人实现边思考边干活

从陆地到海洋的水生连续体的养分动态 ， 转移和保留 ： 走向生态和生物地球化学模型的整合

AIGC聊天机器人系列深度报告之技术篇：理解语言模型与推理能力，迈向具身智能新阶段

教育行业点评报告：从模型应用到具身智能，AI全方位引领教育跨越式迈步新时代

具身智能科技前瞻探索（第3期）：多任务操作、第一人称世界模型、低光照与模糊感知

国金计算机2025年具身智能模型发展到哪一步了

端到端模型赋能自动驾驶，机器人引领具身智能：从特斯拉FSD看人工智能

从陆地到海洋的水生连续体的养分动态，转移和保留：走向生态和生物地球化学模型的整合