您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [-]:优必选20260202 - 发现报告

优必选20260202

2026-02-03 - - 张东旭
报告封面

摘要 ·优必选自研 Thinker大模型在人形机器人工业应用中表现出强大的任务理解、环境感知、认知决策和任务规划能力,并在国际评测中获得9项全球第一,验证了其技术领先性。·Thinker大模型结合VOA技术,使人形机器人在搬运、分等工业任务中具备高效精确的执行能力,即使面对训练集以外的异常情况,也能实现自我纠错和恢复,展现出强大的泛化能力。。优必选通过模型蒸馏、量化加速和端侧部署优化,成功地在算力有限的机器人端侧芯片上高效运行Thinker大模型,实现了算法创新与工程能力的结合,确保了实际产品交付。·优必选主要采用开源数据,并结合真机及客户现场数据进行Thinker大模型的训练,通过学习异构数据形成通用表征,有效解决了硬件异构问题,并控制了研发戚本。·优必选通过融合多模态数据、结合先进算法与强化学习,并进行程优化应用中的稳定性和可靠性。手调研纪要·优必选在数据处理方面实现了近恶百分百的自动化标注流程,表明其AI模型研发已从以模型为中心转向以数据为中心,高质量的数据是AI模型有效性的首要贡献因素。·Thinker 模型采用专家 MoE 架构,体积小(4B),端侧部署效率高,并拥有大量真实工业场景数据,使其更贴近实际应用环境,提高了稳定性和效率,商业模式前景良好。 Q&A 优必选在物理AI大模型方面取得了哪些技术突破? 优必选在物理AI大模型方面取得了显著的技术突破,主要体现在以下三个方面 1.核心算法与场景数据结合:优必选基于其核心算法和丰富的场景数据,自研了面向人形机器人在工业场景中的强大模型能力。这些能力包括任务理解、环境感知、认知决策和任务规划等,能够执行各种物理层面的任务。 优必选的大模型在多个国际公开评测中表现出色,获得了9项全球第一的成绩。 2.工业应用中的高效执行:优必选的人形机器人在工业场景中,如搬运、分抹和上下料等任务中表现出高效且精确的执行能力。这得益于Thinker大模型结合VOA(VisualObject Analysis)的应用,使机器人能够应对训练集以外的异常情况。例如,在搬运过程中,如果箱子没有搬稳,机器人可以主动重新调整,这种自我纠错和恢复能力展示了其强大的泛化能力。 3.端侧部署与工程优化:由于人形机器人的端侧芯片算力有限,优必选通过模型蒸馏、量化加速技术以及端侧部署工程优化,实现了在有限算力条件下的大模型高效运行。这不仅要求算法上的创新,也需要极高的工程能力。优必选团队成功地将这些先进技术应用到实际产品交付中,使得Thinker大模型具备行业领先性。 优必选如何处理训练数据来源及硬件异构问题? 在训练数据来源方面,优必选主要使用开源数据,同时结合自身真机及客户现场的数据进行训练。具体来说: 则用于后期增强训练。这些多模态数据为基础模型提供广泛的息源。 数据来形成通用表征,不要求必须是同构的数据。因此,即使不同机器人的硬件设计有所差异,通过学习这些差异性的数据,可以提取其中内在关系,从而实现通用性能提升。3.成本控制:由于大量使用互联网开源数据,这部分成本相对较低,有助于控制整体研发费用。 优必选基础模型性能提升的关键因素有哪些? 优必选基础模型性能提升得益于以下几个关键因素: 1.多模态数据融合:通过融合来自不同来源的大量多模态数据,包括互联网开源数据和真机操作记录,实现全面覆盖各种可能场景,提高了基础模型的适应性和泛化能力2.先进算法与强化学习结合:采用 Post Training(后期训练)、RejectFineTuning(拒绝采样微调)以及强化学习等方法,对基础模型进行优化,使其具备更强的问题解决和自我纠错能力 3.工程优化与算力利用最大化:通过蒸馏、量化加速等技术手段,在有限算力条件下实现高效运行,并确保不影响精度,这一系列工程优化措施保证了实际应用中的稳定性和可靠性。 数据质量在AI 模型研发中的重要性如何?优必选在数据处理方面采取了哪些措施 高质量的数据是AI模型有效性的首要贡献因素。2025年,优必选花费大量时间进行数据收集和全自动化数据标注。整个流程包括自动化标注、打分、重新标注,最终实现了几乎百分百的自动化标注流程。这种方法表明,优必选的AI模型研发已经从传统的以模型为中心转向以数据为中心。 在机器人具身智能大模型评测中,目前行业内认可哪些评测基准?如何解决仿真环境与硬件部署之间的物理误差问题? 目前行业内对于机器人的具身智能大模型评测主要关注任务规划、场景理解和物体感知等方面。优必选使用了17个面尚这些方向的评测集。关于仿真环境与硬件部署之间的物理误差问题,s现阶段仿真技术发展迅速,从环境模拟到物理属性仿真环境史测试,可以得到高置信度结果,这种方法被称为 Real im,‘写 Sim 未来3-6个月内,优必选的大模型更新目标是什么?当前模型是否具备异构部署能力? 当前优必选的大模型是一个基础性模型,并不直接面向某一具体机型。在有了基础模型后,会针对特定机型进行微调,使其适应不同机型,如Work S2等。未来3-6个月内,主要目标是进一步探索VLA(视觉语言动作)和世界模型方向,并计划很快发布相关成果。 优必选AI基座团队规模及研发资金来源情况如何? 优必选整体研发人员超过1,000人,其中70%从事软件开发,30%从事硬件开发。 当前优必选大模型在辅助标注及多模态交叉校验中的流程是怎样的?整体标注准确率如何? 标注流程包括规则初筛和自动化精筛两部分。规则初筛用于筛掉不符合要求的数据,而自动化大模型则进行精细筛查。这两个环节都非常重要。目前整体标注准 确率可以认为达到100%,因为任何不符合要求的数据都会被重新投入数据池进行反复标注,以确保最终所有数据都是可用且经过自动化处理的。 在真实工业产线部署时,大脑部分Thinker大模型控制频率及推理延迟情况如何?是否能支持50~100赫兹以上实时闭环控制? Thinker大脑部分主要负责任务规划和场景理解,其推理频率约为10 赫兹,不需要高频率运行。而V0A(视觉语言动作)小脑部分运行频率较高,可达50100赫兹。这两个模块采用异步推理模式,大脑负责高层次语义规划,小脑负责具体执行,因此能够实现稳定支持实时闭环控制。 优必选的群脑网络和 CoAgent 如何与 Thinker模型进行技术衔接,实现多机器人协同作业? 群脑网络和 CoAgent是基于大模型的应用或框架,而Thinker则是一个基础平台,可以应用于群脑网络和CoAgent。多机器人协同作业主要通过中心化的大脑来实现跨机共享,中心化的大脑通过决策模型为下一层分发指令,从而实现整体协作。 优必选的开源模型如何支持开发者进行二次微调,并在硬件适配上做了哪些优化? 优必选的模型基于开源协议和框架,与市面上主流使用的一紫框架能够匹配,因还会在开源社区中提供更多面向机器人硬优化的工具链,使得基于Thinker进行微调后的模型能够高效部署在优必选自已的机器人上。 在数据安全方面,优必选如何确保Thinker模型训练数据中的敏感信息得到保护,并符合跨境数据传输相关政策要求? Thinker此次只开源了模型,不涉及客户数据。未来在开源过程中,将严格遵循保密协议,不会泄露客户数据,只会开源自有素材中心的数据。这些措施确保了数据安全并符合相关政策要求。 在工业场景落地过程中,优必选如何处理长尾问题,并通过数据回流机制提升模型性能? 优必选依靠大模型基础能力,通过精选VLA(视觉语言动作)模块实现功能。在实际操作中,大模型展现出如失败重试等未预训练的新能力。对于长尾题,通过关注失败案例并将其重新收集、标注后加入到基础模型迭代中,从而形成有效的数据飞轮机制,提高整体性能 Thinker模型采用何种架构设计,其优势是什么? Thinker 模型采用专家 MoE(Mixture of Experts)架构,是一种微服务架构,包含多个面向不同任务的MoE。其优势在于能够针对不同特殊任务匹配相应的新模块,提高系统灵活性和效率。 在真实物理场景交互中,Thinker 模型如何融合多模态传感器数据,实现统一决策? 当前版本的 Thinker 是VIO(视觉惯性里程计)模型,没有力学触觉功能。但未来基于 Thinker 的 VLA 将包含力学触觉状态,通过 token 化将这些信息映射到统一 token 空间,实现统一决策。 Thinker 模型如何实现小样本强泛化,对于工业场景中的零样本或少样本迁移成功率及部署周期情况如何? 关键技术在于高质量的小样本数据,这些数据更符合真实世界分布,加上大量训练,使得Thinker具备强泛化能力。在工业场景中的零样本或少样本迁移成功率较高,而具体部署周期取决于实际应用需求,一般较为迅速。 与其他厂商相优必选的 Thinker 模型有哪些核心差异化优势?商业模式前 最大优势是体积小,仅 4B,在端侧部署效率高。的拥有大量真实工业场景的数据,这些真实数据使得Thinker更贴返实际应用环境,提高稳定性和效率。对比其他厂商使用仿真或设计素材的数据,优必选的数据更加可靠。此外,通过快速响应下游需求及整合供应链资源,使得商业模式具有良好前景。