行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

优必选20260202

2026-02-03 - - 张东旭

优必选 Thinker 大模型技术突破与应用

核心技术突破

核心算法与场景数据结合：优必选自研 Thinker 大模型在人形机器人工业应用中展现强大任务理解、环境感知、认知决策和任务规划能力，国际评测获 9 项全球第一，验证技术领先性。
工业应用高效执行：结合 VOA 技术实现搬运、分拣等任务高效精确执行，具备自我纠错和恢复能力，展现强大泛化能力。
端侧部署与工程优化：通过模型蒸馏、量化加速和端侧部署优化，在有限算力芯片上高效运行 Thinker 大模型，实现算法创新与工程能力结合。

数据与硬件处理

训练数据来源：主要采用开源数据，结合真机及客户现场数据，通过学习异构数据形成通用表征，解决硬件异构问题，控制研发成本。
数据处理：实现近 100% 自动化标注流程，转向以数据为中心的研发模式，高质量数据是模型有效性的关键因素。

模型性能提升关键因素

多模态数据融合：融合互联网开源数据和真机操作记录，提高模型适应性和泛化能力。
先进算法与强化学习：采用 Post Training、RejectFineTuning 及强化学习优化模型，增强问题解决和自我纠错能力。
工程优化与算力利用：通过蒸馏、量化加速等技术，在有限算力下实现高效运行，确保稳定性和可靠性。

评测与未来目标

评测基准：行业认可任务规划、场景理解和物体感知等评测集，优必选使用 17 个相关评测集。
仿真与硬件部署：采用 Realistic Simulation 方法解决物理误差问题。
未来目标：未来 3-6 个月探索 VLA 和世界模型方向，计划发布相关成果。

团队与研发

研发团队：整体研发人员超 1000 人，70% 从事软件开发，30% 从事硬件开发。
标注流程：规则初筛+自动化精筛，整体标注准确率达 100%。

实际应用表现

控制频率与延迟：Thinker 大脑推理频率约 10 赫兹，V0A 小脑可达 50-100 赫兹，支持实时闭环控制。
多机器人协同：通过中心化大脑实现跨机共享决策，支持多机器人协同作业。

商业模式与差异化优势

开源模型支持：基于开源协议，提供机器人硬件优化工具链，支持二次微调。
数据安全：开源模型不涉及客户数据，严格遵循保密协议。
长尾问题处理：通过数据回流机制提升模型性能，形成数据飞轮。
核心优势：体积小（4B）、端侧部署效率高，拥有大量真实工业场景数据，商业模式前景良好。

摘要 ·优必选自研 Thinker大模型在人形机器人工业应用中表现出强大的任务理解、环境感知、认知决策和任务规划能力，并在国际评测中获得9项全球第一，验证了其技术领先性。·Thinker大模型结合VOA技术，使人形机器人在搬运、分等工业任务中具备高效精确的执行能力，即使面对训练集以外的异常情况，也能实现自我纠错和恢复，展现出强大的泛化能力。。优必选通过模型蒸馏、量化加速和端侧部署优化，成功地在算力有限的机器人端侧芯片上高效运行Thinker大模型，实现了算法创新与工程能力的结合，确保了实际产品交付。·优必选主要采用开源数据，并结合真机及客户现场数据进行Thinker大模型的训练，通过学习异构数据形成通用表征，有效解决了硬件异构问题，并控制了研发戚本。·优必选通过融合多模态数据、结合先进算法与强化学习，并进行程优化应用中的稳定性和可靠性。手调研纪要·优必选在数据处理方面实现了近恶百分百的自动化标注流程，表明其AI模型研发已从以模型为中心转向以数据为中心，高质量的数据是AI模型有效性的首要贡献因素。·Thinker 模型采用专家 MoE 架构，体积小（4B），端侧部署效率高，并拥有大量真实工业场景数据，使其更贴近实际应用环境，提高了稳定性和效率，商业模式前景良好。 Q&A 优必选在物理AI大模型方面取得了哪些技术突破？优必选在物理AI大模型方面取得了显著的技术突破，主要体现在以下三个方面 1．核心算法与场景数据结合：优必选基于其核心算法和丰富的场景数据，自研了面向人形机器人在工业场景中的强大模型能力。这些能力包括任务理解、环境感知、认知决策和任务规划等，能够执行各种物理层面的任务。优必选的大模型在多个国际公开评测中表现出色，获得了9项全球第一的成绩。 2.工业应用中的高效执行：优必选的人形机器人在工业场景中，如搬运、分抹和上下料等任务中表现出高效且精确的执行能力。这得益于Thinker大模型结合VOA（VisualObject Analysis）的应用，使机器人能够应对训练集以外的异常情况。例如，在搬运过程中，如果箱子没有搬稳，机器人可以主动重新调整，这种自我纠错和恢复能力展示了其强大的泛化能力。 3.端侧部署与工程优化：由于人形机器人的端侧芯片算力有限，优必选通过模型蒸馏、量化加速技术以及端侧部署工程优化，实现了在有限算力条件下的大模型高效运行。这不仅要求算法上的创新，也需要极高的工程能力。优必选团队成功地将这些先进技术应用到实际产品交付中，使得Thinker大模型具备行业领先性。优必选如何处理训练数据来源及硬件异构问题？在训练数据来源方面，优必选主要使用开源数据，同时结合自身真机及客户现场的数据进行训练。具体来说：则用于后期增强训练。这些多模态数据为基础模型提供广泛的息源。数据来形成通用表征，不要求必须是同构的数据。因此，即使不同机器人的硬件设计有所差异，通过学习这些差异性的数据，可以提取其中内在关系，从而实现通用性能提升。3.成本控制：由于大量使用互联网开源数据，这部分成本相对较低，有助于控制整体研发费用。优必选基础模型性能提升的关键因素有哪些？优必选基础模型性能提升得益于以下几个关键因素： 1.多模态数据融合：通过融合来自不同来源的大量多模态数据，包括互联网开源数据和真机操作记录，实现全面覆盖各种可能场景，提高了基础模型的适应性和泛化能力2.先进算法与强化学习结合：采用 Post Training（后期训练）、RejectFineTuning（拒绝采样微调）以及强化学习等方法，对基础模型进行优化，使其具备更强的问题解决和自我纠错能力 3．工程优化与算力利用最大化：通过蒸馏、量化加速等技术手段，在有限算力条件下实现高效运行，并确保不影响精度，这一系列工程优化措施保证了实际应用中的稳定性和可靠性。数据质量在AI 模型研发中的重要性如何？优必选在数据处理方面采取了哪些措施高质量的数据是AI模型有效性的首要贡献因素。2025年，优必选花费大量时间进行数据收集和全自动化数据标注。整个流程包括自动化标注、打分、重新标注，最终实现了几乎百分百的自动化标注流程。这种方法表明，优必选的AI模型研发已经从传统的以模型为中心转向以数据为中心。在机器人具身智能大模型评测中，目前行业内认可哪些评测基准？如何解决仿真环境与硬件部署之间的物理误差问题？目前行业内对于机器人的具身智能大模型评测主要关注任务规划、场景理解和物体感知等方面。优必选使用了17个面尚这些方向的评测集。关于仿真环境与硬件部署之间的物理误差问题,s现阶段仿真技术发展迅速，从环境模拟到物理属性仿真环境史测试，可以得到高置信度结果，这种方法被称为 Real im,‘写 Sim 未来3-6个月内，优必选的大模型更新目标是什么？当前模型是否具备异构部署能力？当前优必选的大模型是一个基础性模型，并不直接面向某一具体机型。在有了基础模型后，会针对特定机型进行微调，使其适应不同机型，如Work S2等。未来3-6个月内，主要目标是进一步探索VLA（视觉语言动作）和世界模型方向，并计划很快发布相关成果。优必选AI基座团队规模及研发资金来源情况如何？优必选整体研发人员超过1,000人，其中70%从事软件开发，30%从事硬件开发。当前优必选大模型在辅助标注及多模态交叉校验中的流程是怎样的？整体标注准确率如何？标注流程包括规则初筛和自动化精筛两部分。规则初筛用于筛掉不符合要求的数据，而自动化大模型则进行精细筛查。这两个环节都非常重要。目前整体标注准确率可以认为达到100%，因为任何不符合要求的数据都会被重新投入数据池进行反复标注，以确保最终所有数据都是可用且经过自动化处理的。在真实工业产线部署时，大脑部分Thinker大模型控制频率及推理延迟情况如何？是否能支持50~100赫兹以上实时闭环控制？ Thinker大脑部分主要负责任务规划和场景理解，其推理频率约为10 赫兹，不需要高频率运行。而V0A（视觉语言动作）小脑部分运行频率较高，可达50100赫兹。这两个模块采用异步推理模式，大脑负责高层次语义规划，小脑负责具体执行，因此能够实现稳定支持实时闭环控制。优必选的群脑网络和 CoAgent 如何与 Thinker模型进行技术衔接，实现多机器人协同作业？群脑网络和 CoAgent是基于大模型的应用或框架,而Thinker则是一个基础平台，可以应用于群脑网络和CoAgent。多机器人协同作业主要通过中心化的大脑来实现跨机共享，中心化的大脑通过决策模型为下一层分发指令，从而实现整体协作。优必选的开源模型如何支持开发者进行二次微调，并在硬件适配上做了哪些优化？优必选的模型基于开源协议和框架，与市面上主流使用的一紫框架能够匹配，因还会在开源社区中提供更多面向机器人硬优化的工具链，使得基于Thinker进行微调后的模型能够高效部署在优必选自已的机器人上。在数据安全方面，优必选如何确保Thinker模型训练数据中的敏感信息得到保护，并符合跨境数据传输相关政策要求？ Thinker此次只开源了模型，不涉及客户数据。未来在开源过程中，将严格遵循保密协议，不会泄露客户数据，只会开源自有素材中心的数据。这些措施确保了数据安全并符合相关政策要求。在工业场景落地过程中，优必选如何处理长尾问题，并通过数据回流机制提升模型性能？优必选依靠大模型基础能力，通过精选VLA（视觉语言动作）模块实现功能。在实际操作中，大模型展现出如失败重试等未预训练的新能力。对于长尾题，通过关注失败案例并将其重新收集、标注后加入到基础模型迭代中，从而形成有效的数据飞轮机制，提高整体性能 Thinker模型采用何种架构设计，其优势是什么？ Thinker 模型采用专家 MoE（Mixture of Experts）架构，是一种微服务架构，包含多个面向不同任务的MoE。其优势在于能够针对不同特殊任务匹配相应的新模块，提高系统灵活性和效率。在真实物理场景交互中，Thinker 模型如何融合多模态传感器数据，实现统一决策? 当前版本的 Thinker 是VIO（视觉惯性里程计）模型，没有力学触觉功能。但未来基于 Thinker 的 VLA 将包含力学触觉状态，通过 token 化将这些信息映射到统一 token 空间，实现统一决策。 Thinker 模型如何实现小样本强泛化，对于工业场景中的零样本或少样本迁移成功率及部署周期情况如何？关键技术在于高质量的小样本数据，这些数据更符合真实世界分布，加上大量训练，使得Thinker具备强泛化能力。在工业场景中的零样本或少样本迁移成功率较高，而具体部署周期取决于实际应用需求，一般较为迅速。与其他厂商相优必选的 Thinker 模型有哪些核心差异化优势？商业模式前最大优势是体积小，仅 4B，在端侧部署效率高。的拥有大量真实工业场景的数据，这些真实数据使得Thinker更贴返实际应用环境，提高稳定性和效率。对比其他厂商使用仿真或设计素材的数据，优必选的数据更加可靠。此外，通过快速响应下游需求及整合供应链资源，使得商业模式具有良好前景。

点击免费查看完整报告

优必选20260202

优必选 Thinker 大模型技术突破与应用

核心技术突破

数据与硬件处理

模型性能提升关键因素

评测与未来目标

团队与研发

实际应用表现

商业模式与差异化优势

你可能感兴趣

中山公用20260202

中国建筑 20260202

长江电新20260202锂电推荐更新过热涨价缓解带来主链修复窗口

黄金波动加剧美联储变局来袭20260202

2月金股组合推荐会议20260202

太空能源固态专家20260202

南华期货沥青产业周报：盘面并不具备持续升水的条件20260202

南华光伏产业周报：技术面进入下跌趋势20260202

格林大华期市早班车-白糖红枣（20260202）

20260202更新数据中信icon中证500减空375