您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [财通证券]:物理AI时代到来,数据成重要驱动力 - 发现报告

物理AI时代到来,数据成重要驱动力

信息技术 2026-06-15 财通证券 华仔
报告封面

汽车 证券研究报告 行业专题报告/2026.06.15 物理AI专题报告 投资评级:看好(维持) 核心观点 数采面临部分难题,数据为当下物理AI发展的关键因素:物理AI的发展离不开算法、算力、数据三要素,目前算法模型正逐渐收敛,数据成为决定物理AI发展的重要因素。与数字AI不同,物理AI对数据要求更高,例如多模态覆盖、时空对齐且物理精确度高等。当下物理AI数采面临“规模小、成本高、质量标准缺失、虚实鸿沟大”等难题,物理AI厂商的竞争已从算法算力的比拼,逐渐转向寻求高质量、大规模数据供给能力的竞争。 物理AI各类数据优劣势明显,数据融合成为趋势:物理AI的数据种类呈“金字塔式”架构,最底层数据是海量的互联网公开资料;中间层为仿真数据以及无本体数采得到的数据(UMI、Ego等);顶层是遥操等真机数据。各类数据优劣势明显,单一数据无法同时兼顾“真实性/精度、规模、成本、效率”等方面的要求。行业目前正逐渐将各类数据进行融合、发挥彼此优劣势,例如仿真数据来提高数据规模并覆盖长尾场景,真机等高质量数据进行微调等。 分析师吴晓飞SAC证书编号:S0160525090003wuxf01@ctsec.com 联系人王宁wangning01@ctsec.com 政府重视数据发展,各类数据厂商产品种类丰富:我国政府重视具身智能等物理AI领域的数据发展,并出台相关文件支持;北京、上海等地的人形机器人训练中心也建设了数据训练场。厂商层面,多家数据厂商推出不同产品,例如以鹿明机器人、觅蜂科技为代表的厂商发布了无本体数采设备(UMI/Ego等),光轮智能等厂商以仿真合成数据为主,提供底层数据引擎。此外,部分厂商正推出开源数据集或上线数据商城,共同促进行业加速发展。 相关报告 1.《整体承压,表现符合预期,关注Q3边际变化》2026-06-112.《无人配送应用前景广阔,国内迎来加速期》2026-03-033.《AI带动巨量电力需求,美国现场发电空间可期》2026-02-27 ❖投资建议:数据是当下决定物理AI发展的关键因素,随着物理AI产业的加速发展,对应数据需求将不断提升,各数据厂商的订单也有望高速增长。物理AI的数据厂商主要包括提供数据集或仿真引擎的厂商,以及生产数采设备等硬件的厂商。1)其中数采设备的关键部件包括摄像头、IMU、数采手套等,对此推荐标的为福莱新材、华依科技,建议关注为奥比中光。2)提供仿真或数据资产相关标的建议关注索辰科技、慧辰股份。 ❖风险提示:物理AI产业进度减缓、厂商竞争加剧、基础设施(存储等)资源紧张。 内容目录 1数据是当下决定物理AI发展的关键因素................................................................................................31.1 AI发展离不开“算法、算力、数据”三驾马车........................................................................................31.2算法架构正在收敛,数据是当下物理AI发展的关键决定因素.........................................................32各类数据优劣势明显,数据融合成为趋势...............................................................................................53厂商和政府加速布局,补齐物理AI数据短板........................................................................................73.1政府重视底层数据建设,部分地市的机器人中心已成立数据训练场................................................73.2各厂商产品种类丰富,且开源部分数据或上线数据商城....................................................................84投资建议.....................................................................................................................................................105风险提示.....................................................................................................................................................10 图表目录 图1: AI的发展离不开数据、算力、算法三要素........................................................................................3图2:物理AI尤其是具身智能对数据采集的要求比较特殊,当下面对诸多难题..................................4图3:截至2025年12月我国网民规模达到11.3亿人................................................................................5图4: 2025年已有512万辆车搭载城区/高速NOA功能............................................................................5图5:物理AI涉及的数据形成一种“金字塔式结构”..................................................................................5图6:物理AI数据采集涉及多种方式..........................................................................................................7图7:北京人形的数据基地覆盖多个场景....................................................................................................8图8: 2025年国地中心具身智能训练场在上海正式启用............................................................................8图9:多个厂商推出了UMI和Ego产品......................................................................................................8图10:光轮智能等厂商可提供高质量仿真方案..........................................................................................9图11:简智机器人推出开放数据集直接下载...............................................................................................9图12:帕西尼将数据上线至商城..................................................................................................................9图13:京东将数采场景延伸至真实社区和工厂........................................................................................10 1数据是当下决定物理AI发展的关键因素 1.1AI发展离不开“算法、算力、数据”三驾马车 数据、算法、算力是物理AI发展的三大核心要素。物理AI作为AI的一个分支,其发展同样离不开“算法、算力和数据”三要素。其中数据可视为物理AI的燃料,决定了其学习内容,是物理AI的底层基础设施;算力主要影响模型的训练效率与学习速度,可视为物理AI的加速器;算法则是AI的方法论,协助模型从海量数据中提取规律,将数据转化为可执行的智能。 数据来源:玄天智能,财通证券研究所 1.2算法架构正在收敛,数据是当下物理AI发展的关键决定因素 物理AI的算法模型正在收敛,VLA+世界模型范式逐渐形成。物理AI的算法模型目前主要包括VLA和世界模型,两种方案作用场景不同:VLA模型在经过图文预训练之后能够具备语言理解和执行任务等方面的能力,世界模型则能够基于当前的动作预测未来的状态。VLA模型可以决策如何行动,世界模型则进一步判断行动之后的结果,两种模型并非互相替代,彼此结合才能发挥模型的最大功效。目前许多业界专家提出了二者结合的观点,例如五一视界物理AI算法工程师侯博士表示VLA+世界模型或许是解决物理AI数据饥渴的最优解,小鹏通用智能中心负责人刘先明则在2026 CVPR上表示小鹏物理世界的基座模型既是第二代VLA也是世界模型。 数据方面,物理AI对数据采集的要求较为特殊且面临几大难题,数据成为当下限制物理AI发展的关键因素。 具身智能等物理AI领域对数据采集有着特殊要求。1)覆盖多模态数据,具身智能所用于训练的数据除了纯视觉以外,还需涵盖触觉、力觉、听觉等感官因素,以及现实物体的材料、质量、摩擦力等物理属性。2)时空对齐和物理精确性要求高:物理AI传感器所收集的数据需要在空间上实现毫米级别的对齐,时间上实现微秒级的同步,确保模型训练不会出现偏差,避免在现实世界完成任务时造成不良后果。3)面对海量长尾场景:物理AI应用场景丰富,包括零售、家居服务、仓储物流、医疗护理、精密制造等,物理AI所需要的训练数据需覆盖现实世界的海量长尾场景。4)数据质量要求高:数字AI时代数据规模较为重要,但物理AI对数据质量的要求更高,低质量数据无法助力模型在交互复杂的物理环境中完成任务。 当下物理AI的数据采集面临几大难题。1)数据规模小:根据《中国证券报》刊发的文章,觅蜂科技董事长姚总认为目前具身智能高质量数据规模仅50万小时级别,而根据阿里云高级算法专家张民英,要让具身智能模型能力实现突破则需要100亿小时数据量级,彼此之间差距巨大。2)获取成本高:时间成本方面,根据甲子光年与觅蜂科技的采访,目前真机采集8小时可能仅产出2-3小时有效数据,采集效率较低;资金成本方面,一套用于高质量数据采集的遥操作设备的成本大约超过20万元。且根据觅蜂发布会的圆桌论坛,目前采集一小时数据的成本约200元,百亿小时的成本将会难以负担。3)质量标准缺失:目前行业标准有所缺失,不同厂商生成数据的格式、坐标系、模态定义都有差异,较难彼此互通以及复用,厂商会将较多精力用于数据转换;此外采集的数据质量有参差或标注不规范的现象也存在。4)虚实鸿沟明显:仿真数据与真实世界之间存在差异,无法还原所有物理细节。 受限于上述因素,物理AI相较于数字AI的数据采集难度更高、规模更小。受益于数字世界的红利,传统语言或视觉大模型可以利用互联网数十年积累的海量资料进行训练