您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方财富]:机器人数采带来场景价值重估 - 发现报告

机器人数采带来场景价值重估

信息技术2025-08-06-东方财富风***
AI智能总结
查看更多
机器人数采带来场景价值重估

机器人数采带来场景价值重估传媒行业专题研究 评级:强于大市(维持) 高博文(分析师)S1160521080001郭天瑜(分析师)S1160524090006陈子怡(分析师)S1160522070002 报告摘要 ◆数据具身智能基石,物理数据更具价值。目前人形机器人已经达到L2级,L3级是人形机器人智能的下一阶段。数据是人工智能的基石,比如图生视频大模型中短视频数据加成至关重要、自动驾驶中特斯拉积累了38亿英里场景,海量数据是训练基础。相比于自动驾驶,具身智能交互复杂程度更高、场景更为多样。自动驾驶数据会采用大量训练仿真,但人形机器人的功能主要体现在上肢,数据储备极少,无法单纯通过训练仿真完成,物理采集必要性更大。 ◆对标Scale AI模式,具身智能市场广阔。相比于自动驾驶,人形机器人的数据采集和标注必要性更强、需求更加前置、复杂程度更高、价值量占比更高。根据EVTank预测,2035年全球人形机器人市场规模将达1.5万亿,人形机器人数据服务市场也将迎来广阔的发展空间。Scale AI是自动驾驶和大模型数据服务中的翘楚,通过Consumption-base模式和Enterprise模式为OpenAI、Etsy、通用汽车、Uber、PayPal等客户提供标注服务,2024年收入达8.7亿美元。未来具身智能领域也有望走出类似Scale AI的公司。 ◆看好工业物流场景,应用场景价值重估。从市场空间、成本替代、复杂程度三个层面分析人形机器人场景情况:市场空间:依次分别是家庭商业服务、医疗健康、工业生产、物流、安防巡逻、危险作业;2)成本替代:人类工资越高的,机器人替代性价比越高,依次分别为医疗健康、危险作业、工业生产、家庭商业服务、物流、安防巡逻;3)复杂程度:除场景本身的复杂程度外,还与薪酬基本相关,依次分别为医疗健康、家庭商业服务、工业生产、危险作业、安防巡逻、物流。服务于应用场景的服务商具有天然的渠道优势,可以将人形机器人配套与其分拣系统、生产设备一起销售给下游客户,并且形成先发优势。 ◆推荐:1)德马科技:卡位海外物流场景,与智元强强联合数采;建议关注:2)奥飞娱乐:持股顶尖动捕企业诺亦腾,携手智元探索算法提升;3)天娱数科:基于VLA的具身智能方案,加速落地物理AI。 ◆风险提示:宏观经济增长不及预期、技术升级迭代及创新风险、人形机器人业务拓展不及预期。 目录/Contents 数采创新商业模式 03 数采带来场景价值重估 04 数据瓶颈和局限性 01数据采集的必要性 1.1具身智能:人形机器人的下一阶段 ◆人形机器人由“大脑”、“小脑”、“肢体”三部分组成,其中肢体负责感知执行,小脑负责全身运动控制,大脑负责任务级交互。 ◆具身智能是人形机器人发展的下一阶段。根据智能化水平的不同,可以将机器人分为L1-L5级五个阶段。目前人形机器人已经达到L2级,即能够自主完成预设的简单任务,具备一定的环境感知能力,仍需人工指导和监督。L3级是人形机器人智能的下一阶段,可以实现特定场景下的完全自主运作。 1.2数据采集:具身智能的发展基石 ◆数据是人工智能的基石。以大语言模型和自动驾驶为例: 1)图生视频大模型:根据ArtificialAnalysis排名,全球图生视频大模型中字节跳动的Seedance1.0和快手的Kling2.0分别位列第一位和第四位,短视频巨头数据加成至关重要; 2)自动驾驶:根据特斯拉披露,其FSD基于超过100年以及38亿英里的匿名真实驾驶场景训练,比人类驾驶员更安全,单次事故的行驶英里数约320万,远超美国平均50万英里的水平,海量数据是训练的基础。 资料来源:Tesla Investor Day 2023,东方财富证券研究所 1.3数据采集:物理采集比数据仿真更有价值 ◆机器人产生的数据是多种多样的,其采集技术可以分为真实数据采集和仿真数据采集。 真实数据:机器人在实际环境中产生的数据,包括遥操作类数据和示教类数据。前者是通过远程控制机器人与环境或操作目标交互采集的数据,后者则是通过人工示范采集的数据,都是用于机器人学习的数据。 仿真数据:在模拟环境中生成的数据,包括生成类数据和合成类数据。前者是使用算法生成的模拟数据,后者是使用已有模型产生的用于模型更新的机器人仿真数据,或将不同来源的数据组合而成的新数据。 资料来源:《具身智能数据工程》,东方财富证券研究所 02数采创新商业模式 2.1数采工厂:挖掘数据金矿 ◆以上海智元数据采集工厂为例: 2024年9月,智元建立了3000+平方米的数采工厂,涵盖家居、餐饮、工业、商超和办公五大类型真实场景,支持100+机器人同时作业,单机器人每天约产生200条数据。预计达到通用可用的智能化程度,需要一亿条级别以上的数据。 2025年3月,智元机器人发布了首个通用具身基座模型——智元启元大模型(GO-1),帮助机器人获得通用的感知理解、动作执行等能力。GO-1大模型通过人类视频学习,将学到的能力泛化,适应不同形态的机器人,并持续迭代升级,将数据采集效率提升10倍以上。 资料来源:中国证券报公众号,东方财富证券研究所 资料来源:中国证券报公众号,东方财富证券研究所 2.2自动驾驶:数据占解决方案市场规模40%以上 ◆自动驾驶解决方案,包括人工智能数据及模型解决方案、高精地图及智能交通解决方案,其中数据及模型解决方案专注于为自动驾驶行业提供数据采集、数据标注、数据管理到模型训练解决方案。根据弗若斯特沙利文预测,2035年,中国人工智能数据解决方案规模将超过300亿元,占据自动驾驶技术服务市场规模的40%左右。 ◆相比于自动驾驶,人形机器人的数据采集和标注必要性更强、需求更加前置、复杂程度更高。根据EVTank预测,2035年全球人形机器人市场规模将达1.5万亿,人形机器人数据服务市场空间广阔。 资料来源:如祺出行官网,东方财富证券研究所 资料来源:如祺出行招股书,弗若斯特沙利文,东方财富证券研究所 2.3 Scale AI:自动驾驶和大语言模型数据标注翘楚 ◆ScaleAI是美国数据标注公司,通过子公司Remotasks(专注自动驾驶)和Outlier(专注大语言模型)将数据标记工作外包,其商业领域客户包括OpenAI、Etsy、通用汽车、Uber、PayPal等。2025年6月,Meta以143亿美金收购其49%股份。 ◆Remotasks:聚焦于机器视觉和自动驾驶数据标注的外包平台,覆盖全球90余个国家,超过24万任务执行者,累计产生1500万美金收入。按照用户级别、准确度和任务难度定价,Remotasks标注员的工资大约在10-25美元/小时。 2.3Scale AI:自动驾驶和大语言模型数据标注翘楚 ◆Outlier:聚焦于大语言模型数据标注的外包平台,覆盖全球50余个国家,超过10万个各领域专家(87%标注员拥有大学文凭),累计支出5亿美金。相比之下,Outlier对领域专家需求更高,标注员需要选择AI回答更准确、更流畅且“没有AI味”的回复,甚至需要重新撰写答案。 ◆ScaleAI收费模式包括Consumption-base模式(按条计算)和Enterprise模式(根据企业需求;2024年ScaleAI实现8.7亿美元收入,预计2025年实现20亿美元收入。 图13:Outlier数据标注众包平台数据 资料来源:Outlier官网,东方财富证券研究所 2.4数采玩家:应用厂商和第三方企业入局 ◆目前人形机器人数据采集尚处于早期阶段,主要玩家包括三类: 1)本体厂商:如智元数据采集中心、石景山人形机器人数据训练中心(睿尔曼等)等。数据主要供自身使用,也开源部分数据给行业; 2)场景厂商:如天奇股份人形机器人数据采集和实训中心、德马科技人形机器人数据采集中心等。通常与本体厂商合作,一方面,优化人形机器人应用表现,另一方面,探索具身智能数据交易商业模式; 3)第三方:如CyberOrigin(特斯拉、英伟达人形机器人合作伙伴)。基于数据手套通过动作捕捉来收集人形机器人运动数据,并销售给人形机器人本体企业。 资料来源:天奇股份公众号,东方财富证券研究所 资料来源:CyberOrigin官网,东方财富证券研究所 03数采带来场景价值重估 3.1应用场景:看好工业生产和物流场景落地 ◆我们从市场空间、成本替代、复杂程度三个层面分析人形机器人场景情况: 1)市场空间:依次分别是家庭商业服务、医疗健康、工业生产、物流、安防巡逻、危险作业; 2)成本替代:人类工资越高的,机器人替代性价比越高。依次分别为医疗健康、危险作业、工业生产、家庭商业服务、物流、安防巡逻; 3)复杂程度:除场景本身的复杂程度外,还与薪酬基本相关。依次分别为医疗健康、家庭商业服务、工业生产、危险作业、安防巡逻、物流。 目前来看,家庭商业服务、医疗健康市场规模大但短期人形机器人难以满足实际需求;危险作业可替代性强但市场空间较小;安防巡逻各方面适中但对人形(上下肢)需求不高;工业生产、物流场景最为合适。 3.2物流分拣:以Agility为例,首个商业化落地人形机器人企业 ◆Agility于2015年成立,2017年发布全尺寸人形机器人Digit,2021年拓展了Digit功能,专注于物流搬运业务,2023年公司与亚马逊、GXO(全球最大的纯合约物流商)合作。Digit可以完成装载、卸载、堆叠、码垛、卸垛等基本工作,载重约16公斤; ◆Agility采取两种收费模式:1)RaaS(机器即服务):基于订阅的全包服务,按照机器数量和小时数付费;2)购买:直接拥有人形机器人,包含技术SaaS服务,投资回报期最快可达2年。 资料来源:Geerkwire,东方财富证券研究所 资料来源:Agility官网,东方财富证券研究所 3.3工业生产:替代价值量更大,但难度也更大 ◆宝马集团早在2024年1月就宣布与美国加州机器人初创公司Figure AI合作,2024年8月,搭载OpenAI大模型的Figure02人形机器人问世,同样进入宝马工厂进行测试和实训。从官方发布视频来看,Figure能够从事简单的抓取工作。相比于传统的工业机械臂,Figure最大特点是“人形设计”和“自主决策”。根据沙利文大中华区执行总监判断,工业生产对人形机器人的精度和效率要求更高,目前人形机器人应用于汽车装配车间的技术和产品水平大约只达到30%标准。 ◆工业生产替代价值量更大,尤其是海外市场。以汽车生产线工人时薪对比(不考虑福利),中国工人40人民币/小时,日本工人1500日元/小时,美国工人28美元/小时,比例分别为1.0:1.8:5.0,人形机器人替代或将从海外率先开始。 资料来源:Figure官网,东方财富证券研究所 3.4价值重估:数据带动应用场景重估 ◆应用场景价值一:类似于AI和SaaS关系,2B场景率先应用,服务于应用场景的服务商具有天然的渠道优势,可以将人形机器人配套与其分拣系统、生产设备一起销售给下游客户; ◆应用场景价值二:数据采集工厂中的数据采集只能满足基础运作需求,想要提高人形机器人的准确率和效率,仍需要在应用场景中不断精进,数据使得率先应用人形机器人的场景方具有显著先发优势(边使用边训练)。 资料来源:德马集团官方公众号,东方财富证券研究所 资料来源:无锡金融发布公众号,东方财富证券研究所 04数据瓶颈和局限性 4.1数据瓶颈:成本黑洞、数据孤岛以及评估困难 ◆具身智能数据需求包括大脑的训练、技能的训练、小脑的训练和端到端的训练,其中大脑训练数据需求基于物理世界常识和机器人领域知识、技能训练数据需求基于(人类演示+机器人感知)×多种场景、小脑训练数据需求基于(技能训练数据+人类语义标注)×多种任务、端到端数据训练需求基于(大脑训练数据+小脑训练数据)×多种型号; ◆具身智能数据瓶颈:1)成本黑洞:大量采集高质量的人类演示和机器人感知数据成本高昂;2)数