AI智能总结
1、垂直领域机器人进展分析 ·垂直领域机器人优势:垂直领域机器人相比通用机器人优势显著。通用机器人缺数据、推理慢、控制难,而垂直领域机器人数据易获取,可加速数据飞轮;模型更小,能缩短推理延迟、匹配边缘算力;控制策略成熟,多采用上肢或轮式方案。其基于微调垂类大模型、多传感器融合和工业机械臂,可让原本无法自动化的柔性工序实现自动化升级,形态介于具身智能机器人与工业机器人之间。 ·当前进展与后续展望:当前,较多企业已完成样机开发,正推动模型训练,服装物流等部分行业企业已完成样机展示,产品以上肢或上肢加轮式为主。后续,预计四季度部分企业将发布产品,有望实现小批量订单或客户现场测试;随着数据量提升和模型架构优化,2025年行业将推动产品小批量部署到客户现场测试、采集数据,提升产业化能力。 2、手眼协同调研更新与趋势 ·3D视觉发展与奥比中光:机器人智能化水平提升将大幅增加对3D视觉的依赖。目前约60%-70%的机器人搭载了包括深度相机在内的多种传感器,但大部分机器人因太笨,无法有效理解深度相机传递的信息,难以完成现实任务并进入家庭、工作场景。未来,随着机器人智商提升,其对视觉信息的需求将显著增加,3D视觉渗透率及高精度视觉摄像头需求有望持续提升。奥比中光作为该领域核心企业,优势显著:技术上,3D视觉摄像头涉及多学科交织,技术壁垒高,需全链路打通,其新品技术参数已超英特尔;生态上,与英伟达核心绑定;基本面上,公司盈利问题已改善,2025年前五月利润持续超预期,预计全年盈利超1亿,已跨过盈亏平衡点,后续费用增长趋缓,利润增长将接近收入增长,未来将迎来利润爆发期。 ·灵巧手发展趋势与标的:灵巧手发展呈现两大趋势:一是自由度大幅提升。人类手部有24个主动自由度,当前主流灵巧手以11个主动自由度为主,特斯拉及国内企业规划的灵巧手均向20个以上主动自由度发展,目标是接近人类水平。二是触觉传感器渗透率及覆盖面积持续提升。20222023年手类产品基本未用触觉传感器,2023年11月特斯拉开始使用后,国内新品中该传感器出现频率增加;覆盖范围从指尖扩展至指节,如兆威机电发布的灵巧手,单手使用12块。因触觉传感器延展性好且原材料成本低,大面积扩展无成本压力,当前成本约每平方厘米100200元,未来有望降至更低。相关标的包括兆威机电、雷赛智能、福莱新材及平安股份。 3、具身智能模型与物理AI分析 ·生物智能五阶段映射:生物智能发展分五个阶段,能力线性演进,与具身智能算法发展高度契合。第一阶段线虫,趋利避害的条件反射由DNA编码决定,如避开高浓度生理盐水。第二阶段鱼类,有初级强化学习(RL)能力,以多巴胺分泌为奖励函数,在环境交互中试错,平衡短期行为与长期繁衍目标。第三阶段小鼠,借海马体长期记忆发展模拟学习,可想象未发生行为以规划未来,无需实际试错。第四阶段猩猩,前额叶进化使其有模仿学习能力,可观察同类行为学习新技能,是智能驾驶、机器人预训练基础。第五阶段人类,能通过语言传递知识、代际传承并达成大规模协作共识。由此得出两个结论:一是高阶智能生物如人类共存多阶段智能;二是语言是第五阶段智能表现,智能本质是对外界环境反馈并达成目标的能力。 ·VRM与VRA模型差异:VRM(视觉语言模型)与VRA(视觉语言动作模型)核心差异在闭环能力。VRM仅实现图像与语义融合理解和生成,无法控制机器人或车辆动作。VRA理论上是闭环系统,当前多为VLT(视觉语言轨迹模型),仅能生成未来几秒的粗糙行为轨迹,无法直接控制执行端。VRA闭环落地关键在于符合物理约束的传统规控算法(如PID、MPC),其价值体现为:一是安全兜底,规避模型幻觉导致的物理极限风险;二是保障实时性,传统算 法低延迟可满足高速场景需求;三是具备可解释性,白盒规则支持安全行业的合规审计。·物理AI两条路线:国内物理AI发展有两条技术路线。一是基于国产CAE(计算机辅助工程)求解器的仿真平台路线,用复杂磁场、流体、结构力学等求解器合成数据并嵌入规则。索辰科技作为国内CAE龙头,布局物理AI低延迟算法,与华南低空经济产业合作,为美团无人机提供复杂气流环境下的低能耗配送调控。二是基于NvidiaOmniverse等3D渲染引擎的路线,利用GPU渲染生成数据并指导规则。群核科技依托早期酷家乐家居3D建模积累,结合Nvidia显卡算力,发展高精度3D渲染引擎。两条路线旨在解决通用机器人领域缺数据、推理慢、控制难的痛点,核心是构建符合物理约束机理的低延迟物理求解器。 Q&A Q:生物智能的五阶段发展具体包含哪些内容? A:生物智能五阶段发展依次为:第一阶段,线虫基于DNA编码的条件反射转向能力,具备基本趋利避害能力;第二阶段,鱼类为代表的早期脊椎动物掌握初级强化学习能力;第三阶段,小鼠为代表的哺乳动物具备长期记忆和模拟学习能力;第四阶段,猩猩和猿猴为代表的灵长类动物具备模仿学习能力;第五阶段,人类通过语言进行大规模协作。 Q:VRM与VRA的最大区别是什么? A:VRM仅具备图像与语义层面的融合理解及生成能力,无法直接指挥动作轨迹;VRA本质为VRT,可生成未来几秒的行动轨迹,但无法直接控制具体执行部件。 Q:VRA闭环落地的关键环节是什么? A:VRA闭环落地的关键在于依赖符合外部环境约束的物理AI能力,并需结合传统规控算法。其价值主要体现在三方面:一是通过安全兜底规避模型幻觉导致的物理极限超出现象;二是通过低延迟执行保证实时性,满足高速场景或精密操作需求;三是通过白盒规则实现可解释性,支持安全合规审计。 Q:物理AI的两条主要发展路线是什么? A:物理AI的两条主要发展路线分别为:第一条基于国产CAE求解器的仿真物理AI,利用复杂磁场、流体、结构力学求解器合成数据并嵌入规则;第二条基于Nvidia Omniverse等3D渲染引擎的物理AI,通过GPU渲染合成数据并指导规则。国内相关企业包括索成科技和群核科技。