AI智能总结
033D⽣成 空间智能是主要基于3D视觉信息进⾏理解、推理、⽣成、交互的AI系统 空间智能概览:3D⽣成、自动驾驶、具身智能是空间智能不同成熟度的应用领域,XR是空间智能的原⽣交互⽅式 ⽂字、图片、视频数据相比空间智能规模更⼤,支撑了以语⾔模型为核⼼的AI浪潮快速发展,3D和物理AI在数据成熟后空间智能也将迎来爆发 分析 •⽂本、图片、视频等数据由于互联⽹内容的长期积累,数据规模上显著⼤于自动驾驶、3D和具身智能•空间智能涉及3D视觉类数据、物理世界交互数据,互联⽹数据的作用有限,需要等待数据体系进⼀步成熟,数据整体上比语⾔更复杂,对数据处理的要求也更⾼ 自动驾驶是空间智能目前规模最⼤、最成熟的应用,已经接近⼈类⽔平,技术前沿开始从模仿学习转向强化学习,以保持性能增长 自动驾驶有最成熟的空间智能数据体系,核⼼在于⼤量车队的数据积累,同时可以构建⼤模型的数据闭环,通过正反馈加速驱动模型迭代 •数据规模⼤:特斯拉FSD在过去3年已经积累30亿英里的驾驶里程,同时每日里程积累数量已经突破1千万英里,并随着特斯拉车队规模扩⼤加速增长,Waymo的模拟⾏驶里程已经达到了150亿英里,累计⾏驶里程超2千万英里 自动驾驶数据来源 •最主要的训练数据,涵盖⼤量复杂多样的环境变化,保真度最⾼ 自动驾驶已经出现清晰的空间智能Scaling Law,接管里程随底层算⼒扩展和强化学习新进展快速增加,在百万卡集群支撑下将超过⼈类⽔准 3D⽣成是数字世界的空间智能,由图形学和AI共同驱动,处于技术快速进步阶段,当前最⼤瓶颈是寻找具有良好扩展性的3D数据表征 分析 3D⽣成受益于游戏、CG制作等⾏业,有⼀定数据积累,数据体系较为成熟,目前开源数据已耗尽,如何持续获得⾼质量3D模型数据成为关键 描述 •积累规模中:由于游戏、CG等⾏业的迅速发展(如Unity、EPIC等公司),积累了⼤量的⾼质量3D模型可以用于训练,各类3D模型分享平台(如Sketchfab、TurboSquid、CGTrader等)也加速了3D数据的获取和传播 3D数据来源 3D模型资产 3D打印数据 •目前难以满⾜模型训练的精度需求 •精度和质量需要达到3D模型师⼿⼯⽣产的⽔准 程序化数据 3D扫描数据 •目前数据质量和精度不⾜ •目前数据质量精度不⾜,但可以补充材质数据 具身智能是空间智能未来规模最⼤的应用,可以和物理世界深度交互,但目前整体成熟度较低,头部玩家即将开始⽣产环境实验 具身智能目前最⼤的瓶颈在于数据,各层面均处于早期阶段,如何权衡真实数据和模拟数据,已成为⾏业内发展路径差异的关键分歧 扩展现实(XR)的硬件基础正在成熟,可实现3D类内容的原⽣消费,未来随着3D原⽣内容和相关应用⽣态的成熟将打开更⼤的市场 扩展现实(XR)是目前训练具身智能的关键数据采集⽅式,可以加速真机数据增长推动空间智能发展,业内已有众多相关实践 领先机构 具体实践 •Meta推出了HOT3D数据集,能够加速机器学习研究以分析⼿与物体的交互。该数据集包含以第⼀⼈称视角的用户抓取和操纵各种物体的⾼质量3D视频,展示了19名受试者与33种不同刚性物体的交互,以及多模态信号,如眼动跟踪或场景点云•该数据集由Meta的两款头戴Project Aria和Quest 3设备录制 世界模型是从⼤量数据中构建理解世界运作⽅式的内部表征,可以推理⾏动后果预测未来,精确完备的世界模型是空间智能发展的终局状态 内部表征 预测未来 •世界模型的本质是在内部表征外部世界的关键元素和关系,将复杂系统简化为可理解的模式和规则,例如直觉层快速反应的模式识别,概念层抽象概念和类别的组织,因果层理解事件间的因果关系 •基于规则推理:应用已知规律推测未来状态•概率模型:考虑多种可能性及其概率分布•仿真模拟:在虚拟环境中模拟多种情景的演变•反事实思考:分析"如果...会怎样"的假设情境 •需要通过经验、观察、学习、交流、试错等⽅式逐步建立和完善 世界模型可以通过各种技术路径逼近,但不同路径的精度和效率各异,空间智能侧重3D和物理AI,可能是建模真实世界的最佳⽅式 图像/视频⽣成模型 语⾔⼤模型 3D⽣成模型 自动驾驶模型 具身智能⼤模型 空间智能玩家图谱 关于量子位智库: 量子位旗下科技创新产业链接平台。致力于提供前沿科技和技术创新领域产学研体系化研究。面向前沿AI&计算机,生物计算,量子技术及健康医疗等领域最新技术创新进展,提供系统化报告和认知。通过媒体、社群和线下活动,基于专题技术报道及报告、专项交流会等形式,帮助决策者更早掌握创新风向。 关于量子位: 量子位(QbitAI),专注人工智能领域及前沿科技领域的产业服务平台。 全网订阅超过500万用户,在今日头条、知乎、百家号及各大科技信息平台量子位排名均为科技领域TOP10,内容每天可覆盖数百万人工智能、科技领域从业者。 分析师:Xuanhao(微信:feeltheagi)智库负责人:李根(微信:ligen603)商务合作:赵萌(微信:13343397239)