您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:小鹏VLA20发布会点评202603021关于对小鹏VLA20模型 - 发现报告

小鹏VLA20发布会点评202603021关于对小鹏VLA20模型

2026-03-03未知机构单***
小鹏VLA20发布会点评202603021关于对小鹏VLA20模型

1、关于对小鹏VLA 2.0模型参数量/训练数据量的合理估算:此次发布会刘先明展示了以token为单位的小鹏VLA2.0 训练和推理的数据规模,我们这里做一些大家更为熟悉的口径估算还原:1)模型参数量:参考发布会披露VLA 2.0推理过程1秒消耗4.8万tokens,芯片算力口径按最早披露的1 颗图灵芯片=3颗OrinX计算(OrinX算力利用率~30%)。根据上述信息反推VLA 2.0激 小鹏VLA2.0发布会点评-20260302 1、关于对小鹏VLA 2.0模型参数量/训练数据量的合理估算:此次发布会刘先明展示了以token为单位的小鹏VLA2.0 训练和推理的数据规模,我们这里做一些大家更为熟悉的口径估算还原:1)模型参数量:参考发布会披露VLA 2.0推理过程1秒消耗4.8万tokens,芯片算力口径按最早披露的1 颗图灵芯片=3颗OrinX计算(OrinX算力利用率~30%)。根据上述信息反推VLA 2.0激活参数量~5B左右(如果是MoE端侧部署参数量会更高)。2)训练数据量:发布会披露累计训练数据量~50PB,1个clip通常是60s左右的11颗摄像头视频流(小鹏AI 鹰眼视觉方案11颗摄像头,3颗800w像素,8颗300w像素)。由此计算,小鹏VLA 2.0训练数据量可能已经达到5000w-1eClips左右。 1)模型的运行频率直接影响模型能力在端侧的兑现度,时延对MPI、舒适度体验都有非常大的影响。小鹏VLA 2.0基于图灵芯片的时延已经可以做到80ms(未考虑传感器和底盘的时延)以内。2)2025年智驾头部厂商不管是因为架构切换的阵痛期、组织架构调整等各种原因,很多领导觉着表观上25 年头部厂商的智驾体验提升幅度是在边际放缓的,或者说1/2梯队的差距在缩小。我们认为展望2026年让智驾头部厂商再次取得明显领先优势的正式软硬一体能力。