
证券分析师:黄细里执业证书编号:S0600520010001联系邮箱:huangxl@dwzq.com.cn2026年3月23日 核心结论 ◼2026年C端汽车智能化的主要矛盾已经从覆盖面向体验优化切换。主要智能驾驶主机厂/方案供应商已实现包括环岛、掉头等复杂场景的城市NOA落地体验,并完善车位到车位、ETC通行等高阶功能,后续主要优化方向为CornerCase的处理能力,以提升乘客与安全员的驾驶体验。 ◼2024-2026年间,我们通过智能化路测,总结出了智能驾驶经验性的“不可能三角”,在体验维度表现为全场景能力、丝滑拟人程度、应急处理能力,在模型层面分别为泛化性(Generalization)、可解释性(Interpretability)与时延性(Real-time/Latency)。从路测经验性维度总结,这三个指标往往难以同时达到顶尖水平。泛化性:处理从未见过的长尾场景的能力,或为目前智驾模型攻克的核心方向。可解释性:系统做出决策的逻辑是否透明,能否告诉用户和工程师“为什么这么开”,可解释性越好,对智驾调整的速度就越快,是智驾能力曲线的一阶导数。实时性:从感知到执行的推理延迟,直接关系到高速行驶的安全,可以保障MPI的下限,但除去模型本身,其表现或能通过硬件提升。 ◼在小鹏第二代VLA的Beta版本,我们在路测体验维度已经感受到了其整体能力的提升。1)全场景能力提升:能够处理内部路场景,应对抬杆、内部环路能力初步体现,实现无导航的自主漫游。2)丝滑拟人程度提升:在博弈环节自然流畅,无法理解的无效型变道减少,方向盘不再出现反复僵硬调整,窄路会车时不再出现急刹停滞,而是精确控制横向距离向前蠕行。3)仍存在的一些问题:选道能力待加强,一是直行分岔路口存在选错岔道情况,二是变道无法加塞时或出现在非对应车道过红绿灯的情况(例如在直行道左转);应对鬼探头的突发能力待加强。 ◼投资建议:坚定看好小鹏汽车!我们认为小鹏的估值体系将完成由汽车公司向物理AI科技公司切换,第二代VLA大模型提升了实测场景下的接管率、通行效率和能力涌现方面表现,加速了公司在C端智能车、B端Robotaxi以及机器人业务的布局。同时公司将自身定位升级为智能技术解决方案供应商,大众成为第二代VLA首发客户,开创商业化落地第二曲线。 ◼风险提示:全球AI技术创新低于预期;国内L3智能化渗透率低于预期。 智能化路测体验维度的【不可能三角】 丝滑拟人程度 全场景能力 •技术核心:利用思维链和价值函数推演。 技术核心:从背标准答案转向理解规律。路测对应典型场景:✓临时施工避让:车辆能理解路边临时路锥和摆放杂乱的施工围栏,自主规划出绕行路径。✓异形障碍物识别:能够识别路面上突然出现的非标准物体。✓乡村/园区无图漫游:在私人园区或复杂乡村小路依靠理解看懂路牌和通行逻辑,自主寻找车位或目的地。 应急处理能力 丝滑拟人程度 应急处理能力 •技术核心:软硬协同的帧率提升。•路测对应典型场景:✓鬼探头:较高时速行驶中,紧急避让侧向视野盲区冲出的行人或非机动车,或前车突然变道出现的障碍物。✓过弯后的直行分岔口:车辆过弯后出现需要判断的分岔路口,瞄准正确直行分岔口。 智能化路测模型维度的【不可能三角】 纵向比较:基于固定路线的小鹏智驾路测变化 ◼2024年5月,我们开启小鹏城市NGP路测。2025年1月起,我们基于上海固定复杂路线持续路测。近2年的时间,我们观察到小鹏呈现出渐进式的变化: ➢1)固定路线绝对接管次数减少,且接管性质从安全型接管向效率型转变;➢2)需要打分的场景在变少,侧面证明行车习惯越来越拟人化;➢3)关注点从能否挑战难度场景向正常行驶的舒适性体验转变。 智能化路测【不可能三角】及经验性总结 小鹏第二代VLA架构迭代 小鹏第二代VLA路测结果及横纵向比较 核心结论及风险提示 一、智能化路测【不可能三角】及经验性总结 智能化路测体验维度的【不可能三角】 丝滑拟人程度 全场景能力 •技术核心:利用思维链和价值函数推演。 技术核心:从背标准答案转向理解规律。路测对应典型场景:✓临时施工避让:车辆能理解路边临时路锥和摆放杂乱的施工围栏,自主规划出绕行路径。✓异形障碍物识别:能够识别路面上突然出现的非标准物体。✓乡村/园区无图漫游:在私人园区或复杂乡村小路依靠理解看懂路牌和通行逻辑,自主寻找车位或目的地。 应急处理能力 丝滑拟人程度 应急处理能力 •技术核心:软硬协同的帧率提升。•路测对应典型场景:✓鬼探头:较高时速行驶中,紧急避让侧向视野盲区冲出的行人或非机动车,或前车突然变道出现的障碍物。✓过弯后的直行分岔口:车辆过弯后出现需要判断的分岔路口,瞄准正确直行分岔口。 智能化路测模型维度的【不可能三角】 智能化路测模型维度的【不可能三角】 ◼2024-2026年间,我们通过智能化路测,总结出了智能驾驶经验性的“不可能三角”,分别为泛化性(Generalization)、可解释性(Interpretability)与时延性(Real-time/Latency)。 ◼从路测经验性维度总结,这三个指标往往难以同时达到顶尖水平: ➢可解释性:系统做出决策的逻辑是否透明,能否告诉用户和工程师“为什么这么开”,可解释性越好,对智驾调整的速度就越快,是智驾能力曲线的一阶导数。 ➢时延性:从感知到执行的推理延迟,直接关系到高速行驶的安全,可以保障MPI的下限,但除去模型本身,其表现或能通过硬件提升。 ◼针对Rule-based、E2E、VLA与WAM,我们尝试将其路测表现与其原因对应到这三个维度上。 二、小鹏第二代VLA架构迭代 架构迭代:第二代VLA大模型 ◼小鹏探索出第二代VLA大模型。从标准VLA(V→L→A)转为创新VLA(省略语言中间层转译),降低信息损耗,推理效率更高,反应更快。 效果:第二代VLA实现三大体验提升 ◼小鹏第二代VLA实现跨越L2到L4的三大体验升级。1)安心丝滑:妈妈敢用;2)全场景能力:哪里都能用;高效率:老司机爱用。 ➢核心场景覆盖能力:1)支持复杂场景识别与处理,包括逆行车辆、路边突然开门、障碍物、颠簸路面、夜间行人、动物穿行等。2)实现全场景通行,涵盖城市主路/辅路、小区/地下停车场、窄路(胡同、城中村)、施工占道、夜市(异形物、人流)、乡村小路、暴雨/夜间环境等。3)支持P档激活起步(路边/停车场原地激活NGP,前后车距近的场景暂未支持,2026年后续版本解决)、无导航漫游(城区/停车场漫游,地下停车场漫游最晚下一期发布)、乱停车场景自主寻路。➢舒适度与效率优化:1)推出小鹏智驾舒适度评测软件,从急刹急加速、切线变道晃动、颠簸、行程顺畅度四个维度评估,目标达到专业本地老司机水平。2)对比传统L2辅助驾驶,第二代XNGP急刹次数显著减少,行驶更平缓;综合行车效率较当前L2提升23%,初步比肩老司机。3)具备智能交互能力,如主动避让救护车、配合交警查酒驾停车等。➢性能与安全目标:计划2026年内将所有道路场景覆盖度提升至与城市主干道一致。目标2026年8 月在中国实现Tesla FSD在硅谷的效果(中国场景难度更高);预计1-3年内实现完全自动驾驶。 本质:自动驾驶问题本质是物理AI问题 ◼自动驾驶的本质是AI问题,AI的规模法则同样适用于物理世界模型。 ◼小鹏第二代VLA的突破并非单点能力升级,而是遵循L4能力等于“模型x算力x数据x本体”的规模法则。 模型:打造原生多模态物理世界基模 ◼小鹏第二代VLA是原生多模态物理世界大模型,看、听、读合一,跨越模态壁垒,复刻人类感知本能。 ➢VLA 2.0设计了原生多模态tokenizer,以更高效率编码信号并实现早期融合,避免单一模态偏差;➢模型采用32倍超密视觉推理思维链(VisualCoT)技术,更快的思维过程,更高的预测精度,相比传统CoT预测误差降低33%。支持多模态输出(语音、视觉、动作、行为);➢模型具备多模态输出能力,可生成视频、声音及动作行为,支撑世界模型、仿真和self-play强化学习,也是原生舱驾一体、舱驾联动的基础框架。 算力:车端云端算力同步提升 ◼车端云端算力同步提升,持续优化有效算力。➢车端算力:自研图灵芯片,软硬件一体研发,芯片-编译器-模型联合优化,开发自动化编译器最 大化算力利用率,根据芯片定制化图灵结构。模型车端模型运行效率提升12倍,计算利用率提升至图灵模型+图灵芯片的82.5%,单颗图灵芯片有效算力接近10个Orin X。 ➢云端算力:单颗GPU训练效率从0.1 sample/s提升至1.1 sample/s(提升超1000%),单个任务训练效率提升43倍,GPU硬件利用率从40%提升至90%。 数据:物理AI所需Tokens大幅提升 ◼物理AI所需Tokens迅速提升。 ➢小鹏单次训练云端高质量数据达50PB,为大语言模型的20倍,每秒钟传感器数据输入达53亿字节,训练模型整体的Token数量达4万亿,与ChatGPT训练规模相当。➢小鹏第二代VLA车端模型推理Token消耗量(20万辆Ultra车日均消耗58.8万亿Tokens)约等于全国数字AI Token日调用量的80倍。 推送节奏:第二代VLA 3/4月集中全量推送 ◼小鹏第二代VLA 3月下旬及4月开启全量推送。 ◼2026年重要里程碑包括:安全接管里程提升50倍、平均接管里程提升25倍、车端模型参数量提升到200亿以上、媲美FSD最新能力、VLA+ VLM驾舱一体、Max版本蒸馏推送、Robotaxi开启运营。 三、小鹏第二代VLA路测结果及横纵向比较 1)规模化路测结果 路测基本情况 2025年3月10日-13日|小鹏新P7(VLA 2.0) 参与者 行驶里程 路测场次 道路场景 累计超过260公里,每一场行驶4公里到10公里不等。 近90位投资者,每位参与者的路测路线并非完全固定,而是根据其关注点进行了个性化调整。 覆盖内部路、城市主干道、环岛、窄巷、隧道、匝道等多种场景。涉及到超车、大曲率弯道、避让车辆/行人、修路、加塞、掉头、待行区等细分场景。 共计35场,路测活动从每天早上8:00持续至晚上18:00,每一场时间20-40分钟,覆盖全天不同光照和路况条件。 指标说明 ◼总体评价:综合各测试维度,全面衡量智能驾驶系统在路测中的整体表现、可靠性。 ◼接管次数:反映系统因无法解决或危险驾驶需人工介入的频次,直接体现智能驾驶功能的成熟度与安全冗余。 ◼平稳性表现:体现加速、减速、转向等操作的平顺度,直接影响驾乘人员的舒适性体验。 ◼行驶效率:在客观路况条件下,衡量系统遵守交规时的通行流畅度及对道路资源的利用效率。 ◼环岛场景表现:评估在环岛进、出及环岛内跟车、避让等复杂场景的决策与操控能力。 ◼掉头场景表现:考验系统在路口掉头时,对对向车流、行人的预判,及转向角度、避让时机的精准把控。 ◼博弈场景表现:检测系统与其他交通参与者(车辆、行人等)互动时的决策博弈与协同能力。 ◼内部路场景表现:评估系统在内部道路中的综合通过能力,包括对动态环境的感知与决策、路径规划的合理性等。 评分标准说明及稳定度得分说明 ◼评分标准: 本次路测评分基于35场专业投资者路测反馈,通过语义转数值的方法进行量化评估,将客户反馈中的定性描述,依据以下标准转化为0-5分数值: ◼涉及评价类指标: ➢0——完全不能使用智驾(如“完全无法开启”);1——智驾体验很差(如“频繁接管”“完全不可用”);2——智驾体验较差(如“表现不佳”“经常出错”);3——正常使用智驾,总体需求都能满足(如“中规中矩”“基本可用”);4——行驶流畅(如“平顺”“丝滑”“稳定”);5——超预期地“灵性”行驶(如“接近真人”“超出预期”“印象深刻”) ◼涉及具体场景类指标: ➢0——完全不能使用智驾;1——智驾体验很差;2——智驾体验较差;3——正常使用智驾,总体需求都