行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

汽车-3月份小鹏第二代VLA专题篇：2026年主流车企城市NOA试驾报告

2026-03-24 黄细里东吴证券 Yàng

核心结论

2026年C端汽车智能化的主要矛盾已从覆盖面向体验优化切换。主要智能驾驶主机厂/方案供应商已实现包括环岛、掉头等复杂场景的城市NOA落地体验，并完善车位到车位、ETC通行等高阶功能，后续主要优化方向为CornerCase的处理能力，以提升乘客与安全员的驾驶体验。

智能驾驶经验性的“不可能三角”

通过智能化路测，总结出智能驾驶经验性的“不可能三角”，在体验维度表现为全场景能力、丝滑拟人程度、应急处理能力，在模型层面分别为泛化性（Generalization）、可解释性（Interpretability）与时延性（Real-time/Latency）。这三个指标往往难以同时达到顶尖水平。

泛化性：处理从未见过的长尾场景的能力，是目前智驾模型攻克的核心方向。
可解释性：系统做出决策的逻辑是否透明，可解释性越好，对智驾调整的速度就越快，是智驾能力曲线的一阶导数。
实时性：从感知到执行的推理延迟，直接关系到高速行驶的安全，可以保障MPI的下限，但除去模型本身，其表现或能通过硬件提升。

小鹏第二代VLA架构迭代

小鹏探索出第二代VLA大模型，从标准VLA（V→L→A）转为创新VLA（省略语言中间层转译），降低信息损耗，推理效率更高，反应更快。第二代VLA实现跨越L2到L4的三大体验升级：

安心丝滑：妈妈敢用。
全场景能力：哪里都能用。
高效率：老司机爱用。

核心场景覆盖能力：支持复杂场景识别与处理，实现全场景通行，涵盖城市主路/辅路、小区/地下停车场、窄路、施工占道、夜市、乡村小路、暴雨/夜间环境等。
舒适度与效率优化：推出小鹏智驾舒适度评测软件，对比传统L2辅助驾驶，第二代XNGP急刹次数显著减少，行驶更平缓；综合行车效率较当前L2提升23%，初步比肩老司机。
性能与安全目标：计划2026年内将所有道路场景覆盖度提升至与城市主干道一致，目标2026年8月在中国实现Tesla FSD在硅谷的效果，预计1-3年内实现完全自动驾驶。

自动驾驶的本质

自动驾驶的本质是物理AI问题，AI的规模法则同样适用于物理世界模型。小鹏第二代VLA的突破并非单点能力升级，而是遵循L4能力等于“模型x算力x数据x本体”的规模法则。

模型：打造原生多模态物理世界基模，采用32倍超密视觉推理思维链（VisualCoT）技术，支持多模态输出。
算力：车端云端算力同步提升，车端模型运行效率提升12倍，云端单颗GPU训练效率提升超1000%。
数据：物理AI所需Tokens大幅提升，小鹏单次训练云端高质量数据达50PB，训练模型整体的Token数量达4万亿。

推送节奏

小鹏第二代VLA 3月下旬及4月开启全量推送，2026年重要里程碑包括：安全接管里程提升50倍、平均接管里程提升25倍、车端模型参数量提升到200亿以上、媲美FSD最新能力、VLA+ VLM驾舱一体、Max版本蒸馏推送、Robotaxi开启运营。

小鹏第二代VLA路测结果及横纵向比较

规模化路测结果：小鹏VLA 2.0综合得分3.87分，已能从容应对城市道路绝大多数场景，平均接管次数为1.66次/场，整体智驾表现优秀。
广州&上海深度路测结果：
- 上海深度路测：主要扣分原因包括单行道内前行空间不足、大曲率右转弯道通过时转向角度偏大、右转进入窄路转弯半径预留不足、行人从视线盲区突然穿出时发生人工接管、复杂路口分叉处车道选择出现偏差。
- 广州深度路测：主要扣分原因包括双车道绕行时路径规划出现偏差、跟车距离过近、路口抢黄灯、行驶轨迹持续靠右。
横纵向深度路测结果：
- 横向路测：小鹏VLA 2.0与某智驾第一梯队在常规路线和复杂路线的路测中表现优异，小鹏在博弈环节表现流畅，窄道通行对横向距离感知把控精准。
- 纵向比较：基于固定路线的小鹏智驾路测近2年呈现渐进式变化，固定路线绝对接管次数减少，接管性质从安全型接管向效率型转变，关注点从能否挑战难度场景向正常行驶的舒适性体验转变。

核心结论及风险提示

核心结论：2026年C端汽车智能化的主要矛盾已从覆盖面向体验优化切换，小鹏第二代VLA大模型提升了实测场景下的接管率、通行效率和能力涌现方面表现，加速了公司在C端智能车、B端Robotaxi以及机器人业务的布局。
投资建议：坚定看好小鹏汽车，认为其估值体系将完成由汽车公司向物理AI科技公司切换。
风险提示：全球AI技术创新低于预期；国内L3智能化渗透率低于预期。

证券分析师：黄细里执业证书编号：S0600520010001联系邮箱：huangxl@dwzq.com.cn2026年3月23日核心结论 ◼2026年C端汽车智能化的主要矛盾已经从覆盖面向体验优化切换。主要智能驾驶主机厂/方案供应商已实现包括环岛、掉头等复杂场景的城市NOA落地体验，并完善车位到车位、ETC通行等高阶功能，后续主要优化方向为CornerCase的处理能力，以提升乘客与安全员的驾驶体验。 ◼2024-2026年间，我们通过智能化路测，总结出了智能驾驶经验性的“不可能三角”，在体验维度表现为全场景能力、丝滑拟人程度、应急处理能力，在模型层面分别为泛化性（Generalization）、可解释性（Interpretability）与时延性（Real-time/Latency）。从路测经验性维度总结，这三个指标往往难以同时达到顶尖水平。泛化性：处理从未见过的长尾场景的能力，或为目前智驾模型攻克的核心方向。可解释性：系统做出决策的逻辑是否透明，能否告诉用户和工程师“为什么这么开”，可解释性越好，对智驾调整的速度就越快，是智驾能力曲线的一阶导数。实时性：从感知到执行的推理延迟，直接关系到高速行驶的安全，可以保障MPI的下限，但除去模型本身，其表现或能通过硬件提升。 ◼在小鹏第二代VLA的Beta版本，我们在路测体验维度已经感受到了其整体能力的提升。1）全场景能力提升：能够处理内部路场景，应对抬杆、内部环路能力初步体现，实现无导航的自主漫游。2）丝滑拟人程度提升：在博弈环节自然流畅，无法理解的无效型变道减少，方向盘不再出现反复僵硬调整，窄路会车时不再出现急刹停滞，而是精确控制横向距离向前蠕行。3）仍存在的一些问题：选道能力待加强，一是直行分岔路口存在选错岔道情况，二是变道无法加塞时或出现在非对应车道过红绿灯的情况（例如在直行道左转）；应对鬼探头的突发能力待加强。 ◼投资建议：坚定看好小鹏汽车！我们认为小鹏的估值体系将完成由汽车公司向物理AI科技公司切换，第二代VLA大模型提升了实测场景下的接管率、通行效率和能力涌现方面表现，加速了公司在C端智能车、B端Robotaxi以及机器人业务的布局。同时公司将自身定位升级为智能技术解决方案供应商，大众成为第二代VLA首发客户，开创商业化落地第二曲线。 ◼风险提示：全球AI技术创新低于预期；国内L3智能化渗透率低于预期。智能化路测体验维度的【不可能三角】丝滑拟人程度全场景能力 •技术核心：利用思维链和价值函数推演。技术核心：从背标准答案转向理解规律。路测对应典型场景：✓临时施工避让：车辆能理解路边临时路锥和摆放杂乱的施工围栏，自主规划出绕行路径。✓异形障碍物识别：能够识别路面上突然出现的非标准物体。✓乡村/园区无图漫游：在私人园区或复杂乡村小路依靠理解看懂路牌和通行逻辑，自主寻找车位或目的地。应急处理能力丝滑拟人程度应急处理能力 •技术核心：软硬协同的帧率提升。•路测对应典型场景：✓鬼探头：较高时速行驶中，紧急避让侧向视野盲区冲出的行人或非机动车，或前车突然变道出现的障碍物。✓过弯后的直行分岔口：车辆过弯后出现需要判断的分岔路口，瞄准正确直行分岔口。智能化路测模型维度的【不可能三角】纵向比较：基于固定路线的小鹏智驾路测变化 ◼2024年5月，我们开启小鹏城市NGP路测。2025年1月起，我们基于上海固定复杂路线持续路测。近2年的时间，我们观察到小鹏呈现出渐进式的变化： ➢1）固定路线绝对接管次数减少，且接管性质从安全型接管向效率型转变；➢2）需要打分的场景在变少，侧面证明行车习惯越来越拟人化；➢3）关注点从能否挑战难度场景向正常行驶的舒适性体验转变。智能化路测【不可能三角】及经验性总结小鹏第二代VLA架构迭代小鹏第二代VLA路测结果及横纵向比较核心结论及风险提示一、智能化路测【不可能三角】及经验性总结智能化路测体验维度的【不可能三角】丝滑拟人程度全场景能力 •技术核心：利用思维链和价值函数推演。技术核心：从背标准答案转向理解规律。路测对应典型场景：✓临时施工避让：车辆能理解路边临时路锥和摆放杂乱的施工围栏，自主规划出绕行路径。✓异形障碍物识别：能够识别路面上突然出现的非标准物体。✓乡村/园区无图漫游：在私人园区或复杂乡村小路依靠理解看懂路牌和通行逻辑，自主寻找车位或目的地。应急处理能力丝滑拟人程度应急处理能力 •技术核心：软硬协同的帧率提升。•路测对应典型场景：✓鬼探头：较高时速行驶中，紧急避让侧向视野盲区冲出的行人或非机动车，或前车突然变道出现的障碍物。✓过弯后的直行分岔口：车辆过弯后出现需要判断的分岔路口，瞄准正确直行分岔口。智能化路测模型维度的【不可能三角】智能化路测模型维度的【不可能三角】 ◼2024-2026年间，我们通过智能化路测，总结出了智能驾驶经验性的“不可能三角”，分别为泛化性（Generalization）、可解释性（Interpretability）与时延性（Real-time/Latency）。 ◼从路测经验性维度总结，这三个指标往往难以同时达到顶尖水平： ➢可解释性：系统做出决策的逻辑是否透明，能否告诉用户和工程师“为什么这么开”，可解释性越好，对智驾调整的速度就越快，是智驾能力曲线的一阶导数。 ➢时延性：从感知到执行的推理延迟，直接关系到高速行驶的安全，可以保障MPI的下限，但除去模型本身，其表现或能通过硬件提升。 ◼针对Rule-based、E2E、VLA与WAM，我们尝试将其路测表现与其原因对应到这三个维度上。二、小鹏第二代VLA架构迭代架构迭代：第二代VLA大模型 ◼小鹏探索出第二代VLA大模型。从标准VLA（V→L→A）转为创新VLA（省略语言中间层转译），降低信息损耗，推理效率更高，反应更快。效果：第二代VLA实现三大体验提升 ◼小鹏第二代VLA实现跨越L2到L4的三大体验升级。1）安心丝滑：妈妈敢用；2）全场景能力：哪里都能用；高效率：老司机爱用。 ➢核心场景覆盖能力：1）支持复杂场景识别与处理，包括逆行车辆、路边突然开门、障碍物、颠簸路面、夜间行人、动物穿行等。2）实现全场景通行，涵盖城市主路/辅路、小区/地下停车场、窄路（胡同、城中村）、施工占道、夜市（异形物、人流）、乡村小路、暴雨/夜间环境等。3）支持P档激活起步（路边/停车场原地激活NGP，前后车距近的场景暂未支持，2026年后续版本解决）、无导航漫游（城区/停车场漫游，地下停车场漫游最晚下一期发布）、乱停车场景自主寻路。➢舒适度与效率优化：1）推出小鹏智驾舒适度评测软件，从急刹急加速、切线变道晃动、颠簸、行程顺畅度四个维度评估，目标达到专业本地老司机水平。2）对比传统L2辅助驾驶，第二代XNGP急刹次数显著减少，行驶更平缓；综合行车效率较当前L2提升23%，初步比肩老司机。3）具备智能交互能力，如主动避让救护车、配合交警查酒驾停车等。➢性能与安全目标：计划2026年内将所有道路场景覆盖度提升至与城市主干道一致。目标2026年8 月在中国实现Tesla FSD在硅谷的效果（中国场景难度更高）；预计1-3年内实现完全自动驾驶。本质：自动驾驶问题本质是物理AI问题 ◼自动驾驶的本质是AI问题，AI的规模法则同样适用于物理世界模型。 ◼小鹏第二代VLA的突破并非单点能力升级，而是遵循L4能力等于“模型x算力x数据x本体”的规模法则。模型：打造原生多模态物理世界基模 ◼小鹏第二代VLA是原生多模态物理世界大模型，看、听、读合一，跨越模态壁垒，复刻人类感知本能。 ➢VLA 2.0设计了原生多模态tokenizer，以更高效率编码信号并实现早期融合，避免单一模态偏差；➢模型采用32倍超密视觉推理思维链（VisualCoT）技术，更快的思维过程，更高的预测精度，相比传统CoT预测误差降低33%。支持多模态输出（语音、视觉、动作、行为）；➢模型具备多模态输出能力，可生成视频、声音及动作行为，支撑世界模型、仿真和self-play强化学习，也是原生舱驾一体、舱驾联动的基础框架。算力：车端云端算力同步提升 ◼车端云端算力同步提升，持续优化有效算力。➢车端算力：自研图灵芯片，软硬件一体研发，芯片-编译器-模型联合优化，开发自动化编译器最大化算力利用率，根据芯片定制化图灵结构。模型车端模型运行效率提升12倍，计算利用率提升至图灵模型+图灵芯片的82.5%，单颗图灵芯片有效算力接近10个Orin X。 ➢云端算力：单颗GPU训练效率从0.1 sample/s提升至1.1 sample/s（提升超1000%），单个任务训练效率提升43倍，GPU硬件利用率从40%提升至90%。数据：物理AI所需Tokens大幅提升 ◼物理AI所需Tokens迅速提升。 ➢小鹏单次训练云端高质量数据达50PB，为大语言模型的20倍，每秒钟传感器数据输入达53亿字节，训练模型整体的Token数量达4万亿，与ChatGPT训练规模相当。➢小鹏第二代VLA车端模型推理Token消耗量（20万辆Ultra车日均消耗58.8万亿Tokens）约等于全国数字AI Token日调用量的80倍。推送节奏：第二代VLA 3/4月集中全量推送 ◼小鹏第二代VLA 3月下旬及4月开启全量推送。 ◼2026年重要里程碑包括：安全接管里程提升50倍、平均接管里程提升25倍、车端模型参数量提升到200亿以上、媲美FSD最新能力、VLA+ VLM驾舱一体、Max版本蒸馏推送、Robotaxi开启运营。三、小鹏第二代VLA路测结果及横纵向比较 1）规模化路测结果路测基本情况 2025年3月10日-13日|小鹏新P7（VLA 2.0）参与者行驶里程路测场次道路场景累计超过260公里，每一场行驶4公里到10公里不等。近90位投资者，每位参与者的路测路线并非完全固定，而是根据其关注点进行了个性化调整。覆盖内部路、城市主干道、环岛、窄巷、隧道、匝道等多种场景。涉及到超车、大曲率弯道、避让车辆/行人、修路、加塞、掉头、待行区等细分场景。共计35场，路测活动从每天早上8:00持续至晚上18:00，每一场时间20-40分钟，覆盖全天不同光照和路况条件。指标说明 ◼总体评价：综合各测试维度，全面衡量智能驾驶系统在路测中的整体表现、可靠性。 ◼接管次数：反映系统因无法解决或危险驾驶需人工介入的频次，直接体现智能驾驶功能的成熟度与安全冗余。 ◼平稳性表现：体现加速、减速、转向等操作的平顺度，直接影响驾乘人员的舒适性体验。 ◼行驶效率：在客观路况条件下，衡量系统遵守交规时的通行流畅度及对道路资源的利用效率。 ◼环岛场景表现：评估在环岛进、出及环岛内跟车、避让等复杂场景的决策与操控能力。 ◼掉头场景表现：考验系统在路口掉头时，对对向车流、行人的预判，及转向角度、避让时机的精准把控。 ◼博弈场景表现：检测系统与其他交通参与者（车辆、行人等）互动时的决策博弈与协同能力。 ◼内部路场景表现：评估系统在内部道路中的综合通过能力，包括对动态环境的感知与决策、路径规划的合理性等。评分标准说明及稳定度得分说明 ◼评分标准：本次路测评分基于35场专业投资者路测反馈，通过语义转数值的方法进行量化评估，将客户反馈中的定性描述，依据以下标准转化为0-5分数值： ◼涉及评价类指标： ➢0——完全不能使用智驾（如“完全无法开启”）；1——智驾体验很差（如“频繁接管”“完全不可用”）；2——智驾体验较差（如“表现不佳”“经常出错”）；3——正常使用智驾，总体需求都能满足（如“中规中矩”“基本可用”）；4——行驶流畅（如“平顺”“丝滑”“稳定”）；5——超预期地“灵性”行驶（如“接近真人”“超出预期”“印象深刻”） ◼涉及具体场景类指标： ➢0——完全不能使用智驾；1——智驾体验很差；2——智驾体验较差；3——正常使用智驾，总体需求都

点击免费查看完整报告

汽车-3月份小鹏第二代VLA专题篇：2026年主流车企城市NOA试驾报告

核心结论

智能驾驶经验性的“不可能三角”

小鹏第二代VLA架构迭代

自动驾驶的本质

推送节奏

小鹏第二代VLA路测结果及横纵向比较

核心结论及风险提示

你可能感兴趣

2025年主流车企城市NOA试驾报告：3月特斯拉VS小鹏上海专题&北京篇

汽车服务：2月上海篇-2026年主流车企城市NOA试驾报告

1月上海篇：2025年主流车企城市NOA试驾报告

2025年主流车企城市NOA试驾报告—10月北京篇

2025年主流车企城市NOA试驾报告—9月上海篇

汽车行业2025年主流车企城市NOA试驾报告：10月北京篇

汽车行业2月深圳篇：2025年主流车企城市NOA试驾报告

2025年主流车企城市NOA试驾报告—2月深圳篇

11月深圳篇：2025年主流车企城市NOA试驾报告

小鹏汽车第二代VLA试驾体验超预期智驾体验迎来涌现拐点小