您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰海通证券]:通往L3智能驾驶与具身智能之钥——视觉-语言-动作模型(VLA)产业研究 - 发现报告

通往L3智能驾驶与具身智能之钥——视觉-语言-动作模型(VLA)产业研究

AI智能总结
查看更多
通往L3智能驾驶与具身智能之钥——视觉-语言-动作模型(VLA)产业研究

产业研究中心 摘要:智能汽车产业前瞻研究(9) 鲍雁辛(分析师)0755-23976830baoyanxin@gtht.com登记编号S0880513070005 汪玥(研究助理)021-38031030wangyue8@gtht.com登记编号S0880123070143 智能驾驶技术正经历从“模块化端到端”向“全局端到端”的演变,视觉-语言-动作模型(VLA)将成为实现全局端到端的关键突破技术。模块化端到端为传统模块化结构与端到端的中间形态,分为感知层和决策层端到端。一段式端到端则由一个神经网络模型完成全部操作,直接处理原始传感器信息输出控制信号。随着模块化端到端技术的日臻完善、多模态大模型的技术赋能、芯片的算力突破,一体化智驾大模型呼声愈高,VLA应运而生。视觉-语言-动作模型(VLA)以大语言模型为基础,能直接输出控制信号,大幅提高了复杂环境适应能力和决策响应速度。但智驾发展仍面临:数据规模影响模型性能、仿真数据精度欠佳、模型推理效率需提升以满足实时响应要求、VLA模型对算力需求高、政策监管趋严等诸多挑战。 低空经济系列(八):从Joby和Archer看国内eVTOL产业2025.07.17尊界以智能定义豪华,引领汽车产业攀顶全球价值链——华为产业研究之智能汽车系列(二)2025.07.13【AI产业深度】扩散大语言模型(dLLM)开启并行新范式:大模型领域的重要技术路线试水2025.07.01低空经济系列(七):飞行培训行业,卖方主导向买方市场演进2025.06.16人工智能产业2025年中思考——扩张、效率、泛化2025.06.09 在“向下智驾平权”+“向上技术升级”的趋势下,车企自研与第三方合作的市场格局将发生变化,积累深、投入久的企业将具备在L3等高阶智驾市场的竞争优势。2025年产业掀起智驾平权浪潮使具备智驾功能车型价格下探至10万元以下,智驾平权压缩了中低端车企成本空间,让具备性价比优势的第三方供应商获得更多机会。而长期自研高阶智驾的头部车企布局智能驾驶时间较长,多已实现完整技术路径的突破和技术积累,已形成技术领先的消费者心智,受智驾平权影响相对较小,未来将能够坚持自研路线。VLA技术发展预示着以大模型为基座的智驾方案加速应用,汽车企业逐渐向科技企业转型。L2-L4的跃迁是长期资金、算力、技术、数据的资源积累过程,因此产业链中积累深厚且投入持久的企业将具备L3等高阶智驾和市场竞争优势。未来,预计少数头部主机厂将维持全栈自研战略以提供高质量智驾体验,而第三方龙头供应商则将凭借技术优势和性价比覆盖更多市场份额,产业格局将因VLA技术的发展而加速变化。 自研VLA车企和智驾VLA供应商凭借所积累的供应链硬件协同能力和技术迭代积累将在具身智能领域释放巨大发展潜力。具身智能是指能与环境实时交互,实现感知、认知、决策和行动一体化的智能体。智能驾驶汽车作为具身智能分支,其技术架构与机器人等一脉相承,在硬件传感器与零部件、软件算法技术方面均有极大共通性。一方面,VLA技术源于机器人领域,两者结构相似,自研车企可将VLA技术低成本复用至机器人领域,在算法上占据技术优势。另一方面,车企积累的供应链硬件协同能力,使其能够快速涉足机器人产业,利用现有资源实现降本增效。目前,国内外众多车企已通过自研、投资、合作等方式积极布局具身智能,将智能驾驶技术经验迁移到该领域,有望打造为第二增长曲线。 风险提示:VLA技术落地不及预期风险,客户需求不及预期风险,研发迭代不及预期风险,行业竞争加剧风险。 请务必阅读正文之后的免责条款部分1 of 39 目录 1.智能驾驶向高阶L3迈进,进一步贴合消费者需求........................................31.1. L2级智能驾驶渗透过半,智驾全面进入城区NOA时代.........................31.2.消费者对智能驾驶大多持积极态度,但仍有需求尚待满足....................62.智能驾驶技术不断演进,VLA成为实现全局端到端的重要突破..................82.1.智驾技术经历“模块化端到端”向“全局端到端”的进化演变............82.1.1.“端到端”直接由感知数据输出控制指令,无需传统分模块处理.82.1.2.模块化端到端可拆分为“感知层端到端”和“决策层端到端”.....92.1.3.“一段式端到端”由一个神经网络模型直接完成...........................122.2.视觉-语言-行动模型(VLA)是实现全局端到端的重要技术路线.......142.2.1.需求升级与技术成熟催化VLA在智驾领域的应用.........................142.2.2. VLA一体化模型直接端到端输出行为,复杂环境适应能力提高...172.3.数据规模、推理效率、算力需求仍为智驾的主要挑战..........................213.技术升级推动产业格局变化,VLA打开具身智能广阔想象空间................233.1.“向下智驾平权”+“向上高阶突破”双线并行,拉动产业链格局变化..............................................................................................................................233.1.1.智驾平权加速自研与第三方合作市场格局分化,整体市场中的智驾技术差距或将拉大..........................................................................................233.1.2.未来VLA的渗透将带动汽车企业向科技企业转变,积累深、投入久的企业将具备在高端市场竞争力..............................................................253.2. VLA技术领先的车企和供应商未来或在具身智能领域存在更大想象空间..........................................................................................................................324.智能驾驶产业图谱(2025年)........................................................................375.风险提示............................................................................................................37 1.智能驾驶向高阶L3迈进,进一步贴合消费者需求1.1.L2级智能驾驶渗透过半,智驾全面进入城区NOA时代 智能驾驶正迎来加速增长期,L2级智能驾驶渗透率已达50%。前瞻产业研究院数据显示,2024年我国智能网联汽车产业规模达11082亿元,同比增长34%,并预计到2030年市场规模有望实破5万亿;截至2024H1,新源汽车市场L2级智能驾驶渗透率已从2019年的7.3%迅速上升至50%。智能驾驶功能亦不断丰富,据汽车之家调研显示,360全景影像、主动安全系统、ACC自适应巡航系统、车道保持辅助系统等L2级基础配置功能渗透率均已达40%以上。 数据来源:汽车之家 数据来源:平安产险、汽车之家研究院、北京大学光华管理学院思想力课题组、中国汽车零部件工业有限公司《中国智能驾驶商业化发展白皮书(2025)》 数据来源:亿欧智库,国泰海通证券研究 高速NOA功能逐渐成熟,城区NOA时代正加速来临。2024年中国高速NOA已成为中高端智能电动汽车标配,大部分主机厂开始布局城市NOA。根据亿欧智库 数据,截至2024年中国已有超过57款车型实现高速NOA功能的量产。高速NOA的成熟落地也反映在消费者智驾使用场景上,根据汽车之家调研显示,在路况较好或较为封闭的高速/国道/环路路段,有56%的用户显示会高频使用智驾功能,驾驶者使用智驾的频率较高。随着汽车产业智能化的发展,高速NOA功能逐渐成为大部分车型的标配,并且中国大部分主机厂已经布局城区NOA功能。根据佐思汽研数据显示,自2023年起城市NOA预埋装配率稳步提高,自2023年2.6%预埋装配率已增长至2024年9月的8.3%,城市NOA硬件基础亦在同步渗透。截至2024年底,小鹏、理想、华为、小米、蔚来等车企已推出“全国都能开”的智驾系统,智己、昊铂、阿维塔、魏牌蓝山等搭载第三方方案的车型也已实现“全国都能开”。 数据来源:佐思汽研,国泰海通证券研究 2024年高速NOA车型价格已大规模渗透至15万以下,城区NOA也呈现下探趋势。由于高速NOA的复杂度较低,目前已经逐渐由技术驱动向成本驱动发展。 2024年随着大疆纯视觉方案在宝骏云朵车型上的量产,搭载高速NOA功能的车型价格已下探至15万以下。2024年城市NOA也开始出现在15-20万车型,2024年8月广汽埃安霸王龙激光雷达版、小鹏汽车MONA M03两款车型已实现15-20万价格段城市NOA规模化量产上车,同年10月该价格区间搭载城市NOA功能的车型从2款增加到了5款,包含深蓝L07、小鹏P7+、埃安RT。 数据来源:亿欧智库 数据来源:汽车之家,国泰海通证券研究 数据来源:佐思汽研,国泰海通证券研究 2025年有望成为L3落地元年。根据美国国际汽车工程学会的标准,L3级智能驾驶被定义为“有条件自动驾驶”,是车辆运行控制权由人类驾驶员向自动驾驶系统转移的过渡阶段,可在特定交通场景下实现自动驾驶,但仍要求驾驶员时刻保持警惕并在需要的时候对车辆进行及时接管。2024年6月工信部等四部门确定九家车企进入首批L3智能驾驶上路通行试点名单,并共有十家车企获得了L3级智能驾驶测试牌照,包括智己、奔驰、宝马、比亚迪、深蓝、阿维塔、极狐、问界、极越和广汽埃安。在2024年智能驾驶技术不断突破以及城区NOA功能渗透落地的趋势下,2025年有望成为L3落地元年。2025年4月2日,国家发改委、工信部等四部门联合发布《首批车网互动规模化应用试点通知》,正式开放L3级智能驾驶车辆准入,并选定上海、北京、深圳等9个城市作为首批试点。政策发布一方面体现了对车企技术成熟的认可,另一方面也预示着L3商业化的铺开。 数据来源:中国政府网援引工业和信息化部网站 1.2.消费者对智能驾驶大多持积极态度,但仍有需求尚待满足 智能化已经成为消费者购买汽车的重要因素。根据汽车之家用户调研数据,2024年已有超过50%的新能源汽车用户在购车时关注智能化水平,在所有的购车因素中排名第四。从人群代际上看,90后用户对新能源汽车智能化的关注度更高,而这一部分群体也正成为汽车购买的主要客户群体;购车价位上看,20万以上中高端区间各价格段均有55%以上的用户关注智能化。且66%的用户已不满足于基础L2级辅助驾驶,希望配备L2+(高速辅助)和L2++(城市NOA)的高阶辅助驾驶能力。 数据来源:汽车之家 现有辅助驾驶功能中,消费者偏好于ACC全速自适应巡航以及高速路段智能驾驶辅助。根据汽车之家2024年用户调研数据显示,在辅助驾驶类配置中,有52%的用户偏好具有ACC全速自适应巡航的车辆,帮助驾驶员控制车辆以设定的目标车速行驶或跟随前车行驶,实现跟随前车启动、停车和加速的功能,减轻驾驶员的疲劳并提高驾驶舒适性。在智能驾驶配置偏好中,65%的用户关注高速路段智能驾驶辅助,而对于自动泊车、城市路段智能驾驶辅助等功能偏好较低,说明当前消费者对智能驾驶的诉求还停留在较为安全、单一的高速场景中,对复杂场景下