AI智能总结
西南证券研究院2025年6月海外研究团队分析师:王梓溢执业证号:S1250525050003电话:15770906520邮箱:wzyi@swsc.com.cn 核心观点发展现状:仅实现L2+大规模上车,真L3技术有望年内落地;L4限定场景(Robotaxi/Robovan)商业模式有望跑通,头部企业有望迎来2025年年内盈利。技术方向催化:•L3技术:VLM技术逐渐量产上车,关注头部车企VLA模型落地•L4技术:Robotaxi技术门槛高,空间大,需重点关注;Robovan场景有望率先盈利•L2+&L3&L4技术:L2+大规模上车需求,L3安全冗余需求,L4强制配置需求均利好核心零部件销量相关标的:•L3技术全栈自研车企:特斯拉,小鹏汽车,理想汽车•L4多场景落地技术企业:百度,小马智行,文远知行•L2+&L3&L4技术核心零部件:地平线机器人,速腾聚创风险提示:政策风险;技术风险;市场风险。 1自动驾驶的分类和定义2自动驾驶的历史今生3自动驾驶技术路线4自动驾驶商业模式5必争之地Robotaxi7风险提示6相关标的 1.自动驾驶的分类和定义-自动驾驶的分类数据来源:博世官网,西南证券整理自动驾驶的分类:关于自动驾驶的分级,可以参考博世的这张图,它将自动驾驶划分为6个阶段:L0~L5,L0就是人类手动驾驶;L1是“脱脚”,比如定速巡航,可以辅助驾驶;L2是“脱手”,除了脱脚之外还可以脱手,实现部分自动驾驶;L3是“脱眼”,眼睛可以不关注路面,可以在车中玩手机;L4是“脱脑”,可以不用考虑驾驶这件事儿,可以坐在主驾,也可以坐在副驾,这是在限定场景下完成的;L5就是“无人驾驶”,没有方向盘和油门刹车等,在任何场景下都可以进行自动驾驶。图:自动驾驶的分类L0-L5 3 1.自动驾驶的分类和定义-国际和国内高级别自动驾驶的定义和差异数据来源:SAE J3016:驾驶自动化分级(2021年4月,中文版),《汽车驾驶自动化分级》(GB/ T 40429-2021),西南证券整理定义:根据2011年4月和10月先后发布的国际标准(SAE J3016)和中国国家标准(GB/T40429-2021),国际上和国内对高级别自动驾驶的分级基本一致,均定义为L3-L5级别的自动驾驶。差异:国际标准严格区分自动化等级,将L3/L4直接绑定车企责任,强调企业主导;中国则明确驾驶员在L3/L4级别中的第一责任人地位,但在系统故障或缺陷导致事故时,责任可以向车企或运营主体追偿,更强调安全优先。等级国际标准(SAE J3016)中国国家标准(GB/T 40429-2021)L0无自动化:完全由驾驶员操作,车辆仅执行简单指令(如定速巡航)应急辅助:无持续控制能力,仅提供警告或短暂干预(如自动紧急制动)L1驾驶支持:单一功能自动化(如自适应巡航或车道保持),驾驶员需全程监控部分驾驶辅助:仅支持单一方向控制(如自适应巡航或车道保持)L2部分自动化:多功能协同(如同时控制加速和转向),驾驶员仍需监控环境组合驾驶辅助:同时控制车辆横向和纵向运动(如自适应巡航+车道居中),驾驶员需随时接管L3有条件自动化:系统在特定条件下接管驾驶,驾驶员需在系统提示时接管有条件自动驾驶:系统在特定场景(如高速公路)接管全部驾驶任务,但需驾驶员响应接管请求L4高度自动化:在特定运行设计域(ODD)内完全自主驾驶,无地理围栏限制(如Waymo在凤凰城全域运营)高度自动驾驶:限定区域(如城市试点区)内完全自主驾驶,无需人工干预,超出范围需接管L5完全自动化:无任何场景限制,无需人类驾驶员参与,车辆可无方向盘和踏板完全自动驾驶:全场景无限制,但需排除商业和法规因素(如无方向盘设计需法规允许)表:自动驾驶的分类国际vs国内 区别基本一致中国国家标准(GB/T 40429-2021):即便系统激活,驾驶员仍为第一责任人;国际标准(SAEJ3016):系统激活期间责任由车企承担,但需驾驶员接管时责任可能转移中国国家标准(GB/T 40429-2021):即仅在完全无人驾驶状态(无驾驶员)时,责任才转移至车辆所有人、管理人或制造商;国际标准(SAEJ3016):明确由车企或技术提供方全责 1自动驾驶的分类和定义2自动驾驶的历史今生3自动驾驶技术路线4自动驾驶商业模式5必争之地Robotaxi7风险提示6相关标的 2.自动驾驶的历史今生自动驾驶的关键节点:多传感器和视觉路线并行,L3和L4技术持续迭代早期探索(2000年代初):DARPA在2000年代初举办自动驾驶挑战赛,将自动驾驶概念首次转为现实,推动技术萌芽。初步发展(2009-2016):谷歌2009年启动L4级别自动驾驶项目,特斯拉2016年发布自研Autopilot 2.0,自此形成多传感器和视觉双技术路线。技术突破(2021-2022):特斯拉2021年推出BEV+Transformer架构,引发同行车企跟随。高速发展(2023-2024):特斯拉2024年发布FSD v12,端到端架构引入Word Model,华为同年推出无图架构MapTR+Occupancy。未来展望(2025-至今):理想引入认知模型,小鹏预计2025年年内实现L3上车,特斯拉计划2027年量产3万美元级无人网约车Cybercab。数据来源:汽车之心,西南证券整理 图:自动驾驶的发展历史 1自动驾驶的分类和定义2自动驾驶的历史今生3自动驾驶技术路线4自动驾驶商业模式5必争之地Robotaxi7风险提示6相关标的 3.自动驾驶技术路线-三个技术层级和对应的技术方案和路线感知端的技术路线:根据感知方案的分类,可分为以激光雷达为主的多传感器路线和纯视觉路线,算法架构从2DNCC到BEV-Transformer决策段技术路线:从规则算法到端到端算法,按照技术架构的不同可分为一段式端到端和分段式端到端执行端技术路线:从传统执行系统到线控执行系统数据来源:亿欧咨询,西南证券整理图:自动驾驶的三个技术层级 3.自动驾驶技术路线-算法架构和模型梳理图:算法架构的演变数据来源:亿欧咨询,西南证券整理 3.自动驾驶技术路线-感知端方案的分类多传感器路线自动驾驶级别L4代表公司谷歌子公司Waymo商业化阶段Robotaxi业务已进入商业化运营阶段(接近L4),截至2025年6月,Waymo拥有超过1500辆运营车辆,业务覆盖美国多个都市区,包括凤凰城、旧金山、洛杉矶和奥斯汀等,每周完成超过25万次付费乘车服务。技术路线一步到位L4,感知依赖激光雷达+高精地图(后因算法提升取消)训练路径Waymo通过多传感器采集数据,采用预训练(现有的相对少量的真实路测数据)和强化学习(大量模拟数据)的方式和自动标注算法(可以处理和标注传感器数据,并快速生成高质量新数据)进行模型训练和验证。优点1)感知端采用激光雷达可获取的数据集更全面;2)数据处理能力强,模拟系统可模拟出大量的极端场景缺点1.高度依赖于谷歌强大的模拟系统,模拟系统模拟出的场景可能和现实路况存在差异;这里面遇到的问题就是计算机模拟并不能模拟出真实的路况和情景,因为现实的路况每天都会不一样;2.硬件成本(激光雷达)较高其他公司华为、理想、小米、蔚来、奔驰、比亚迪、极氪等大部分车企感知方案之争:自动驾驶领域的感知方案分类主要围绕传感器配置展开,分别是以激光雷达为主的多传感器路线和纯视觉路线。纯视觉路线主要系以算法突破降低硬件依赖,适合大规模普惠型智驾系统,比如:L3级更多应用于乘用车企业卖车模式,对成本较为敏感。多传感器融合方案以硬件冗余保障安全,适合高阶自动驾驶(L4+)或复杂场景,比如Robotaxi,无人物流这些出了问题会追责运营方的应用,对安全性要求较高。数据来源:谷歌官网,特斯拉官网表:多传感器路线vs纯视觉路线 纯视觉路线L2-L3特斯拉已通过FSD实现L2+商业化落地,L3尚未得到北美与国内地区相关部门的批准,特斯拉已被列入奥斯汀市的Robotaxi运营商,处于“测试”阶段。从L0-L5逐步提升;感知靠纯视觉(采用摄像头,不采用激光雷达)特斯拉则通过摄像头采集数据,采用端到端模型对现有的几百万辆车收集的真实世界车辆数据进行训练,以不断升级其FSD系统。1)真实数据量大,随着车销售量的提升,真实采样数据随之增长;2)成本低,摄像头硬件成本低,适合在量产车上搭载;1)较难解决算法的长尾问题(是指少部分类的数据占比过大,大部分类仅仅只有少量数据的分布),即算法长期训练正常路况问题,但对夜间信号灯损坏、障碍物被遮挡等极端问题训练较少;2)辅助自动驾驶不等于自动驾驶。即L2~L3做得好,不一定代表能顺利迁移到L4-L5,难度不是线性变化的,是指数级变难。特斯拉、小鹏 3.自动驾驶技术路线-技术架构的两大流派数据来源:PS Chib, et al. Recent Advancements in End-to-End AutonomousDriving using Deep Learning: A Survey,西南证券整理技术架构的选择:国内车企的端到端技术路线分为两大流派,分别是一段式端到端和分段式端到端。“一段式”端到端,特点是感知、决策、规划全流程整合为单一神经网络,数据驱动效率高,但需要海量数据和高算力支撑。优势是能应对未定义障碍物,例如突然滚落的轮胎或异形物体,系统可自主生成避让策略。缺点是黑箱问题突出,调试难度大;算力成本高,例如特斯拉FSDV12训练成本达10亿美元。“两段式”端到端,特点是感知与规控分阶段处理,模块化设计便于优化和验证。优势是降低开发复杂度,适合数据积累不足的车企快速上车。例如小鹏XNGP通过XNet(感知)、XPlanner(规控)、XBrain(认知)三模块协同,实现拟人化驾驶。部分车企(如蔚来)计划逐步从两段式过渡到一段式,通过云端算力提升模型整合能力。图:一段式端到端(隐式端到端) 维度一段式/隐式端到端优势拟人化强、全局优化、长尾场景泛化能力高可解释性强、模块易调试、安全冗余高劣势黑盒风险、调试困难、数据需求极大代表企业特斯拉、理想汽车、Momenta企业应对策略特斯拉增加数据回传、理想分设快慢系统表:一段式端到端vs分段式端到端数据来源:OpenVLA: An Open-Source Vision-Language-Action Model,西南证券整理 分段式/显式端到端信息传递损失、场景泛化能力较弱华为、小鹏、百度Apollo华为嵌入本能安全网络、小鹏强化XBrain11 3.自动驾驶技术路线-感知端的算法架构的重大变革第一次变革:从2D CNN到BEV+Transformer•特斯拉在2021年首次将BEV+Transformer架构引入自动驾驶领域。BEV(BirdEysView鸟瞰图)指的是将摄像头采集的2D图像转换为3D鸟瞰图视角,这样可以让自动驾驶系统更好地理解道路场景。Transformer是一种强大的神经网络架构,用于处理序列数据(比如时间序列的图像数据),可以帮助系统更好地理解场景中的动态变化。BEV+Transforme就是将BEV视角和Transformer架构结合起来,优势在于可同时融合多个传感器信息,时序信息(让模型有“记忆”),且可以构建一个实时建图能力,减少对高精地图的依赖。•2022年,特斯拉又提出OCC算法(Occupancy Network,占用网络),将算法架构升级为BEV+Transformer+OCC架构。BEV的视角只能获取未知土体的占用方块面积,OCC引入了高度的信息,可以在矢量空间中产生统一的体积占用数据,可以用来预测通用障碍物的位置。该架构的优点是可以规避一些未知的物体(不需要“认识”即可“识别”),大幅提升了算法对障碍物体的感知能力,减少corner case。此外,OCC也是一个强泛化能力的算法,也可以用在人形机器人上。数据来源:特斯拉2021 AI Day,西南证券整理数据来源:CVPR 2022,西南证券整理图:BEV+Transformer架构 图:Occ