您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架 - 发现报告
当前位置:首页/行业研究/报告详情/

智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架

交运设备2024-06-04林子健、谢孟津华鑫证券嗯***
智能驾驶系列研究(一):从特斯拉视角,看智能驾驶研究框架

从特斯拉视角,看智能驾驶研究框架---智能驾驶系列研究(一)证 券 研 究 报 告投资评级: ( )报告日期:推荐维持2024年06月04日◼分析师:林子健◼SAC编号:S1050523090001◼联系人:谢孟津◼SAC编号:S1050123110012行业深度报告 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 2从特斯拉视角看智能驾驶硬件配置特斯拉视角智能驾驶历史复盘算法数据闭环智能驾驶未来研究框架硬件降本算法数据闭环政策法规核心结论:第一章:回顾历史,智能驾驶的核心主线是算法的演进史,从2017年至今,在感知侧+规控侧实现算法从规则为主走向端到端。算法方面,2017-2022年,特斯拉在感知侧走向端到端,实现BEV+Transformer+Occupancy。2021-2023年,特斯拉在规控侧从规则走向端到端。数据闭环方面,特斯拉在2022年实现模拟仿真数据、自动标注、云端算力等三个方面的升级。硬件方面,特斯拉从HW1.0升级至HW4.0,期间通过算法升级+自研FSD芯片,实现更为适配智能驾驶进化的硬件体现。第二章:展望未来,我们认为智能驾驶的算法将走向收敛,核心主线将从算法走向数据闭环。向未来看,我们提出由算法+数据闭环+硬件降本+政策法规四个维度构成的研究框架。围绕这些角度展开,我们提出未来智能驾驶核心的三个趋势:数据竞赛+大模型+任务导向。第三章:对国内智驾能力的区分,我们提炼四个维度:数据积累能力+智驾好用能力+安全性+舒适性。基于数据闭环(背后竞争要素对应为组织的工程化能力)成为未来核心分水岭,我们认为基于算法来判断各车企领先程度的意义将愈发有限,以对数据为主的跟踪将成为未来判断各车企竞争水平的重要指标。第四章:智驾下半场是城区NOA,智驾有望在2025H1迎来“好用”拐点。通过复盘高速NOA发展历史,我们总结出高速NOA与城区NOA的两点不同,提出城区NOA发展的三个阶段,判断2025H1有望实现“好用拐点”。 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 3车企能力跟踪框架+智驾临界拐点可期执行侧舒适度车企的智驾能力跟踪框架数据积累能力安全智驾好用能力智驾拐点判断驱动方式城区NOA三个阶段落地成本两个不同可用:2023-2024好用: 2024-2025H1必用: 2026及以后高速NOAvs城区NOA高速NOA三年好用城区NOA更快 风 险 提 示诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 4➢智能化落地不及预期;➢技术迭代风险;➢宏观经济波动风险;➢下游需求不及预期的风险。 目 录CONTENTS4.需求:智驾拐点何时来临1.历史:特斯拉视角看智驾演进诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 52.未来:智能驾驶研判框架3.供给:车企智驾能力分析 01特斯拉视角:智驾历史复盘 2023.08.152024.04.202024.04.282023.11.232024.04.29特斯拉计划组建一个20人左右的本地远营团队,以推动自动驾驶在中国市场落地。与此同时,特斯拉还在中国尝试成立一个数据标注团队,规模约上百人,为训练FSD的算法作准备。特斯拉中国回应,FSD落地中国正在推进的消息属实。马斯克在twitter上的回复中表态,FSD入华"可能很快就会到来”,本次访问中国预计将推动相关进程。马斯克访问中国:特斯拉通过国家汽车数据安全4项全部要求。据特斯拉用户APP表示,特斯拉中国官方的FSD购买页面描述由“稍后推出”改为“即将推出”,特斯拉FSD离进入中国更进一步。FSD入华落地进入倒计时,从特斯拉视角看智驾诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 7资料来源:财联社,twitter,中国汽车工业协会,特斯拉官方,华鑫证券研究 诚信、专业、稳健、高效请阅读最后一页重要免责声明资料来源:《面向大场景的智能驾驶端到端算法研究》,亿欧智库,华鑫证券研究图表:智能驾驶模块化设计理念1.1智能驾驶设计理念分类:模块化vs端到端端到端架构:数据驱动LSTM网络Transformer卷积神经网络➢模块合成式驾驶方法:包含感知、规划决策,执行控制三大模块,通过分别调试每个模块的参数来适应各种各样的驾驶场景。•(1)感知模块:利用各种传感器来实现对静止环境、行车相关信息及移动障碍物的全面检测和跟踪,进而将场景图像转化为关键感知指标。•(2)决策模块:在完成道路交通场景的感知后,从感知模块获取全局和局部信息,对起点到终点的行驶路线进行分析和规划,确定车辆的行驶路线并最终输入执行模块以实现车辆控制。•(3)控制模块:负责将来自决策模块的行驶策略转化为具体的车辆控制指令,实现车辆的实际运动。➢端到端智能驾驶方法:端到端智能驾驶方法本质上是使用一个独立系统进行驾驶,通过训练一个深度神经网络从感官输入(如摄像头采集的道路信息)直接映射到驾驶动作。模块化架构:规则驱动感知-定位决策-规划执行-控制环境感知定位/导航GPS/惯性导航车辆数据决策系统转向控制驱动控制制动控制安全控制轨迹规划模块异常处理激光雷达毫米波雷达传感器行为决策模块执行系统路径追踪系统PAGE 8图表:智能驾驶端到端设计理念 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 9资料来源:《ALVINN : An autonomous land vehicle in a neural network》,《基于深度学习的端到端自动驾驶模型研究及仿真》,Building the Software 2 0 Stack,《End-to-end Autonomous Driving: Challenges and Frontiers》,华鑫证券研究图表:第一台端到端ALVINN图表:规则驱动与数据驱动对比•1.1.1 2014-2016年以规则驱动为主•端到端的设计理念是输入原始数据后,直接反应输出结果,最早可追溯到上世纪80年代。1988 年,第一辆端到端驱动的陆军救护车 ALVINN ,当时还没有出现卷积神经网络 CNN,只构建了一个三层可反向传播的全连接神经网络,并在卡内基梅隆大学的校园内以0.5m/s 的速度准确的行驶了 400 米。•相比规则驱动,端到端的框架更为简洁,应用潜力更大,但受制于神经网络模型的发展,一直未在产业中大规模落地使用。规则驱动系统数据驱动系统端到端模块化可解释性、可验证性、易于调试受限神经网络模型发展;黑匣子优势设计理念劣势错误传递、模块间不协调、潜力有限模型架构数据驱动潜力较大,简洁,易于联合训练1.1感知侧走向端到端历程 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 10资料来源:Mobileye,The Distance Estimation of Monocular Camera,Theverge,华鑫证券研究图表:MobileEye距离测试规则示例•1.1.1 2014-2016年以规则驱动为主:由Mobileye提供智驾解决方案。早年的特斯拉并没有自研自动驾驶芯片,从2014年开始特斯拉与Mobileye合作,在其量产车型上一直采用Mobileye的EyeQ3技术方案。Mobileye届时的算法主要由规则驱动,以单目相机成像测距为例,通过物体在图像中的像素高度h和焦距f,即可计算出前方车距。•2016年特斯拉和Mobileye终止合作:①导火索:2016年5月第一起配备 Autopilot的ModelS发生致命事故,无法识别白色拖车和天空;②核心原因:Mobileye提供的车企的是一个封闭的黑盒方案,车企不仅不能修改其中的算法,而且还不能与Mobileye共享车辆数据。图表:利用焦距计算距离原理示意1.1感知侧走向端到端历程 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 11资料来源:《丁磊:生成式人工智能》,《Edge Machine Learning for AI-Enabled IoT Devices: A Review》,《Image Processing: How Do Image Classifiers Work?》,华鑫证券研究•1.1.2 感知侧2017-2022走向端到端:Transformer+BEV+ Occuopancy的主流架构•CNN极大提高了机器视觉的识别效率,让机器视觉走向深度神经网络结合的端到端架构成为可能。从机器认识一只狗的过程来类比,此前的DNN网络依赖于先认识狗的每个“细胞”,而CNN则从认识狗的一个部位开始,例如眼睛、耳朵,来判断一只图像为狗,其中涉及到三个主要的不同:•(1)不需要认识图像的全部,识别难度降低;(2)通过局部特征训练出来的神经元,能更好的迁移到其他图像(从认识狗的专家,变成认识耳朵的专家);(3)卷积过程降低了图像特征的维度,减少数据量。图表:DNN去认识一只小狗1.1感知侧走向端到端历程图表:CNN去认识一只小狗 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 12资料来源:《丁磊:生成式人工智能》,《深度神经网络的关键技术及其在自动驾驶领域的应用》,华鑫证券研究图表:CNN卷积-池化层核心结构示意•1.1.2 感知侧2017-2022走向端到端:Transformer+BEV+ Occuopancy的主流架构•深入来看,CNN神经网络的效率核心在于卷积+池化的过程。相比全连接DNN神经网络,CNN需要训练的参数数量明显减少。举例来说,一幅像素为1K*1K的图像作为输入,Hiddenlayer有1M节点,仅一层就有10^12个权重需要训练,如果使用CNN网络,采用100*100的卷积核,共使用100个卷积核,输入到Hiddenlayer的参数便降低到了100*100*100=10^6个。•如果说CNN将管理100人的工作变成管理10个组长,那卷积核就像不同的组长 :不同的卷积核代表了不同的特征提取能力。该结构上下层不再直接全部连接,同一层将共用单个或一定数量的卷积核,因此大大减少了训练权重的数量。图表:CNN工作过程示意图1.1感知侧走向端到端历程 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 13资料来源:Building the Software 2 0 Stack,Enhancing Deep Learning Performance using Displaced Rectifier Linear Unit,华鑫证券研究图表:特斯拉Software2.0吞噬1.0过程图图表:神经网络将设计特征从专家交给机器•1.1.2 感知侧2017-2022走向端到端:Transformer+BEV+ Occuopancy的主流架构•2017年Andrej Karpathy加入特斯拉,推动CNN神经网络落地,感知侧端到端拉开序幕。Andrej Karpathy2015年在斯坦福执教,设计并创办了课程卷积神经网络CNN在机器视觉中的应用。•特斯拉提出Softwate2.0吞噬1.0,CNN网络架构将设计特征的工作从专家交给机器。传统的特征设计往往由特定领域内的专家设计,但当面对复杂任务情景是,专家设计的特征往往存在诸多局限,例如特征本身的有效性、有限性等等。Andrej Karpathy2017年加入特斯拉,推出Software 2.0,提出用2.0(基于CNN神经网络模型)吞噬传统Software1.0(由Python、C++等语言编写的代码)的理念。2.0 code1.0 code2.0 code1.0 code1.0:基于编程代码2.0:基于端到端神经网络2.0 codeOutputHand-designed programInputMapping from featuresHand-designed featuresInputOutputMapping from featuresFeaturesInputOutput1.1感知侧走向端到端历程 诚信、专业、稳健、高效请阅读最后一页重要免责声明PAGE 1