您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:计算机行业点评:海外巨头竞相发布ADAS更新,FSD有望三个月后表现超过人类 - 发现报告

计算机行业点评:海外巨头竞相发布ADAS更新,FSD有望三个月后表现超过人类

信息技术2025-01-18国盛证券芥***
AI智能总结
查看更多
计算机行业点评:海外巨头竞相发布ADAS更新,FSD有望三个月后表现超过人类

马斯克表示三个月后FSD性能有望超过人类驾驶员,ADAS技术迭代加速。1)根据36kr新闻报道,在今年的CES 2025大会的采访上,马斯克表示,“(现阶段)自动驾驶汽车的性能提升速度呈指数级增长。我们有信心在三个月内,也就是今年第二季度,实现自动驾驶汽车的性能超越人类驾驶。”,展现出马斯克对FSD迭代速度的信心。2)根据特斯拉自动驾驶工作人员Ashok Elluswamy的推特信息披露,特斯拉FSD v13.2已开始向有限的外部客户推出。而根据马斯克在推特上的表述,V13在每次必要干预之间的英里数将比现在好5到10倍。特斯拉FSDv13版本的发布显示了公司端到端算法迭代速度,我们预计伴随着特斯拉数据和算力的持续积累,其算法将继续加速迭代,为自动驾驶带来更好的乘驾体验。 英伟达发布Cosmos世界模型赋能算法开发,发布丰田合作自动驾驶进一步落地。1)NVIDIA创始人兼首席执行官黄仁勋在北京时间2025年1月7日发表了CES开幕主题演讲,并推出加速物理AI开发的Cosmos世界基础模型平台。cosmos可加速物理AI系统的世界模型开发,从而赋能自动驾驶算法开发。2)丰田、Aurora和大陆集团宣布加入NVIDIA合作伙伴行列,将利用NVIDIA加速计算和AI开发构建乘用与商用车型。 智能驾驶进入端到端时代,算法、算力、数据飞轮三者叠加驱动智能驾驶技术快速进步。1)2024年3月,特斯拉在自动驾驶领域发布了FSD Beta v12.3更新,该版本是完全基于端到端神经网络的解决方案,旨在模拟更自然、更人性化的驾驶。相比传统规控方案,端到端算法的优点在于无损的信息传递、完全由数据驱动、具备学习能力更具泛化性,因此成为了最新的主流技术方向。2)数据是自动驾驶训练的食粮,根据Tesla官方披露资料,自2024年FSDv12发布以来,FSD累计驾驶里程数就以更快的速度上行,根据Tesla AI官方推特披露,截至2024/10/24,Tesla的车队在FSD监督下累计行驶距离已经超过20亿英里,其中超过50%是在V12上完成的。3)算力:算力是训练基础,没有大规模算力就没有优秀自动驾驶算法。算力是一切AI算法的基础,没有大规模算力就如巧妇难为无米之炊,天然抬高了智驾自研入场门槛。特斯拉算力规模已超6万张H100,预计到24年底将拥有接近9万张H100之巨的规模。算力储备成本巨大,对车企的资金及渠道能力提出挑战,利好实力雄厚的领军玩家。 建议关注:1)华为智车:江淮汽车、赛力斯、长安汽车、北汽蓝谷等;2)特斯拉产业链:世运电路等;3)自动驾驶产业链:德赛西威、万马科技、中科创达、经纬恒润、海天瑞声、万集科技、速腾聚创、禾赛科技、千方科技、金溢科技、鸿泉物联等;4)算力:寒武纪、海光信息、中科曙光、浪潮信息、神州数码、软通动力等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 1.FSD v13已向部分用户发布,马斯克称FSD有望在三个月后超越人类驾驶员 FSD v13已向部分用户发布,有望将必要干预之间的里程数增加5-10倍。根据特斯拉自动驾驶工作人员Ashok Elluswamy的推特信息披露,特斯拉FSDv13.2已开始向有限的外部客户推出。而根据马斯克在推特上的表述,V13在每次必要干预之间的英里数将比现在好5到10倍。 图表1:V13在必要干预之间的英里数将比现在好5到10倍 V13版本升级了端到端驾驶网络的每个部分,包括:36 Hz,全分辨率AI4视频输入 原生的AI4输入和神经网络架构4.2倍数据规模升级 5倍训练计算量(由Cortex集群支持)减少2倍的光子到控制延迟 城市道路和高速路上的速度记录一键从停车状态启动FSD(监督)综合的卸泊、倒车和泊车功能改进的避免碰撞奖励预测 改进的摄像头清理功能 重新设计的控制器以实现更流畅、更准确的跟踪 当车队检测到道路封闭时,显示多元动态的路径规划 即将进行的改进为: 3倍模型尺寸缩放 3倍模型上下文长度缩放 音频输入以更好地处理紧急车辆改进导航奖励预测 改善停车场的假制动和减慢行车速度 支持更多的目的地选项,包括停车、特定停车位、车道或车库地图和导航输入的高效表示 改进了对相机遮挡的处理 图表2:FSD V13具体更新内容 马斯克表示大约3个月后FSD性能将超过人类驾驶员。根据36kr新闻报道,在今年的CES 2025大会的采访上,马斯克表示,“(现阶段)自动驾驶汽车的性能提升速度呈指数级增长。我们有信心在三个月内,也就是今年第二季度,实现自动驾驶汽车的性能超越人类驾驶。”,显示出马斯克对FSD及自动驾驶技术发展速度的信心。 图表3:马斯克在CES期间接受采访 特斯拉FSDv13版本的发布显示了fsd端到端算法迭代速度,马斯克的发言则昭示了FSD正在快速迭代中的、将在远期达到的美好终局远景。我们预计,伴随着特斯拉数据和算力的持续增长,其算法将继续加速迭代,为自动驾驶带来更好的乘驾体验。 2.英伟达推出Cosmos世界基础模型平台,赋能自动驾驶算法开发 在CES 2025上,英伟达重磅发布一系列自动驾驶相关功能及合作。NVIDIA创始人兼首席执行官黄仁勋在北京时间2025年1月7日发表了CES开幕主题演讲,介绍了加速计算技术在AI、机器人、游戏和自动驾驶领域取得的突破性进展。主题演讲展示了NVIDIA如何通过新产品、世界模型、工具和工作流推动AI变革,从而改变行业和社会。 推出加速物理AI开发的Cosmos世界基础模型平台,赋能自动驾驶算法开发。构建物理AI极具挑战性,需要精确的模拟以及真实世界的行为理解和预测。克服这些挑战的一个关键工具是世界模型,该模型根据过去的观察结果和当前的输入结果预测未来的环境状态。这些模型对于物理AI构建者来说非常重要,使他们能够在受控环境中模拟、训练和优化系统。然而,开发有效的世界模型需要大量数据、计算能力和真实世界的测试,这可能会带来重大的安全风险、物流障碍和高昂的成本。为了应对这些挑战,开发者通常会使用通过3D仿真生成的合成数据来训练模型。虽然合成数据是一种功能强大的工具,但创建合成数据需要大量资源,可能无法准确反映现实世界的物理特性,在复杂或边缘情况下尤其如此。端到端NVIDIA Cosmos平台可加速物理AI系统的世界模型开发。 Cosmos基于CUDA构建,结合了先进的世界基础模型、视频标记器和AI加速的数据处理流程。开发者可以通过微调Cosmos世界基础模型或从头开始构建新模型来加速世界模型的开发。除了Cosmos世界基础模型之外,该平台还包括: 用于高效视频数据管护的NVIDIA NeMo Curator Cosmos Tokenizer可实现高效、紧凑和高保真的视频标记化 为机器人和自动驾驶应用预训练的Cosmos World Foundation模型用于模型训练和优化的NVIDIA NeMo框架 图表4:Nvidia Cosmos是一个世界基础模型平台 NVIDIA面向物理AI开发者社区开放Cosmos世界基础模型。无论公司规模大小,研究人员和开发者都可以在NVIDIA允许商业使用的开放模型许可下,自由使用Cosmos模型。构建AI智能体的企业还可以使用在CES上推出的新开源NVIDIALlamaNemotron和CosmosNemotron模型。 丰田、Aurora和大陆集团加入NVIDIA合作伙伴行列,推出下一代高度自动化的自动驾驶车型。NVIDIA宣布,丰田、Aurora和大陆集团已加入全球移动出行领导者行列,利用NVIDIA加速计算和AI开发构建乘用与商用车型。 图表5:英伟达与丰田达成合作 3.智能驾驶突破性进入端到端时代,算法+算力+数据飞轮驱动ADAS快速迭代 3.1算法:从传统规控到端到端,ADAS算法迈入新时代 2024年3月,特斯拉在自动驾驶领域取得了重大飞跃,发布了FSD Beta v12.3更新。 这个版本被埃隆·马斯克描述为“革命性的”,并强调了对该软件所做的实质性改进,甚至暗示它可以被视为一个新的主要版本v13。目前,FSD Beta v12.3的推出主要针对一小部分员工和精选客户。 图表6:马斯克称特斯拉FSDv12.3重大发布接近v13 FSD Beta v12.3版本是完全基于端到端神经网络的解决方案,旨在模拟更自然、更人性化的驾驶。这是一项接近实现L4和L5级自动驾驶的重大转变,即车辆在大多数情况下无需任何人为干预即可运行,标志着朝着完全实现自动驾驶体验迈出了重要一步。马斯克强调,尽管与前身有类似的更新说明,但引擎盖下的改进是相当大的,标志着朝着完全实现自动驾驶体验迈出了一大步。 图表7:特斯拉在2023年11月向员工推出完全自动驾驶(FSD)V12版本 在此之前,马斯克于2023年5月表示,V12“是为FSD成为‘端到端人工智能’而保留的,覆盖从图像到转向、制动和加速等的方方面面。”根据美国科技媒体The Verge报告,特斯拉FSD V12如今依赖的是车身摄像头和人工智能,而不像其他竞争对手那样依赖激光雷达等其他类型的车身传感器。 “端到端”是区别于传统自动驾驶路线的全新算法框架,自特斯拉将其落地后,已经成为自动驾驶当前最新主流框架。它和传统感知-规控算法的差别在于: 传统自动驾驶算法采取模块化设计,包含感知、决策规划、执行控制三大模块,研究人员可以通过调试每个模块的参数来使车辆适应各种场景。 1)优点:可解释、可验证、易调试。因为每个模块都是相对独立的,所以当我们的车辆出现问题时我们可以回溯究竟是哪个模块出现了问题;在出现问题后,我们只需要在原有代码规则的基础上调整对应的参数即可。 2)缺点:传递过程中信息损耗、任务多且散导致低效、存在复合误差、规则难以穷尽导致构建和维护成本高。 所谓端到端(End-to-End)就是信息一头进入一头输出,中间没有各个模块传输来传输去,一站式搞定。也就是基于统一的神经网络从原始传感器数据输入直接到控制指令输出的连续学习与决策过程,过程中不涉及任何显式的中间表示或人为设计的模块,不再需要工程师人为写无穷尽的代码了,除此之外;其另一个核心理念就是无损的信息传递。 1)优点:无损的信息传递、完全由数据驱动、具备学习能力更具泛化性。随着感知、决策规划端到端自动驾驶路径逐渐清晰,端到端为迈向L4无人驾驶提供了想象空间。 2)缺点:不可解释、训练成本较高、可能存在幻觉问题。针对以上缺点,目前常见的解决方案便是加入安全冗余。 图表8:传统自动驾驶技术路线vs端到端技术路线示意图 正是由于端到端方案具备的深度学习能力,在未来可以表现出更好的泛化性,因此成为了自动驾驶领域算法最新的主流发展方向。 3.2数据:汽车行驶数据可反哺算法,形成数据飞轮的持续迭代 数据是自动驾驶训练的食粮。数据对于一切AI模型训练来说都是底层基础,对于自动驾驶算法训练来说尤其如此。通过大量的车辆行驶数据训练,算法才能够学会识别理解各种交通情况,提高决策的准确性和可靠性;数据的多样性和质量直接影响算法的泛化能力,使其能够在不同环境和条件下稳定工作,也使得算法可以适应不断变化的交通环境和规则,从而实现更高效、更安全的自动驾驶体验。 汽车行驶数据可以反哺智能驾驶算法,数据飞轮形成持续迭代。实车行驶数据一般在汽车实际驾驶过程中采集,理论上,出售后在路上实开的车辆越多,能够收集到的数据越多,这些数据就能过进一步反哺自动驾驶算法,使得算法本身获得持续迭代,形成持续的正循环。这样的数据飞轮,对自动驾驶厂商来说至关重要;可以说,没有大量数据用作训练,就不可能拥有优秀的自动驾驶算法。马斯克甚至认为,训练FSD这样的算法难度极高,需要“100亿公里以上的汽车数据”。 特斯拉数据积累已超20亿英里,其中超过50%是在FSD v12上行驶得来的。根据Tesla官方披露资料,自2024年FSDv12发布以来,FSD累计驾驶里程数的增长就进入了斜率更高的轨道,以更快的速度上行,截至2024年6月,FS