您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国盛证券]:智能驾驶技术的当下与未来:头部玩家的探索与启示 - 发现报告

智能驾驶技术的当下与未来:头部玩家的探索与启示

信息技术 2025-05-24 刘玲,夏君 国盛证券 胡诗郁
报告封面

首席分析师夏君分析师刘玲执业证书编号:S0680519100004邮箱:xiajun@gszq.com邮箱:liuling3@gszq.com ▎1、软件侧:从“模仿人类”到“超越人类”、从“聋哑司机”到“司机助理”1.1从“模仿人类”到“超越人类”1.2从“聋哑司机”到“司机助理”▎2、硬件侧:比人看得清、比人想得远、比人反应快2.1感知层:双目感知、鹰眼视觉、激光雷达,比人看得清2.2决策层:下一代智驾系统对芯片要求更高,比人想得远2.3执行层:线控趋势已成,比人反应快 ➢智驾要普及,光“模仿人类”不够,必须“超越人类”第一个问题:智驾能否普及?人类会不会永远不敢把生命交给智能驾驶?或者渗透率的上限很低?Eg.一个关于“电梯”发展早期的例子:从工业革命时期开始,升降机就已经可以实现上下移动物体或人的基本功能,但直到纽约在1853-1854年举办水晶宫世界博览会后,升降机才被人们视为可以每天安全使用的工具。Elisha Graves Otis在博览会上以大胆时尚的方式,推出其安全制动装置。他将平台式升降机升至10米高度,然后由其助手剪断电梯绳索。平台并没有坠到地面,他向目瞪口呆的观众鞠躬,并宣布“安然无恙!”由此可见,只有技术足够成熟时,人类才会放心将生命交给技术。1.1从“模仿人类”到“超越人类”1835年1835年英国出现了蒸汽机驱动的升降机,它通过皮带传动和蜗轮蜗杆减速装置驱动,主要用于垂直运送货物。1845年,英国人汤姆逊制成了世界上第一台液压升降机。当时由于升降机功能不够完善,难以保障安全,故较少用于载人。1852年,美国纽约杨可斯•奥的斯的机械工程师(ElishaGravesOtis),在展览会上向公众展示了他的发明,从此宣告了电梯的诞生,也打消了人们长期对升降机安全性的质疑。1845年资料来源:梯视达、邢台捷逸达电梯销售有限公司,国盛证券研究所 1852年 ➢智驾要普及,光“模仿人类”不够,必须“超越人类”第二个问题:靠模仿人类,当智驾模型达到人类司机的优秀水平时,能否普及?A:尤其是涉及到人身安全,人性对“自己”和对“技术”的能力存在“双标”。只有远超出人类驾驶水平的智驾技术,才能够大规模普及。1.1从“模仿人类”到“超越人类”01鬼探头撞车场景的双标02财产管理的双标◼想象一下,如果我们自己开车时如果出现鬼探头撞车,我们是什么心态?◼如果是滴滴司机或自动驾驶车辆开,出现鬼探头撞车,我们会否轻易原谅?◼◼注:公式仅提供一定的参考意义,不代表任何具体数据量化的意义。 想象一下,如果我们自己理财亏了钱,我们是什么心态?如果是托付给其他人帮我们理财,亏了钱,我们是什么心态? (自动驾驶技术能力-人类驾驶能力)人类对生命谨慎的程度自动驾驶技术的普及性 ××保险的完善性×政策的支持度=(渗透率) ➢强化学习带来超越人类的潜力•2017年,AlphaGo通过监督学习+强化学习,战胜围棋选手柯洁,成为世界第一。1.1从“模仿人类”到“超越人类”图表:AlphaGo在围棋比赛中战胜人类资料来源:每日经济新闻、地平线机器人发布会、中机创,国盛证券研究所 图表:地平线认为2035年智能驾驶将实现超越人类的驾驶水平 ➢狭义的“端到端”,是一种模仿学习思路通过学习“传感器数据”与“人类驾驶轨迹”的海量对照,让车端模型能做到输入传感器数据后,输出合理的驾驶轨迹。1.1从“模仿人类”到“超越人类”图表:端到端自动驾驶路线图资料来源:《End-to-end Autonomous Driving: Challenges and Frontiers》(Li Chen等,2018),国盛证券研究所 ➢广义的“端到端”,既有“模仿学习”、又有“强化学习”“端到端”系统的三种范式:•行为克隆(模仿学习框架);•逆最优控制(模仿学习框架);•在线强化学习(强化学习框架)。1.1从“模仿人类”到“超越人类”图表:端到端自动驾驶三种范式资料来源:《End-to-end Autonomous Driving: Challenges and Frontiers》(Li Chen等,2018),国盛证券研究所 ➢“超越人类”需要“强化学习”,于是世界模型被引入自动驾驶领域众多车企和供应商纷纷公开提出引入“世界模型”,包括特斯拉、英伟达、蔚来、理想、地平线、商汤、元戎启行、Momenta、小鹏……1.1从“模仿人类”到“超越人类”资料来源:各公司官网、各公司公告,国盛证券研究所 1.1从“模仿人类”到“超越人类”➢自动驾驶领域,世界模型的价值对抗样本是自动驾驶模型的一个安全隐患,利用世界模型,采用同一场景变换condition的方式或者黑盒攻击方式,拿到模型失效的且逼真的样本,用于提升自动驾驶模型的安全性。3、对抗样本世界模型可以生成包含行人、交通和路况的新场景,填补训练中缺失的数据。1、长尾数据生成资料来源:自动驾驶之心,国盛证券研究所 世界模型生成的视频交给自动驾驶模型,规划执行的结果作为世界模型未来预测的条件,再通过世界模型继续生成新的数据,进行闭环仿真的测试。2、闭环仿真测试世界模型通常采用自监督的训练模式,这种方式可以利用大量的无标注数据进行训练,从 而 可 以 作 为 感 知 决 策 模 型 的foundationmodel来提升自动驾驶模型的泛化能力。4、foundationmodel ➢自动驾驶世界模型发展时间表1.1从“模仿人类”到“超越人类”图表:自动驾驶世界模型发展时间表资料来源:《World Models for Autonomous Driving: An Initial Survey》(YanchenGuan等,2024),国盛证券研究所 ➢业界头部玩家的探索——特斯拉•2023年,特斯拉自动驾驶负责人AshokElluswamy在CVPR上介绍了其正在打造的“通用世界模型”。该模型可以通过过往的视频片段和行动提示,生成“可能的未来”的全新视频。其基础架构由多台摄像机的视频流输入,汇集到一个大型Transformer块中,通过空间注意力和几何模型等形成特征并进行预测,可用于预测占用率、体素未来的流动情况以及车道等驾驶所需的任务。•2024年2月,在OpenAI官宣Sora之后不久,埃隆·马斯克发帖称:“特斯拉在大约一年前就能以精确的物理生成真实世界的视频。”1.1从“模仿人类”到“超越人类”图表:世界模型同时预测了车辆周围所有八个摄像头的情况资料来源:鞭牛士,国盛证券研究所 图表:直行预测和右转预测例子 1.1从“模仿人类”到“超越人类”➢业界头部玩家的探索——小鹏汽车•2024年下半年,小鹏汽车已开始面向L4级别的自动驾驶研发全新的“AI大脑”,即小鹏世界基座模型。小鹏研发团队利用优质自动驾驶训练数据,先后开发了多个尺寸的基座模型,目前已经着手推进72B(72Billion,也即720亿)超大规模参数世界基座模型的研发,参数量是主流VLA模型的35倍左右。•为了开发小鹏世界基座模型,小鹏汽车打造了一座“云端模型工厂”,工厂“车间”涵盖基座模型预训练和后训练(强化学习训练)、模型蒸馏、车端模型预训练到部署上车的完整生产链路。图表:小鹏着手推进72B超大模型参数世界基座模型资料来源:小鹏汽车官方微信公众号,国盛证券研究所 图表:小鹏的“云端模型工厂”架构 1.1从“模仿人类”到“超越人类”➢业界头部玩家的探索——理想汽车•2025年1月,理想汽车自动驾驶研发副总裁朗咸朋在第四届全球自动驾驶峰会上指出:“我们的世界模型不仅用于仿真评测,还通过强化学习框架生成合成数据,完善强化学习的闭环过程。”•2025年3月18日,理想汽车自动驾驶技术研发负责人贾鹏在NVIDIAGTC2025分享了对于下一代自动驾驶技术MindVLA的最新思考和进展。MindVLA基于自研的重建+生成云端统一世界模型,深度融合重建模型的三维场景还原能力与生成模型的新视角补全,以及未见视角预测能力,构建接近真实世界的仿真环境。图表:理想的物理世界AI框架资料来源:理想汽车官方公众号,国盛证券研究所 1.1从“模仿人类”到“超越人类”➢业界头部玩家的探索——理想汽车•2025年5月7日,李想在AITalk第二季上分享道:“强化学习分成两个部分:✓第一部分先做RLHF,带有人类反馈的。当人类会接管时,包括人类的一些习惯,来做带有人类反馈的强化训练。安全对齐都在这个环节完成,除了遵守交通规则,还要遵守中国的驾驶习惯,开车习惯要融入社会。✓第二部分是纯粹的RL,用世界模型生成的数据来做训练。目的是开得比人类更好,中间不给人类反馈,只给一个结果:从A点到B点开过去。有三类训练要求:1)通过G值(加速度数值)判断舒适性,给舒适性反馈;2)做碰撞反馈,如果碰撞强化就没完成;3)交通规则反馈,如果违反交通规则就没完成。通过舒适、交通规则和碰撞事故三个维度来做强化训练。”图表:理想VLA司机大模型训练与推理过程资料来源:理想汽车AI Talk第二季、六合商业研选,国盛证券研究所 图表:第三阶段辅助驾驶强化学习 ➢业界头部玩家的探索——小马智行•小马智行联合创始人、CTO楼天城表示,世界模型是车端模型的factory(工厂),L4自动驾驶技术的真正差别在“工厂”的精度,因为它会决定它所生产的产品,即车端模型的上限。•通过AI生成技术,构造训练车端模型的环境,这包括道路情况,路上其他车和人的行为,还有各主体间的交互,然后再用强化学习方法,让车端系统在这个训练环境里自己进化。•小马自研的“世界模型(PonyWorld)+虚拟司机(VirtualDriver)”是全无人驾驶实现规模部署的关键技术。✓“世界模型”通过构建高真实性的训练环境和行为评估系统,每周可生成超过100亿英里的自动驾驶数据集。✓“虚拟司机”系统在世界模型中持续自我进化,已实现在更小算力、量产化硬件下超越人类水准的驾驶表现,特别在极端低概率场景应对能力上取得了突破性进展。1.1从“模仿人类”到“超越人类”资料来源:晚点、金融界、智驾网,国盛证券研究所 图表:小马智行认为L4自动驾驶需要强化学习图表:小马智行自研世界模型+虚拟司机 ➢业界头部玩家的探索——Momenta•Momenta在2024年上半年,实现了量产的一段 式 端 到 端 大 模 型,基 于 模 仿 学 习,并 在2024年发布。2025年的目标是实现基于强化学 习 的 一 段 式 端 到 端 大 模 型,也 就 是Momenta的第六代飞轮飞轮大模型。•Momenta在2025上海车展宣布,首批车端无人的Robotaxi预计将于2025年底开始试运营。1.1从“模仿人类”到“超越人类”资料来源:Momenta知乎官方账号,国盛证券研究所 1.1从“模仿人类”到“超越人类”➢业界头部玩家的探索——地平线•地平线提出了“交互式博弈”,核心在于通过生成数据驱动实现模拟学习和强化学习。为了避免机器对数据的重复模仿,它必须要学会主动理解数据。这时候世界模型就承担了「驾驶世界观」的作用。•通过强化学习,训练数据量的需求降低80%、与基于模仿学习的方法相比碰撞率降低3倍、较其他模型规划准确率大幅提升25.5%。图表:地平线面向量产的端到端世界模型资料来源:36氪、地平线高阶智驾产品发布会、车东西,国盛证券研究所 图表:地平线是最早提出采用强化学习的智能驾驶公司之一 ➢自动驾驶技术超越人类智驾的时间表——价值拐点并不遥远•特斯拉:计划在2025年6月将Robotaxi引入奥斯汀,依赖原有Model Y车型;大规模完全自动驾驶预计将在2026年年中左右实现。(2025Q1财报会)•小鹏:将在2025年年中推出V6全新大版,即准L3级别的高阶自动驾驶技术,这标志着小鹏自动驾驶能力将全面超越FSD V13。到2025年底,小鹏计划推出真正的L3级别自动驾驶软件(2025.02何小鹏微博);到2026年还将规模量产支持L4低速场景无人驾驶的车型。(2024Q4财报会)目前,小鹏汽车用于训练基座模型的视频数据量高达20