AI智能总结
中国汽车工程学会国汽战略院 研究团队 吉利汽车研究院 支持单位 2025年10月23日 发布时间 AI技术颠覆性跃迁将全面重塑智能终端开发范式与体验逻辑 近年来,AI正经历颠覆性变革,技术演进呈现四大跨越:从单一模态处理迈向图文音视等多模态深度融合的统一框架、从专家规则转向数据驱动的精准推理、从云端集权计算走向端云协同的高效部署、从经验拟合升级为知识引导的理性决策,这些突破推动AI感知、预测、推理与决策能力的指数级提升,不仅改变了技术落地路径,更将重构所有带有智能终端属性的产品开发范式与用户体验逻辑 算法 具身智能 大语言模型 世界模型 生成式多模态大模型 世界模型基于对世界的理解和认识,模拟和预测未来世界可能的合理状态,帮助智能体更准确地把握环境的复杂性和动态变化,提高交互、决策的合理性和准确性 以大语言模型为代表的大模型技术蓬勃发展,逐步通过大规模数据训练和人类反馈优化,实现更自然、更智能的人机交互 生成式模型经历了从简单概率模型到深度学习,再到大规模预训练模型的演进,生成内容的质量和多样性不断提升 Transformer架构重构感知范式,革新自然语言处理领域,成为BERT、GPT等大语言模型的基础,是当前生成式AI和多模态学习的核心架构 具身智能从早期的规则和感知控制方法演进到大模型驱动的具身智能,伴随着大模型能力的不断增强,具身智能能够实现更丰富的人机互动和物理环境中的智能行为 强化学习突破了“监督学习依赖标注数据”的局限,支持仿真技术与离线学习,推动AI从“感知世界”迈向“自主决策” st当前的状态at采取的动作st+1未来状态 AI技术跃迁与创新突破为汽车全面智能化转型提供根本驱动力 AI将实现对汽车的全面赋能,推动汽车成为具身智能体(AI Car) AICar(汽车智能体)是下一代智能空间的核心载体与智慧出行的生态节点,以“专业可靠的司机+聪明温暖的伙伴”为双角色定位,以“自主性、交互性、适应性”为关键特征,通过多域智能(智驾、座舱、底盘、动力)的融合,真正实现从“功能集成”到“智能协同”的跨越,打通物理世界与数字世界,并逐步深化记忆、推理、主动进化的类生命体特质,最终成为深度嵌入用户生活全场景的智能生态核心枢纽 产品畅想 AI Car的本质是由多个子智能体有机融合的超级智能体 AICar需同步应对驾驶决策、安全执行、空间交互、能量管理等任务,这类任务兼具多目标性、高动态性与高复杂性,单一智能体难以胜任,因此在AI对各域分别实现深度赋能的背景下,AICar将进化为由多域子智能体有机协同、深度融合而成的超级智能体,以此突破单一智能体的能力边界,满足复杂出行场景下的多元需求 ◆VLA将改变车路云协同自动驾驶系统的设计逻辑与能力边界 ◆算力优化与车路数据闭环将成为驾驶智能体实现高效自迭代的核心抓手 ◆“超拟人交互”将重塑人车关系,助力座舱智能体迈向终极形态 ◆基于端云协同、大小协同的交互功能智能分配将成为座舱的应用范式 ◆在多端互联推动下AI OS将加速实现从座舱开始的落地应用 ◆智能底盘与动力将成为精准动态控制、保障行车安全的“运动控制大脑” ◆AI将赋能形成“智驾+底盘”更大的端到端系统,重构驾乘体验 ◆动力电池向集实时感知、自主决策、动态响应的智能电池系统转型 ◆AI赋能下的全局最优能量策略,将重塑车辆使用全周期能量管理范式 关键判断一 VLA将改变车路云协同自动驾驶系统的设计逻辑与能力边界 技术解析:VLA在统一架构内深度整合了视觉感知、逻辑推理、行为规划等多模态信息,能够有效解决多模型信息传递损耗和联合优化效果不佳等问题。当前,VLA已开始在车端部署,大语言模型、MoE架构、扩散模型是支撑VLA性能优化的关键,即大语言模型负责理解推理、MoE保障模型高效运行、扩散模型输出精准轨迹 战略院判断:VLA的核心价值是“一体化效率”与“场景适应性”,可以让车路云协同智驾系统像人类一样“看见即能行动”,将成为车端“端到端”系统的核心形态,与路端智能协同成为驾驶智能体的基础 向前一步:VLA的本质是将多模态信息整合在统一架构内,即V+L+A,未来端到端势必融合更多模态,核心形态将发展为XLA即Xn+L+A 关键判断二 世界模型本质是对真实世界的极致压缩,将成为理解世界预测未来的基础工具 技术解析:世界模型旨在构建能够理解、推理并预测驾驶环境的AI框架,通过整合传感器数据、交通规则及历史经验等要素,利用反事实推理、物理规则模拟及泛化等核心能力,模拟人类驾驶员对于复杂场景的认知逻辑 战略院判断:当前,世界模型主要通过空间重建和时间推演助力智驾系统的强化学习与闭环仿真训练,未来,世界模型还将深度赋能舱驾融合多模交互与价值挖掘,应用于所有需要在虚拟环境中创建场景、进行预测和交互的环节 世界模型赋能智能驾驶的方式演进 舱驾融合多模交互+数据融合与价值挖掘未来 舱驾融合多模交互 ➢实现自然流畅的车内外多模交互 融合视觉、语音、手势等多种信息,拥有类人感知能力,并模拟驾驶员思维,让用户与车辆的交互更加自然流畅 ➢构建个性化与情感化交互通过持续学习用户数据,为用户提供高度个性化的交互体验 第二类:隐空间预测 数据融合与价值挖掘 直接学习状态转移和下个动作预测,而不生成数据 ➢打破数据壁垒实现高效融合 世界模型作为统一的框架,整合智能座舱和智能驾驶系统的数据,加速舱驾一体技术落地 对融合后的数据进行深度分析和挖掘,支持辅助驾驶系统迭代 向前一步:从“专用智驾模型”向“通用基座模型”演进,将端到端系统的“类人”与世界模型的“类世界”进行融合是技术迭代方向 关键判断三 算力优化与车路数据闭环将成为驾驶智能体实现高效自迭代的核心抓手 技术解析:算力负责为算法迭代提供基础设施建设,数据负责为算法迭代提供根本驱动力 战略院判断:①行业呈现车云两端算力同步扩张的趋势,但算力规模是竞赛基础,能效比优化才是取胜关键;②数据量的积累已成为共识性发展路径,但规模只是开局,闭环才是终局,企业需构筑全栈、全价值链的车路数据闭环能力 车端 车端SoC芯片算力上限持续突破高性能芯片正持续加速普及应用 向前一步:无论是算力还是数据,相较于“量”的扩张,实现“量”的优化及“质”的提升将成为企业决胜AI时代的核心竞争力 “超拟人交互”将重塑人车关系,助力座舱智能体迈向终极形态 技术解析:多模态感知及上下文工程、因果推理与隐式意图解构、跨场景多模态身份记忆网络等技术有望解决当前座舱面临的感知模态孤立、情境理解肤浅、意图理解机械、交互被动僵化、缺乏推理共情、记忆碎片化等痛点难点 战略院判断:“超拟人交互”将实现拟人级别的感知、理解、记忆与交互能力,重新定义人车关系,不断强化情感陪伴、长期协同等维度的深层价值,并推动座舱智能体加速迈向“数字生命伙伴”这一终极形态演进 向前一步:座舱智能体将成为人车交互的唯一窗口,是串联各域智能体实现跨域协同服务的自然交互中枢 关键判断五 基于端云协同、大小协同的交互功能智能分配将成为座舱的应用范式 技术解析:端云协同将强感知理解、强隐私相关及实时性要求高的功能优先部署在端侧,将复杂生成类和知识检索类功能优先部署在云端,最终实现不同场景下功能和数据的有效互补,目前端云协同已经成为行业共识性方案 战略院判断:端云协同既能发挥云端大模型的资源优势,又能结合端侧小模型的计算敏捷性,将成为座舱领域AI技术的应用范式,实现强推理与长记忆结合,解决更多边际痛点和需求碎片化问题 端云协同解耦架构 探索-分割协同-流程示意 主流-切换协同-流程示意 阶段一:初始化与分割点决策1.端侧设备接收用户请求 2.系统实时监测网络状态、设备算力、电池电量等参数并进行上下文评估3.基于评估结果,选择最优模型分割点 阶段二:端侧计算与特征提取4.对原始输入进行标准化处理 5.执行模型分割点前的所有层6.生成中间表征(Tensor) 7.将中间表征压缩传输至云端8.云端从分割点开始执行后续模型层9.对输出进行后处理和优化 阶段四:结果返回至端侧呈现 向前一步:端云协同的任务处理中心将从以“云”为主转向以“端”为主,重塑任务处理的效率与体验 关键判断六 在多端互联推动下AI OS将加速实现从座舱开始的落地应用 技术解析:AIOS是基于AI跨域融合、多端互联的操作系统,能够充分融合汽车、手机、电脑、平板、穿戴设备、智能家居等多智能终端的用户需求与感知数据,能够在保证系统安全性和用户隐私的同时实现高效资源管理、任务调度和多终端精准服务分发,最终满足用户全场景智能生活体验的需求 战略院判断:智能座舱作为承载用户情感、连接数字生活的智能移动空间,将成为AIOS提供智能服务的关键载体 向前一步:AI OS将从座舱域的智能场景服务向整车各域的深度融合演进,将全车整合为可整体调度、融合连贯的“超级智能体” 智能底盘与动力将成为精准动态控制、保障行车安全的“运动控制大脑” 技术解析:通过引入局部神经网络及模型预测控制等算法,VMC将持续迭代,成为逼近物理极限的“运动控制大脑”,实现多输入、多输出的智能化精准动态控制,持续拓展线控执行器的性能及潜力,不断突破动态控制上限 战略院判断:通过感知+AI与线控技术的深度融合,底盘的角色将被颠覆,从被动感知、单域控制、人工标定的机械系统向主动感知、协同控制、健康管理、自主适应、自主学习的智能化协同系统演进,智能调用整车原子能力,重新定义智能行车体验,自如应对极端工况极致操控与安全避险的全场景需求 AI驱动智能化 多域数据融合实时动态调整 全新功能 提升用户体验打造差异化竞争力 向前一步:以“全域融合动态控制”“全维舒适体验”与“全场景安全保障”为目标,最终构建“全生命周期进化不息”的底盘智能体 关键判断八 AI将赋能形成“智驾+底盘”更大的端到端系统,重构驾乘体验 技术解析:底盘可与智驾构建深度耦合的“控制闭环”,底盘响应智驾指令调控姿态,智驾根据底盘反馈优化路径,基于高频数据交互与实时算法迭代,能够依据路面环境自主调整行驶策略,使车辆在复杂工况下保持动态稳定 战略院判断:智驾与底盘的初期融合探索主要以点状技术融合为主,核心是双向交互、数据打通与安全备份,随着中央集中式电子电气架构的发展,智驾与底盘的融合中枢或将实现 第三阶段 第二阶段 融合,智驾+底盘的端到端打通(面向L5) 向前一步:通过基于高速以太网、多域互联的新一代EE架构,“底盘+智驾+座舱”将深度融合,提供千人千面、风格随心的驾乘体验 动力电池向集实时感知、自主决策、动态响应的智能电池系统转型 技术解析:通过多维先进传感明晰电池故障与内外信号的对应关系,提取关键物理场参数并确定外置传感器最优监测方案,构建AI驱动的多维信号协同监测与故障诊断模型,智能电池管理系统可实现更加精准的状态估计与安全预警,并能进行多场主动调控,助力动力电池实现低成本智能化转型 战略院判断:电池安全的重心将从“被动防护”和“故障报警”升级为“隐患预警”和“风险主动抑制”,应以个体化数字孪生模型和端云协同的AI诊断技术为抓手,对潜在故障进行长周期预测,实现电池健康状态的精准预测与全生命周期管理,让电池安全成为一种可进化的服务能力 向前一步:从“被动保护”跃迁为“前馈预警+主动干预”,实现天级预警能力,达成全生命周期零安全事故目标 AI赋能下的全局最优能量策略,将重塑车辆使用全周期能量管理范式 技术解析:通过智能场景引擎、动态因果图谱与混合优化算法,构建“车辆+环境”的全域协同网络,实时(毫秒级)捕捉车端动力、热管理、空调、底盘的状态,同步耦合动态交通、实时天气、分时电价与桩站负载等全域信号,从而彻底打破传统车辆与环境的信息孤岛,实现覆盖用户“上车到离车”的全域实时能量服务与管理 战略院判断:动力智能体将融合全局行程的多源信息,实现全车动力与智驾的