栩栩如生的座舱数字人,有望为驾驶者带来“人人交互”的体验。在蔚来汽车上搭载的NOMI机器人一度成为蔚来品牌的当家卖点,NOMI百变的表情和花样繁多的装饰周边让NOMI成功“出圈”。我们认为,具有高度亲和力、智能水平足够高、能帮助驾驶者完成个性化任务,是产品经理定义一个汽车座舱数字人的核心要点,也是AIAgent未来上车的核心能力映射。 当下,座舱数字人因何而被催化?我们认为,生成式AI的爆发给予数字人“灵魂”,全息HUD和高算力智能模组给数字人添加“骨肉”。而座舱智能化时代,用户在驾乘中会有各种个性化需求,数字人被给予更多的施展能力的空间,其终极使命是通过AI Agent实现AGI向汽车座舱渗透,实现三屏互动(手机屏、车载屏和家用屏)。 垂直领域大模型正在向汽车渗透,数字人有了“点睛之笔”。此前OpenAI已经发布ChatGPT API语言模型接口和Whisper API语音识别接口,可以让开发者调用API输出回答并转换为语音,为数字人交互奠定了技术基础。众多车企正在积极布局车载AI:吉利大模型囊括绘画、音乐、语言和自动驾驶,丰富了汽车座舱体验;奇瑞与科大讯飞合作,LION AI大模型专攻语义理解和丰富情感;广汽大模型深度融合云+车两端,剑指AI+V2X。 HUD技术成熟、边缘计算芯片性能充足,数字人获得“骨肉”。HUD抬头显示已被广大用户接受,驾驶者不必低头,从视野前方就可以查看各种车辆和道路信息,成为车载数字人的载体。在生成式AI爆发前,边缘算力已经逐渐渗透进了部分商用场景,如手机云游戏、无人设备驾驶、自动视频识别等。如今随着MLC-LLM,谷歌模型体系等软件基建加速,特斯拉机器人为具身智能完成物理基建,高通10月底发布的异构AI引擎性能达75TOPS,支持设备端运行参数量超过130亿的大模型,汽车已逐步具备同物理世界自主交互的硬件条件。 AIAgent面向复杂任务处理,充分适合人车交互场景,是数字人的核心演进方向。LLM在更新信息、多轮对话和复杂任务处理时存在局限,能够独立思考并拥有规划+记忆+工具使用能力的AI Agent充分克服了这些不足,是LLM通向AGI的重要路线。这种“Agent+”能力具体到车载的应用场景中,可以将AI Agent的能力由易至难总结为5个层次:辅助操作——车身数据采集&可视化——汽车服务(导航、保养、保险等)——生活助理——具身智能。 座舱数字人市场潜力已被验证,订阅制打开AI应用盈利新思路。蔚来NOMI机器人人气相当火热,据2022年至简车言统计的蔚来二手车数据,NOMI选装比例达到80%以上,持平增强现实,仅次于NIO Pilot自动驾驶功能包。在汽车这一消费产品中,由于汽车本身价格相对高昂,这类智能助手几千元的选装边际成本较低,因此就可以吸引到更多用户选装。而近年兴起的车辆功能月/季/年度订阅制,也为车载AI应用打开了全新盈利思路。 投资建议:新能源车销量数据亮眼,后续在应用端围绕AI的竞争不可避免,有望推动车载数字人等应用加速渗透,投资侧建议围绕AI应用、边缘算力和光学硬件品种进行布局。 汽车数字人应用:中科金财、百度(BIDU.US)、微美全息(WIMI.US)等AI应用厂商; 边缘算力芯片:瑞芯微、全志科技、晶晨股份、翱捷科技、乐鑫科技等; 边缘算力承载平台与终端:美格智能、中科创达、广和通、移远通信、龙宇股份、网宿科技等; 光学模组:中际旭创、新易盛、天孚通信、腾景科技等。 风险提示:边缘算力发展不及预期,智能座舱渗透率不及预期,市场竞争风险。 重点标的 股票代码 AGI的快速进步一直是市场关注的焦点,今年以来维持着较高的市场人气,从算力、游戏、营销到医疗、教育等,市场一直在期待新的应用突破点。我们观察到,随着造车新势力销量逐月走高;高通发布最新骁龙8 Gen 3、骁龙X Elite,边缘侧算力再创新高、数字人+AI优化成熟,车载AI全息数字人有望成为“人—车—家”三屏融合中的重要一环。 1.车载全息数字人:AI Agent新场景、人车交互新体验 栩栩如生的智能座舱数字人,有望为驾驶者带来“人人交互”的体验。早先在蔚来汽车上搭载的NOMI机器人一度成为蔚来品牌的当家卖点,NOMI百变的表情和花样繁多的装饰周边让NOMI机器人成功“出圈”。我们认为,具有高度亲和力、智能水平足够高、能帮助驾驶者完成或简单(如接电话、播放音乐)或复杂(如导航、生活助理、汽车保养)的任务,是定义一个智能座舱数字人的核心要点。 未来的人机交互不会停留于冰冷的屏幕和音响。传统的人车交互使用中控屏幕作为介质,蔚来的NOMI将智能助手具象化成一个机器人像,若再进行更深的具象化展现,数字人无疑是最佳路线。以棱镜全息的数字人交互平台为例,其基于云端及本地动态行为数据库,根据不同场景驱动虚拟人形象,扩展虚拟人的使用场景及价值。同时提供基于数字资产的海量周边素材,支持数字虚拟人个性化形象选择、装扮搭配等,打造用户专属的智能虚拟伴侣。 图表1:NOMI机器人周边,是吸引用户的有效手段 图表2:全息投影数字人支持自定义外观 当下,智能座舱数字人因何而被催化?我们认为,生成式AI的爆发给予智能座舱数字人“灵魂”,全息HUD和高算力智能模组给数字人添加“骨肉”,而座舱智能化时代,数字人被给予更多的施展能力的空间。 1.1AIGC:数字人的“点睛之笔” 随着近两年AIGC生成算法和自然语言模型的发展,AIGC已被广泛应用在文字、图像、音频、游戏和代码的生成当中,输出的内容完成度较高,已经能被广泛应用于商业化中。 目前主流的2D仿真数字人主要通过图片或照片完成皮套后,叠加口型和少量动作后结合情感分析和决策机制来呈现。在这一过程中,AIGC技术对于数字人的生成有以下的帮助: 提高了内容创作的效率和便捷性,降低了成本和门槛。 丰富了内容创作的多样性和个性化,满足了用户的不同需求和喜好。 目前,数字人的各种人设和行为皆是团队编辑好的剧本,用户在台前看到的数字人都只是背后运营团队的产出。例如哔哩哔哩上的许多数字人UP主,“皮套”的背后还是真人在进行配音和互动。去年双十一开始,我们也注意到了有很多淘宝品牌旗舰店用到了数字人主播来进行带货。虽然这些数字人带货主播是AI合成,在动作、嘴型上已无违和感,可以实现7*24小时直播并智能生成播报视频流内容,但互动体验仍较为初级。 图表3:阿里云提供数字人直播SaaS服务 2022年11月,ChatGPT一上线就迅速成为了AI界的“当红炸子鸡”,2月内用户突破1亿,成为历史上用户增长第二快的应用。这主要得益于其强大的语言生成能力和多样的应用场景。ChatGPT不仅能回答各种问题,还能写剧本、写小说、写说明书,甚至给代码纠错。并且在这过程中,它表现出了非常高的“情商”,能进行多轮对话,回复丝滑流畅。 2023年3月2日,OpenAI宣布开放ChatGPT和whisper的API接口。ChatGPT API是一个用于开发者的语言模型接口,它可以让开发者使用GPT 3.5 Turbo模型来生成自然的对话和文本。ChatGPT API的优势是它有持续的模型改进,低廉的价格,和可选的专用容量。 Whisper API是一个用于开发者的语音识别接口,它可以让用户将语音转换为文本。它使用了一个深度神经网络模型,训练在大量的语音数据上,以达到高准确度。Whisper API可以识别多种格式的音频文件,包括mp3,mp4,mpeg,mpga,m4a,wav或webm。 Whisper API的优势是它有极高的速度,方便的按需访问,和合理的价格。这一举措将使得数字人的交互体验向前推进一大步。 图表4:ChatGPT成为历史上用户增长第二快的应用 垂直领域大模型正在向汽车渗透。今年7月31日,吉利汽车集团在内部经营工作大会上透露,吉利将于下半年发布“行业首个全栈自研的全场景AI大模型”,首款AI智能电混家轿“吉利银河L6”也于9月上市。银河L6所搭载的AI车外语音交互技术,可支持车外距离1.5米内,通过语音指令控制车窗、空调、后备箱的开启和关闭,以及自定义趣味语音包和词库,构建车内外无障碍沟通的全新社交场景。新车还将首发吉利地图导航,支持红绿灯倒计时读秒,甚至车内的香氛系统,也可以根据不同场景智能识别释放。 我们认为,在愈发激烈的市场竞争中,AI将是车厂升级智能化、做出差异化的不二选择,2024年汽车垂类AI应用有望爆发。 1.2HUD硬件、边缘计算硬件成熟,数字人拥有“骨肉” 汽车驾驶座舱硬件发展史,就是消费电子产品发展的缩影,从硬件驱动到应用驱动,从本地基础娱乐、导航,到人车物的智能互联。我们将汽车座舱分为4个发展阶段。 1)按钮时代。1924年,雪佛兰生产出第一辆配备收音机的汽车,1941年,凯迪拉克推出配置电动车窗的75系列,1960年代,福特和摩托罗拉将磁带机“搬进”汽车; 2)屏幕时代。本世纪初,随着液晶屏幕应用,可显示内容成为座舱发展的重要一步; 随后软件应用开始蓬勃发展,支持凯立德导航的中控车机成为一时的热门改装方案;是否支持苹果Carplay、百度Carlife是消费者选购车型时的重要考量因素; 3)屏幕互联时代。车机应用进一步发展,车联网(V2X)概念兴起,自动驾驶与智能座舱开始耦合,依靠车载芯片算力的独立车机系统出现; 4)大屏多屏时代。生成式AI进一步赋能人车交互,点亮了车机的灵魂;屏幕更多、尺寸更大,人车交互密度进一步加大;L2、L3高阶自动驾驶方案日趋成熟,自动驾驶与智能座舱进行深度耦合,“智驾”概念越来越近。 二维的触摸屏幕交互潜力正在被开发殆尽,产品设计者开始考虑三维层面的人车交互,这里必须提到两个重要部件: 1)抬头显示器(HeadUpDisplay,HUD)。HUD原本用在战斗机上,以提升飞行员的驾驶效率,飞行员不必频繁低头看仪表就能获得飞行数据,也便于飞行员进行瞄准操作,这一产品逻辑平移到汽车,便成为了替代传统仪表盘的一种新鲜工具,驾驶者不必低头,从视野前方就可以查看车速及导航信息,极大提升驾驶体验。 图表5:大众汽车AR-HUD 全息空中显示(AerialHoloDisplay,AID)通过图像单元生成的信息(数字人、行车信息、导航等)由离轴反射系统经过风挡(也可不经风挡)投射于驾驶员前方。AID利用微结构光场重构技术,把物体离散成高分辨率的空间光斑点阵,通过光的衍射传播、干涉叠加及光场的复振幅调控,将离散的光斑点阵无损地重构在空气中,无需任何介质的散射,即可观测到高保真度的图像,从而实现无介质成像。AID技术的成熟,更是为数字人三维交互提供了优质条件。 图表6:棱镜全息AID方案 2)边缘算力模组。AI飞轮发展滚滚向前,从今年初GPT-3.5惊艳世界,到5月14日OpenAI正式开启插件功能,我们见证了云端大模型的快速迭代与演化。当前时点,AI大模型已经站在了从“玩具”向“工具”快速演化的关键迭代期。如何让大模型渗透进入各类垂直场景,如何更低成本的使用大模型,如何让更多场景与用户接触AI,成为了发展的下一个重点。在AI向实际场景落地时,边缘算力的重要性加速凸显,边缘算力在成本、时延、隐私上具有天然优势,也可以作为桥梁,预处理海量复杂需求,并将其导向大模型。边缘算力作为AI触及万千场景的血管地位加速明晰。之前,边缘侧设备以部署通信能力为主,当下,在以高通为代表的边缘巨头推动下,算力、AI能力等边缘基建正在加速推动,同时三大运营商的算力网络与边缘资源池体系,也为我国算力梯度分布奠定了雏形。展望未来,边缘算力将始于AI带来的需求提升,同时也将赋能应用,连接更多用户,加速AI发展与迭代。 图表7:美格智能基于高通骁龙平台开发的车载智能模组产品 1.3自动驾驶越高阶,人车交互越重要 自动驾驶等级划分,目前被国内外广为接受的是SAE(国际汽车工程学会)分级,从Level-0~Level-5总计6个级别,Level-0为最低级别,Level-5为最高级别。如下图,从无自动化,到“解