您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[亿欧智库]:2022中国汽车行业智能化功能模块系列研究:语音交互篇 - 发现报告
当前位置:首页/行业研究/报告详情/

2022中国汽车行业智能化功能模块系列研究:语音交互篇

交运设备2022-03-21李浩诚亿欧智库机构上传
2022中国汽车行业智能化功能模块系列研究:语音交互篇

亿欧智库https://www.iyiou.com/researchCopyright reserved to EqualOcean Intelligence, March 20222022中国汽车智能化功能模块系列研究-语音交互篇 前言22➢语音交互指的是人与设备通过自然语音进行信息的传递。近年来,随着相关技术的发展与数据的累积,语音交互功能已经在汽车、医疗、金融、教育等多个领域涉及使用。➢随着车联网和人工智能技术的兴起,越来越多的功能被搭载在车机上。层出不穷的功能与日趋复杂的界面对驾驶者在驾驶过程中的注意力进行了争夺。对于当前“人机共驾”阶段,语音交互技术的独特优势得以显现——帮助驾驶者降低对车内设备的手动操作依赖,增加驾驶安全性。➢2021年开始,汽车智能化发展成为当前行业的核心方向。经过长达一年的智能化发展,语音交互功能已成为汽车智能化发展的重要特征。主机厂语音交互业务的发展模式与供应商的软硬实力成为业内最为关注的话题之一。➢语音交互功能已经成为汽车座舱内最具代表性的智能化功能模块之一。亿欧智库作为长期关注汽车领域的研究机构,为了进一步深度洞察中国智能汽车各细分智能化功能模块的技术原理、市场现状以及竞争格局等问题,特此推出“2022中国汽车智能化功能模块系列研究”报告。➢《2022中国汽车智能化功能模块系列研究-语音交互篇》的研究将聚焦于语音交互功能在汽车领域的应用。本报告将对中国语音交互车端应用的技术原理、市场现状、标杆企业等进行全方面的拆解分析,并对当前主流供应商与主机厂的产品进行多维度研究与解读,使行业内外人士可以更直观的了解当下中国语音交互在车端应用的发展进程与市场动态。 mNsMmRrOoPtQmMoMpPoPnN9PcMbRsQrRnPnPkPpPoNfQoMrQ6MpNmMNZtOoMMYnOrQ目录C O N T E N T S语音交互车端应用市场现状与典型案例I.市场发展现状与主要玩家II.主机厂篇III.智能AI科技企业篇IV.互联网科技企业篇V.市场总结语音交互车端应用发展趋势预测I.技术发展趋势II.应用发展趋势III.产品形态趋势语音交互车端应用综述I.语音交互介绍II.语音交互技术解析III.语音交互发展驱动因素IV.语音交互产业链梳理与产业图谱1.2.3. 语音交互车端应用综述 语音交互赋能车载智能终端,成为智能座舱生态构建的核心功能5◆目前,语音交互功能作为汽车座舱智能化的标志性代表,与车内多种应用相结合,成为座舱生态构建的核心功能。◆2011年中国首个智能汽车语音助理概念出现,可实现命令词语音识别的同时,也标志着智能语音交互应用于汽车产业的开始。◆随着语音的智能化发展,语音交互在车端的应用已经度过萌生期与探索期,正处于快速发展的黄金期。阶段一:萌生期阶段二:探索期阶段三:黄金期201120122013201420152016201720182019202020212022—科大讯飞发布第一代智能汽车语音助理,上线命令词语音识别系统国内科大讯飞、虫洞语音智能助手上线微软推出个人助理Cortana,实现语音对话科大讯飞第二代语音助手发布,上线语音唤醒词、语音交互打断技术斑马智行2.0将语音交互从主驾拓展至副驾科大讯飞前装智能网联车机发布,打通车机与车联网功能服务斑马智能1.0搭载荣威RX5,以语音交互的方式连接用户,成为当时业内公认互联网汽车标杆蔚来ES8首次搭载Nomi机器人,使语音交互更加拟人化导航导航到固定地点导航到兴趣点增加途经点音频音乐广播有声读物通讯电话短信车辆基本控制空调天窗雨刷器车辆信息查询油耗胎压生活信息查询新闻/股票/限号天气/机票/酒店车载智能语音交互来源:亿欧智库小鹏发布行业首创全系统功能覆盖,全场景连续对话功能,大大提升语音在车端的使用效率腾讯宣布开发车载微信,加速车内语音与应用结合发展的进程理想携手思必驰,发布车载四音区覆盖语音交互方案长安汽车UNI系列推出首个搭载了多模语音交互方案的量产车型长安UNI-T,语音交互开始由单模向多模交互方式适配 语音交互链条涉及学科广泛,ASR、NLP与TTS成为车端应用关键6◆语音交互所涉及的流程繁琐,涉及到从语言学到声学理论等多方面内容,同时在车端的使用需对特殊驾乘场景进行相应适配。◆在语音交互在车端应用过程中,ASR(包含信号输入、降噪以及音素选取等流程)、NLP(包含NLU与NLG,涉及词性标注与文本信息处理)、TTS(包含语音的后端拼接合成,同时也是语音拟人化核心环节)成为三个关键环节,同样也是当前行业发展仍需深耕的单点技术模块。ASR(语音识别)语音语言学知识信号处理技术数据挖掘技术统计建模方法语音数据库语言数据库训练声学模型语言模型解码识别结果解码降噪特征提取自适应度语音信号4DST对话状态追踪NLU语音理解3ASR语音识别2对话输入与前端处理1NLG语音生成5Policy动作候选排序6TTS语音合成7对话输出8➢接收声音信号转化为音频信号并放大➢声源定位➢降噪去混响➢语音增强➢声源信号提取/分离➢将特征识别为状态,组合成音素(声学模型)➢根据语音表达的特点,选取音素所对应的正确的文字,最终完成由向量转化为文字的过程(语言模型)亿欧智库:车内人机交互实现流程示意图NLP(自然语言处理)NLPNLUNLG分词词性标注句法分析文本分类信息检索信息抽取文字校对理解文本,提取信息表征学习信息提取歧义分解未登录词识别词性歧义消解未知词性识别依存句法分析短语句法分析深层句法分析深层学习句法分析文本表示学习分类信息需求理解资源质量度量结果匹配排序信息检索评价命名实体识别关系抽取事件抽取信息集成机器翻译问答系统自动摘要基于规则基于统计端到端的神经网络问句理解文本信息拾取知识推理抽取式摘要生成式摘要TTS(语音合成)前端语言分析后端声学系统T文本输入文本结构与语种判断文本标准化句读韵律预测文本转因素S拼接合成参数合成端到端合成来源:亿欧智库 辅助驾驶行业、技术与市场等多方因素驱动,语音交互车端应用正处发展黄金期7◆据亿欧智库预测在高级别自动驾驶功能落地前,驾驶员在驾驶过程中依然无法做到完全“解放双手”。在当前的“人机共驾”阶段,语音交互仍然是车内最直接、最人性化、最安全的交互方式。◆随着语音交互技术的成熟,语音识别准确率大幅提升,已为语音交互功能上车提供了技术验证与支持,因此智能AI科技企业开始纷纷加码语音交互在驾乘场景当中的应用与落地。◆汽车用户对于语音交互的需求与兴趣高涨,驱动主机厂在语音交互功能上的智能化与差异化发展。➢在当前L3及以下级别的自动驾驶功能下,驾驶员在驾驶过程中无法解放双手。当前“人机共驾”阶段,“人机交互”则更多需要通过语言来实现;➢L4及以上的高级别自动功能预计将于2025年初现;➢高级别自动驾驶来临前,语音交互仍然是车内最直接、最人性化、最安全的交互方式。➢随着技术端的快速发展,AI语音识别市场得到的快速发展。目前主流语音识别模型已经以深度神经网络为主导,神经网络的出现及普及为语音识别准确率的提升起到了重要作用;➢目前中国主流AI语音识别率已达到98%,逐渐提升的语音识别度也加速语音识别在车端的场景化应用。➢目前中国用户对于智能网联汽车的智能化功能感兴趣程度排名当中,智能语音交互功能已经仅次于辅助驾驶功能,位于第二位;➢汽车用户对于车载智能语音交互的需求不再是单纯的指令操控,而是更具有拟人化、情感化的自然交流。用户需求的提升加速车企在智能语音交互功能上的深耕。34%38%39%40%37%30%9%11%15%20%30%35%1%2%3.5%6%1%202020212022E2023E2024E2025E亿欧智库:中国汽车市场各级别辅助驾驶功能搭载率及预测60%95%98%20112016202156.4%42.9%41.5%39.9%37.2%36.2%智能语音交互OTA智能视觉交互生命体征监测亿欧智库:2021中国汽车消费者智能化功能感兴趣程度来源:亿欧智库亿欧智库:2011-2021中国语音识别准确率变化趋势L1L2L3L4&L5智能抬头显示 语音交互车端应用产业链错综复杂,供需界限趋于模糊8◆中国语音交互车端应用产业链可分为上游:数据/语料/标注供应商、语音芯片/模块供应商、云服务及架构供应商以及车企;中游:语音处理引擎及应用供应商、平台服务与整合供应商;以及下游车企。◆随着语音交品产品智能化与差异化的发展,不同供应商之间,产品与业务也逐渐产生交集,传统自上而下的单一供应关系也逐渐转变为合作与共建关系。车企作为产业链下游与需求方,在自研发展过程中,同样担当了供给方的角色。来源:亿欧智库亿欧智库:中国语音交互车端应用产业链供需关系图➢以“人机交互”为核心,针对多元场景提供丰富的语音技术方案,如降噪、全流程语音交互等;➢既可以为车企提供单点的功能模块,也可以提供整套的一体化解决方案,是产业链中竞争最激烈的一环。智能语音处理引擎及应用供应商➢基于多种场景需求打造云服务器、云平台、云数据库等云端基础架构,为企业提供一站式上云服务;➢主要为以BAT为代表的互联网科技企业。云服务及架构供应商提供数据/语料/标注➢位于语音交互车端应用产业链最上游,提供丰富的场景数据集与语料集,加速AI模型训练;➢提供支持大规模、高效率、多维度的数据处理服务,具体包括数据采集、数据标注。数据/语料/标注供应商➢为AI语音企业或车企提供高性能、强算力的AI智能语音芯片;➢随着软硬件一体化的发展,芯片业务成为部分传统AI语音引擎及应用供应商的分支业务。语音芯片/模块供应商➢为车企提供可集成且具有高定制化的服务平台;➢基于自身平台,与AI语音处理引擎供应商建立战略合作关系,将其单点模块功能嫁接或整合于自身平台上。平台服务与整合供应商➢位于语音交互车端应用产业链最下游,是最终产品的需求方,企业种类众多,同时发展模式与决策也大相径庭;➢当中包括以自研路线为主的造车新势力与采购为主的传统主机厂两类。车企➢头部的造车新势力企业,通常选择自研语音框架的模式,这种模式下,造车新势力除了本身的主机厂的角色外,既包括了一部分技术供应商,又相当于一个系统集成商;➢从产业层面,也为其他新势力主机厂提升用户体验提供了新的合作思路。造车新势力➢传统主机厂通常会考虑到成本因素,选择采购性价比更高的整体解决方案。传统主机厂产业链上游产业链中游产业链下游提供语音芯片/模块部分企业业务分支提供语音芯片/模块战略合作/提供单点模块提供单点模块/整体方案提供平台服务/集成方案提供云服务及架构提供云服务及架构既是产业最下游需求方,同时也是同类企业的供给方 中国语音交互车端应用产业图谱9数据/语料/标注供应商平台服务与整合供应商智能语音处理引擎及应用供应商主机厂云服务及架构供应商语音芯片/模块供应商传统车企造车新势力来源:亿欧智库注:以上为中国语音交互车端应用产业链当中的代表性企业◆智能语音处理引擎及应用供应商位于产业链中游,作为上游的需求方,业务范围逐渐向上延展;作为下游的供应方,合作模式逐渐向下深入。随着产业链中游企业的业务发展向上延展与向下深入,产业链上中下游的边界趋于模糊,产业竞争结构正在发生重组。 语音交互车端应用市场现状与典型案例 语音交互车端应用市场持续增长,语音交互功能已成汽车座舱标配11◆语音交互车端应用市场正在呈现出多元化的发展趋势,本地+云端、ASR、NLP、TTS、多元化内容及服务生态都在持续快速升级。经亿欧智库测算,2021年中国语音交互车端应用的市场规模为22.2亿元,2022年预计可以到达25.1亿元,2019年-2022年复合增长率达到20.8%。◆2021年中国新发布乘用车当中,语音交互功能在座舱内的渗透率已经位于第4位,高达86%。显然,语音交互功能已经成为中国乘用汽车座舱内的标配功能。11.8 16.9 22.2 25.1 2019202020212022E56.3%72.2%72.6%81.3%85.8%86.0%91.8%92.5%97.9%远程启动手机互联智能座椅车联网智能后视镜语音交互智能方向盘可触控中控屏中控