您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:计算机行业智能语音赛道:风口已至,全面开花 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业智能语音赛道:风口已至,全面开花

信息技术2021-05-17刘泽晶华西证券天***
计算机行业智能语音赛道:风口已至,全面开花

华西计算机团队2021年5月17日智能语音赛道:风口已至,全面开花请仔细阅读在本报告尾部的重要法律声明仅供机构投资者使用证券研究报告|行业深度研究报告分析师:刘泽晶SAC NO:S1120520020002邮箱:liuzj1@hx168.com.cn联系人:刘忠腾邮箱:liuzt@hx168.com 联系人:孔文彬邮箱:kongwb@hx168.com 主核心推荐逻辑智能语音即声音信息在人机间的交互模拟,为人工智能的核心技术赛道。1980s至今智能语音经历三个阶段发展,2016年开始进入落地期,智能语音助手、智能音箱相继落地,后续多类场景有望加速兑现产业红利。就产品和场景而言,智能语音相关应用正沿2C消费级和2B企业级两大分支渐次绽放。2C 消费级市场,AloT背景下的终端互联是主逻辑,场景包括:1)智慧生活场景(空间达240亿元),如智能手机助手、智能可穿戴等;2)智能家居场景(空间达2400亿元),智能音箱、智能家电等;3)智能驾驶场景(空间达600亿元),如车载语音等;4)智慧办公场景,如翻译机、录音笔等。对消费级市场而言,商业模式多元化与技术落地曲线的加速度是产业红利兑现的关键,具备全链条语音交互技术能力与建立强用户联系的厂商具备最大竞争优势。2B企业级市场,深耕行业Know-How是主逻辑,场景包括:1)智慧教育场景(空间达370亿元;其中学习机空间超过150亿元);2)智慧医疗场景(整体空间超千亿元),如电子语音病例等;3)应用于电信/金融/电商等场景的智能呼叫/客服等。受新冠疫情催化,2B场景受到加速推广,一系列基于AI算法的软硬件设施在抗疫的方方面面发挥巨大作用。后疫情时代,AI行业大概率迎来爆发,实现戴维斯双击。智能语音赛道有望迎头赶上,缩短与机器视觉产业的商用推广差距。首先,新冠疫情对于公共卫生领域非接触应用的强烈需求,促进解决了智能语音行业的商业认知问题。其次,疫情同时促进智能语音行业解决了行业应用的技术验证问题。最后,疫情也在一定程度上缓和了智能语音行业的隐私安全问题。投资建议:疫情催化叠加国内人工智能独角兽集中上市的背景下,看好龙头率先爆发,两类公司站上风口,坚定强推通用平台商科大讯飞,同时专业应用商如云知声、思必驰等也将受益产业红利。风险提示:人工智能支持政策落地不及预期、利润兑现不及预期、新兴AI厂商加速进入,竞争加剧、市场系统性风险1 mNnQmPrPoMqPsNrNtNvMpNaQbPbRpNrRoMqRiNqQqNkPpOzR8OpOqMxNmMoRxNqQtO目录201 智能语音:AI核心赛道,产业成熟红利将至02 消费级市场:巨头抢滩智能生活/家居/车载等场景03 企业级市场:智慧教育全面开花,多场景布局落定04 双重催化:疫情+上市潮驱动双击05 空间、格局及核心玩家梳理,强推龙头科大讯飞06 风险提示 013智能语音行业简介AI核心赛道,产业成熟红利将至 1.1 智能语音:人工智能核心基础技术之一智能语音是人工智能的重要入口,是人工智能三大核心基础技术之一。人工智能是计算机科学领域的最重要的前沿领域,其包含研究、开发用于模拟、延伸和扩展人的智能的理方法、技术及应用系统等,核心的三大基础技术是机器视觉、智能语音和机器学习。其中智能语音占据重要地位,就市场份额而言,2019年智能语音占据我国人工智能22%的份额,仅次于已经实现大规模商用的机器视觉。4资料来源:艾瑞咨询、华西证券研究所智能语音是人工智能行业重要细分市场37%22%16%14%11%机器视觉智能语音自然语言学习基础算法及平台芯片人工智能机器视觉智能语音机器学习智能语音是人工智能三大核心基础技术之一 1.2 智能语音:即声音信息的人机交互定义:智能语音即声音信息在人机间的交互。人类大脑皮层每天处理的信息中,声音信息占20%,是沟通最重要的纽带。人机语音交互流程:声音信号的前端处理、将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波。本质:智能语音/人机对话的本质是对声音特征和文本的分类模拟。人的听觉形成过程:1)外耳中耳将声能转变为机械能;2)内耳再转为生物电信号;3)听觉中枢加工、分析的结果。机器听觉模拟过程:1)麦克风列阵拾音器;2)语音识别;3)语义理解三个环节接力配合,实现声音信号、音频信号、电信号、特征向量、解码为文字理解的过程。5资料来源:iResearch、华西证券研究所人机对话的实现流程& 各环节模拟机制 1.3 时间轴:三阶段发展,当前步入落地期时间轴:经历三阶段发展,智能语音技术于近年步入落地期。1980s-2010为起步期:语音识别开始从孤立词识别系统向大量词汇连续语音识别系统发展;2011-2015为变革期:微软DNN(深度神经网络)的出现使识别错误率第一次大幅降低,降幅约90%,技术与产品开始大发展2016至今为落地期:机器语音识别准确率第一次达到人类水平,约95%,智能语音技术进入落地期,智能语音助手、智能音箱相继落地。6资料来源:iResearch、华西证券研究所智能语音技术发展历程示意图 1.4 现状:进程落后机器视觉,当前爆发期已近机器视觉是国内外AI企业最集中的领域,商业成熟度较高。AI企业的应用技术方向分布来看,机器视觉企业在全球AI企业中占比40%、在国内占比46%;即机器视觉是国内外AI企业最集中的领域。如前文所述,从市场规模来看,国内计算机视觉市场占AI市场的37%,排名第一,也侧面说明国内计算机视觉公司的总体盈利能力较其他AI领域的公司较强,商业成熟度较高。VS机器视觉:同为人工智能重要分支,进程相对落后,也因此具有更大突破空间。当前视频数据主导数据形态,带来信息维度更高、体量、密度更大的数据,因此以图像和视频为主要处理对象的机器视觉要比智能语音(或智能文字辨析)具有更加丰富的应用场景和商业化价值,智能安防成为第一个爆发场景,其他场景也进行了相应的“1到N”复制。相较而言,智能语音的落地进程相对落后,一方面其数据的体量、密度相对有限,另一方面其涉及的声学研究、模式识别研究、通用NLP研究及垂直场景的深度语义理解等还未完全成熟(尤其2016年以前),因此在交互体验、使用效果、场景优化等方面都仍有较大空间。7资料来源:Gartner、ReportLinker、华西证券研究所全球AI企业应用技术方向分布40%13%28%20%机器视觉智能语音自然语言处理基础硬件46%22%19%14%机器视觉智能语音自然语言处理基础硬件中国AI企业应用技术方向分布智能语音与计算机视觉的差异 1.4 现状:进程落后机器视觉,当前爆发期已近智能语音技术逐渐成熟,未来几年市场将维持高速增长。但从近两年来看,机器语音识别准确率进一步提升至98%,端到端语音合成、语音识别开始广泛应用,同时全双工语音交互也开始出现。标志着智能语音技术积累的进一步成熟。根据Gartner发布的2018年AI技术成熟度曲线,当前语音识别已经进入‚实质生产高峰期,意味着语音识别技术已被广泛接受,规模化落地即将开始。此外,像自然语言处理、虚拟助理等相关智能语音技术历经淘洗之后即将落入,泡沫化低谷期,商业模式越来越成熟,也将进一步推动智能语音的落地。根据ReportLinker的预测:到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。8资料来源:Gartner、ReportLinker、公开资料、华西证券研究所语音识别正在进入实质生产高峰期 1.5 爆发路径:数据为王,场景为先算法和计算力瓶颈已突破,数据是产业大发展的最后制约。随着CNN、RNN等算法成熟和GPU对计算能力的提高,现今人工智能所需要面临的是如何使应用深化,从而推动产业变革。因此,在算法、计算力、数据三个要素中,大量的数据,特别是场景化、标签化的数据获得成为重中之重。能否获得场景化的数据,不仅可决定人工智能在行业中的效用力,同样也是将人工智能切实落地,证实其并非资本市场泡沫的根本。数据为王,场景为先,是智能语音乃至整个人工智能行业下阶段发展的主旋律。一方面,强人工智能目前还未成熟,具备基础交互功能的个人消费品和特定场景下的垂直型人工智能深化应用成为方向。另一方面,随着人工智能进入移动互联网时代,由于各类型的终端设备的使用,各个行业数据都呈现指数级的增长,多维度场景化的数据分布使垂直化开发成为可能。从应用角度来看,场景化的数据是驱动下智能语音实现真正商业化落地的关键。9资料来源:公开资料、华西证券研究所人工智能三要素,当前进入数据为王,场景为先阶段算力算法数据人工智能场景 1.6 两大场景分支:2C消费级& 2B企业级10资料来源:iResearch 、华西证券研究所智能语音市场按客户类型可分为消费级市场(2C或2B2C)和企业级市场(2B)。消费级应用:立足于个人日常生活,主要包括了智慧生活、智能家居、智慧办公、智能驾驶等场景,本质上是智能语音技术(以语音助手为代表)对于各类终端的赋能,是AIoT大生态的重要构成。具体产品包括了:智能手机、智能可穿戴、智能音箱、智能家电、翻译机、录音笔、转写TWS耳机、智能车载等。专业级应用:服务于特定场景,如智慧医疗、智慧教育、智慧电信/金融/电商等。相较而言,专业级应用具有更高的垂直属性和know-how壁垒。具体产品包括了智慧课堂、自动审阅、学习机(2C属性)、智慧客户/呼叫等。智能语音领域的各类细分赛道 0211智能语音分支一:2C消费级市场巨头抢滩智能生活/家居/车载等场景 2.1 智慧生活:智能手机开创语音助手先河,引领消费级市场智能手机开创语音助手先河,引领消费级市场。消费级智能语音交互是大众接触智能语音最普遍的渠道,核心逻辑仍是消费级AIoT:根据艾瑞咨询《2020年中国智能物联网(AIoT)白皮书》,消费级AIoT市场规模就已达到1753亿元,在总AIoT市场中占比68%,空间极其广阔。众多人工智能公司(硬件设备厂商&互联网厂商)均瞄准消费级智能交互终端,第一款典型的落地产品就是智能手机语音助手。语音助手落地开启智能语音应用元年:2011年第一款手机语音助手Siri伴随iPhone4S亮相,各大厂商纷纷入局。从2017年下半年开始通过开放语音生态系统进行产业内合作,语音助手可穿戴、家居、车载等领域延伸。12资料来源:iResearch 、华西证券研究所智能语音助手发展历程 2.1 智慧生活:智能手机开创语音助手先河,引领消费级市场智能手机中配置智能语音助手比例提升,预计2023年占比将达90%。根据StrategyAnalytics数据,2018年全球销售的智能手机中就已经有47.7%配置了人工智能语音助手,占比将近一半。当前,智能手机配置AI语音助手已成为整体性趋势,从已有用户的情况来看,智能语音助手用户使用助手频率占比最大的为每周3-4次,表明人们正日益倾向于使用智能语音助手。基于这一趋势,StrategyAnalytics预计,到2023年前,90%的智能手机都将会配置AI语音助手。13资料来源:易观智库、前瞻产业研究院、华西证券研究所智能手机配置语音助手的比例47.4%90.0%0.0%10.0%20.0%30.0%40.0%50.0%60.0%70.0%80.0%90.0%100.0%20182023智能手机语音助手使用频率41.9%15.5%3.5%5.9%33.3%每周3-4次每周1次两周1次每月1次其他 2.2 智慧生活:智能可穿戴空间广阔,智能语音为其天然入口智能可穿戴设备市场空间广阔,智能语音为其天然入口。智能可穿戴设备趋于小屏化、无屏化的特点决定了智能语音将成为其天然入口。伴随中国智能可穿戴设备行业在各垂直领域应用程度的加深,中国智能可穿戴设备行业将持续扩容。沙利文预测,2023年中国智能可穿戴设备行业的市场规模将达到913.