您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:2022年元宇宙产业系列——技术篇(二) 元宇宙底座AI技术之智能语音 - 发现报告
当前位置:首页/行业研究/报告详情/

2022年元宇宙产业系列——技术篇(二) 元宇宙底座AI技术之智能语音

信息技术2022-04-08袁栩聪头豹研究院机构上传
2022年元宇宙产业系列——技术篇(二) 元宇宙底座AI技术之智能语音

头豹元宇宙产业研究报告|2022/022022年元宇宙产业系列叫——技术篇(二)元宇宙底座AI技术之智能语音2022Metaverse IndustriesSeries:MetaverseBaseAlTechnology-lntelligentVoice2022AI技の报告标签:元宇宙、人工智能、智能语音、人机交互撰写人:袁聪、图表。图份等)均系头的研究院达有的高度机密性文件(在报告中另行标明山处老除外)W.若有违区上冰东前建车称之外的其能分大机构,使来损权或湾同其快任何第三方代头豹中究质升质商中治动。,以的新完院无仟间头的研充院 研究报告丨2021/07元宇宙系列:智能语育报告摘要5G+AIoT的快速发展推动万物互联时代的到来元宇审智能语音应用核心诉求大数据、云计算、人工智能等技术赋能智能语音智能语音和自然语言处理技术结合包括计算机视觉技术,中国智能语音市场收入主要来源于语音识和机器学习的人工智能技术措建元宁害交互的技术别产品和语义理解产品,目前语音识别产品销售框架。短期语音技术的发展目标是解决情绪识别、额大于语义理解产品销售额。未来3年,由于智能声纹识别、声源定位与分案及跨地域跨语种实时交音箱等交互类产品市场逐渐饱和,语音识别产品互技术上的部分不足,落建技术框架。未齐元宇审销售额增长速度将放缓,与此同时,医疗、教育,底层技术智能语高的长期需要面临的排战是能否要金融等行业领域市场交互需求释放,语义理解产完关地处理特殊估况、非主流语言、非标准化发音、品的市场份额将快速上升低信号质量情况下的语音识别、合成、处理技术随着人机语音交互体验的持续改善,语音交互逐■智能语音企业的未来发展空间渐从辅助的接入工只转变为重要的信息入口,众多下游应用领域对语音交互具有旺盛需求,智能近年来智能语音商业化产品大规模落地、行业从技语音市场增长空间大术研发阶段向实践应用转型,行业新趋势是融合其他人工智能领境的创新式发展。智能语音技术从解决简单的语句语义理解和转写,逐渐向更广泛的领域拓展、结合知识图谱,让相关技术更有行业关联性,以配合不同行业的需求提供更具体的解决方案头豹9202: Lscd.co 研究报告|2022/02元宇宙系列:智能语育目录CONTENTS行业综述:元宇宙底层支撑智能语音元宇宙智能语音的核心需求是满足用户与用户、用户与机器、系统之间的语义理解、特征识别、语音处理、实时交互需求,近年来语音识别精确度进一步提高,为创造更高质量的元宇宙声音体系提供可能性赛道聚焦:智能语音产业链分析智能语音技术的本质区别逐渐缩小,技术壁垒效应逐渐被削弱,基于技术销售的商业模式难以为继,全产业链布局及生态体系构建将成为语音服务商持续发展的主要途径头豹eww.leadleo.come400-072-5588 研究报告12022/02元宇宙系列:智能语育名词解释API:些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力ASIC:是一种应用于人工智能领域的芯片,较多应用在暂能终端,具有体积更小、能耗更、保座性更强的优势。CRM:招用计辨机自动化分析销售、市场含销、客户服务以及应用等流程的软件案统.ERP:一种主要页向制造行业进行物质资源、资金资源和信息资源集赋一体化管理的企业信息管理系统。LPC:通过在录小二策意义上最小化预测误差来确定前向线性预测需的系数:OA:是一查提供企业行政管理动能的计算机软件票统,PaaS:担服务器平台作为一种服务提供的商业模式。逆过网络进行程序提供的服务称之为SaaS(SoftwareBsa Service),而云计算对代相应的服务要平台或者开发坏境作为服务进行提供就或为了PeS(PltlormasaSrvie)SaaS:它是一种通过Intemet提供款件的模式,厂商将应用款件统一部在白己的服务器上,客户可以根据白己实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并酒过互联网装得厂商提供的服务。人工智能(AI):是研究、开发用于模拟、距伸和扩展人的智能的温论、方法、技术及应用系统的一门新的技术科学,人机协作:指与客户沟通交流的是人工客服,但机器人同时给予人工客服实时协作的智能客服模式+声纹:是用电声学仪器星示的换带高流信息的声液频谱+大数据:大数据(bigdata?,指无法在一定时间范四内用带规款件工具进行浦提、管理利处理的数据变合,是胃要新处理模式才能具有更强的决策力、润察发现力和流梓化能力的海量、高增长率和多样化的信息资产+工单:由一个和多个件业组成的简半维修或制涉计划、上级部门下达任务,下级部门领要任务的依据+自然语言处理:NLP,是一门研究能实现人与计算机之间用白然语言进行有效通信的各和理论和方法的计算机学科+深度学习:是机器学习的分支,是基于立和模拟人脑进行分析的特殊机暨学习模式头豹e www.leadleo.comLeadLepR400-072-5588 01行业综述:元宇宙底层支撑智能语音元宇审智能语音的核心需求是满足用户与用户、用户与机器、系统之问的语义理解、特征识别、语音处理、实时交互需求,近年来语音识别精确度进一步提高,为创造更高质量的元宇宙声音体系提供可能性 研究报告丨2022/02元宇审系列:智能语音元宇宙底层技术支撑—智能语音现阶段智能语音满足元宇宙用户、系统之间在语义理解、特征识别、语音处理、实时交互上的需求,是实现元宇宙人工智能技术框的核心技术元宇宙场景智能语育的需求和挑战核心需求核心排战智能活吾成为人机交互的主要方式,语吉技术可以理解情绪识别:智能讲音可以真正同一发声人在不同心理状态语义理解简单的对后,对简单提出的理解使用去的诉求。包括情销和生理变化会使声产特质发要求作出避解和反读家达,以及给出情续上的反馈生变化,造成理解难度特征识别是元字官语高交互声纹识别:通过听党将征和声甚于不同的通讯设备、环境,特征识别平行应用的基理,包括性别学特征担关产法筛别发声/说话信道等可解注成语膏信号失年龄等个人持质的识别者的特征利身份真包括讲音咨成、讲音删译、请音唤醒、讲音唤随等,除声源定位与分离:在湿合言频中定查和分离不同的发声者当前技术对于强噪声、趣远语育处理了现有游戏、煤体场景,在噪言等,且保持长时间语高分场、强干扰、多治种等场景元宇宙中仍然有真实、富有高的一双性和稳定性下的声音处理还有很多不是情感和特点的音色合成需求智能语膏可义构建两个现实元宇由可以实现跨地块、跨语智能语音还不能完关处理不实时交互世界来自不同位严的人的实种、略领试的实时交流,就需同的发善方式、习實造或的时交流,以及包含人与环境、要智能语产史广泛的学习理解有略路、连续等语言现款、除系统、应用的人机互动语言学利各种学科主流语言:对于方言、口音等也缺少技术支持智能语音技术通过对语音的分所、理解和处埋理,势助系统或设备实现与人之间语音信息的交互,使机器具备白然讲高交流能力:元宇审中讲产技术的主要性进一步凸量,智能讲音和白然语言处理技术结合包括计算机视觉和机学购的人工智能技术措建元宇官交互的技术任架元宇宙暂能语音技术定位网路及运算技术计算机视觉元宇宙支撑技术oT物联网技术机瞻学习人工智能四大领域AI人工智能技术为元宇审用户之间、电子游戏技术人工智能是使机暨实现人的语自然语言处理用户与系统之间的言、行为、患维方式的技术语言语音信息交互交互技术等在元宇宙扩厌人的暂能智能语音提供技术支撑来源:头约研究院头豹ewww.leadleo.comLeadLepe400-072-5588 研究报告丨2022/02元宇宙系列:智能语音中国智能语音行业综述一定义与核心技术分析智能语音是人工智能技术的重要组成部分,其中语音识别、自然语义理解和语音合成是实现智能语音解决方案的核心技术基础,智能语音的本质是实现人机语音交互智能语育技术框架前戏后张(ASR)语当信号特征提取解码器识别结果声学模型语言换型阅典头列中间形式(格尔领谱等)语音合成(TTS)文木特征提取器声学模型声码量讲音语言学特征(NLP)语音识别技术:语告识别技术以语音为研究对象,通过识别与处埋语音信号使计算机自动识别和理解人类口达的讲高:计算机通过讲高识别和理能的过程持人变口述的音信号转变为机器可处理的文本。语音识别系统本质是一种模式识别系统、包括特征提取、模式匹配、参考模式库等三个基本单元,完或语声训练与识别则两大过程。语音合成:本质上是将文本信息按音色、情站等各和声求转化为语高信息的过程、通营包括以下程序,文本预处埋是始中文文本添加韵律信息,将汉字转化为注音厅列,声学模型可以根据前我环处理结果生成声学特征。最终产码落利用前序信息生成语音样本辰终输出声音的清断座和音质由声码器决定,自然语言处理;自然语言处理是通过构建算法使计算机自动分析、表征人类自然语的学科。自然语言处理是计算机埋解和生成自然语言的过程,自然语言处理技术使计算机其有识别、分析、解和生或白然请言文本(包括字、调、司却篇;的能力。白然讲言处理机制涉及白然语言理解和白然语言生成两个流:(1)白然语言理解:计算机理解自然语言文本的思想和意图:(2)自然语言牛成:计算机用然语言文本表述息想利意图,自然语言理露和分所是一个层次化过程,从语音分析、洞法分析、句法分析、语义分析到流用分析层层选进,来源:头约研究院头豹e www.leadleo.comLeadLepe400-072-5588 研究报告丨2022/02元宇宙系列:智能语育中国智能语音行业综述发展演变智能语音行业在核心算法上逐渐突破同时大幅度提升识别准确度。语音分析与合成、电数字数据处理等细分技术领域成中国企业的重点关注对象智能语行业发展历程,1990年至今2011年至今1991-2010年尊法准确率逐步提高,2016年达到人类水平(956),2018主流算法转为低率统计述模1971-1990年开始应用HMM和DMM模型年达到98%LPC和动恋规划的思想被应1950-1970年有初步商业化产品落地用于语音识别,并可以进行贝尔实验室研制第一个能理大量词汇的连续识别解有限英文数字发音和词汇大规模商业化的系统磷燃阶段概率统计建模阶段国慎式和特征分析阶段模版匹配阶段2012年落产识别头部厂商准确率仅为63%,经过三轮算法送代,在2016年讲识别准率首次超蓝人水平(9),同时中固厂商在语音识到技术和白然语言处理技术上不断突破在2018年相关专利审请量达到高峰,其中语分析及合或相关专利申请量增长展为呈著,百度、孕安科技、腾讯等企业持有大量专利。中国语音识别技术领专利申请总量,2010-2019年中国白然话言处理技术领域专利申请总量,2010-2019年单位:[颐]7,749单位:[项]8.0008.0007,4955.9795,0XX36.0005,3544,2983,78945.4.000660'4,0002.0003,1992,0007601.16420107011 20177013 2014 2015 2016 201 7 2018 2D192010 2011 2012 2013 2014 2015 2016 2017 2018 2019来源:头约研究院头豹e www.leadleo.comLeadLepe400-072-5588 点击前往查看点击前往查看研究报告丨2022/02元宇宙系列:智能语育中国智能语音行业综述—市场规模元宇宙智能语音技术将通过语音识别、合成、转写等服务落地,随着消费级智能硬件语音助手等终端进一步扩张市场规模,最终以复合AI人机交互软件实现各领域渗透和增值中国智能语育行业市场规模,2016-2025E智能语育按业务模式市场规模划分,2019-2023E口点击前往香者点击前往香看2020年,/智整竞行业市需提254亿元,资372025年持达对549亿元,C46R为16.68存题语音必互资术实题,欢或下资业用领载对语高交互离求证盛,未来即能语产市空间大。智能语音垂直行业应用主要分为款件、硬件和服务三种智能音识别、合成、转写等软件及SaaS定制化服务已经广泛应用在医疗、致育、改务等多种领域。从规模占比