虚拟人助力内容生产
虚拟人的需求机会
- 三大需求场景:降本增效、体验升级、情感陪伴、另一个身份
- 视频时代虚拟人需求增长:2016年开始视频需求增长,2019年多语种虚拟主播发布
科大讯飞相关技术介绍
- 讯飞语音合成技术发展道路:
- 人工智能发展史上的里程碑:首个语音及语言信息处理国家工程实验室、首批国家新一代人工智能开放创新平台、首个认知智能国家重点实验室等
- 技术里程碑:
- 2008年:语音合成首次超过普通人说话水平
- 2012年:语音评测首次超过人类专家水平
- 2015年:语音识别首次超过人类速记员
- 2017年:智医助理机器人首次通过国家执业医师资格考试,超过96.3%的人类考生
- 2018年:机器翻译中英语音翻译首次达到CATTI全国翻译专业资格(水平)考试二级合格标准
- 2019年:机器阅读理解SQuAD2.0机器阅读理权威测评全球首次超过人类平均水平
- 2020年:因材施教夺得NeurIPS教育挑战赛多项任务冠军
- 2021年:AI虚拟人发布业界首个虚拟人交互平台,多语言理解与跨语言迁移在世界权威多语言理解评测XTREME中刷新世界纪录
- 讯飞语音合成技术发展道路:
- 大语料库拼接技术:中文通用合成自然度4.0MOS(2006)
- 参数语音合成技术:BC比赛首夺冠,英文自然度3.5MOS(2012)
- 超大规模拼接技术:小说合成实用化自然度4.2MOS(2016)
- 深度学习技术:引入配音合成实用化自然度4.3MOS(2018)
- 端到端合成技术:口语化合成实用化自然度首超4.5MOS(2019)
- 音色转换技术:VCC比赛首夺冠,相似度超4.0MOS(2019)
- 语音合成的应用场景:新闻播报、出行导航、有声阅读、电话客服、智能硬件
- 从“声音”到“形象”:
- 1984年自然度3.0分:乔丹参加1984年奥运会时的球衣号码
- 2019年自然度4.5分:AI虚拟主播小晴
- AI虚拟人逐渐成长:
- 2D真人 → 2D捏脸真人 → 3D卡通 → 3D美型
- 虚拟数字人定义:具有数字化外形的虚拟人物,依赖显示设备存在,具备人的外观、行为和思想
- AI虚拟人的效果演示:
- AI虚拟人交互平台:
- 关键特点:多模感知、情感贯穿、多维表达、自主定制
- 平台属性:多元化,开放更多能力合作,共建平台生态
应用落地分享
- 讯飞配音--一站式智能音视频生产平台:
- 一键输出,快速合成
- 丰富形象,多彩声音
- 智能编辑,高效生产
- 央视《创新中国》:全球第一部人工智能配音的纪录片
- AI虚拟人直播系统:面向直播场景,提供7*24小时不间断的虚拟人直播服务
- AI虚拟人交互一体机:面向金融、企业、政务、文旅等公共场景,提供24小时业务咨询、产品展示等服务
- AI虚拟人行业应用:
- 新华社媒体应用
- 虚拟客服
- 虚拟人爱加演唱冬奥《为沟通破冰》主题曲
- 2022年冬奥AI小助手
- AI个性化学习英语教学应用
- 线上VR导游
- 已在媒体、金融、企业、文旅、教育等各行业成功落地
未来的挑战