您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[搜狗]:华为《全场景智能联接解决方案白皮书》 - 发现报告
当前位置:首页/行业研究/报告详情/

华为《全场景智能联接解决方案白皮书》

信息技术2022-04-08-搜狗.***
华为《全场景智能联接解决方案白皮书》

人人可输入——众声无障碍输入白皮书—— 第一部分 信息无障碍与无障碍输入法一、 信息无障碍是障碍人群在数字时代获得有质量生活的关键要素二、 信息输入及输出形式的多元化成为障碍人士获取信息的机遇与挑战三、 输入法是打开信息无障碍的第一把的钥匙第二部分 障碍群体多元的输入法需求与无障碍解决方案一、视力障碍人士二、听力障碍人士三、肢体障碍人士四、老年群体第三部分 无障碍输入的广度、精度与深度一、 无障碍输入的广度二、 无障碍输入的精度三、 无障碍输入的深度第四部分 数字时代无障碍输入的新范式一、 无障碍输入的共识原则二、 共建无障碍的良性生态三、 “人人可输入”的无障碍愿景参考资料目录《众声无障碍输入白皮书》1 概述:随着科技信息化智能化水平的提高,人机关系也发生了重大变化。在人机交互的过程中,人们获取信息的第一个动作是输入。作为数字时代输入的重要工具——输入法,是否符合无障碍的设计要求就显得尤其重要。本报告首先呈现了信息无障碍、无障碍输入在信息化时代的重要性,接着分析了视力障碍、听力障碍、肢体障碍、老年人这四类障碍群体的多元输入法需求与无障碍解决方案。然后基于腾讯搜狗输入法的实践经验,探讨了无障碍输入的广度、精度与深度。最后,针对现状提出数字时代下无障碍输入的新范式。 2《众声无障碍输入白皮书》 第一部分 信息无障碍与无障碍输入法 3《众声无障碍输入白皮书》一、信息无障碍是障碍人群在数字时代获得有质量生活的关键要素“信息无障碍是指无论健全人还是残疾人、无论年轻人还是老年人都能从信息技术中获益,任何人在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。”—— 2020,《工业和信息化部中国和残疾人联合会关于推进信息无障碍的指导意见》信息无障碍这一概念是舶来品,其内涵在国内最早于2001年发布的《中国残障人士事业“十五”计划纲要(2001年-2005年)》中出现。“研制、推广适合盲人、聋人使用的通讯设备”成为“发展信息和交流无障碍”方向和举措之一。经过二十余年的发展,中国的信息无障碍建设已经成为一种适用对象非常广泛的物理公共环境建设和虚拟社会建设的一部分,致力于缩小各类残障人士面临的障碍、老年群体及普通人士面临的多样信息情景障碍,实现数字包容。依据工信部等发布的文件对信息无障碍的定义可知,从技术角度看,信息无障碍包含两方面的含义:一是信息领域自身技术、硬件设备/设施、软件服务的无障碍化;二是信息领域与建筑、交通等其他无障碍建设的融合。二、信息输入及输出形式的多元化成为障碍人士获取信息的机遇与挑战信息无障碍的本质是通过设置多元的信息输入输出格式和交互方式以满足不同人群的使用习惯和个性化需求。数字时代,编码解码过程为视觉、听觉、触觉等不同感官信 息的转换提供了可能性和便利性。文字、图片、语音、震动等不同信息,在输入与输出之间的准确转化和效率提升对不同人群过上有质量的数字生活来说十分重要。信息通信技术的发展也为信息无障碍落实在具体产品、应用场景、和各类服务带来了巨大的潜力。多元的信息输入方式,为障碍人士获得有尊严的、有质量的数字生活,进一步融入现实社会提供了前所未有的机遇。在信息化程度不断提高的背景下,障碍人士面临较为严峻的“数字鸿沟”;如何通过互联网、移动互联网等的信息环境,向障碍人士提供机会均等的无障碍信息技术、产品和服务,正在成为社会关注的热点。三、输入法是打开信息无障碍的第一把的钥匙随着科技信息化智能化水平的提高,人机关系也发生了重大变化。在人机交互的过程中,人们获取信息的第一个动作是输入。作为数字时代输入的重要工具——输入法,是否符合无障碍的设计要求就显得尤其重要。输入法是用户打开数字世界的钥匙,与数字世界交互的媒介,其无障碍程度决定了用户与信息通信技术软硬件的交互质量及便捷程度。信息化的发展推动了输入法角色的变化,从PC互联网发展到移动互联网,再到万物互联时代,输入法从办公学习工具,逐渐发展为社交、生活必备工具,应运而生的多样化的输入方式(如文字、语音、图像等输入方式)使其成为人与机器交互的一个重要窗口。4《众声无障碍输入白皮书》 但是面对信息化的高速发展,障碍群体对于信息获取方式的可选择、可替代空间越来越小,这就要求输入法作为“交互窗口”需要照顾到各类,兼顾多类障碍群体需求,实现从广度、精度与深度上的“无障碍输入”。5《众声无障碍输入白皮书》 第二部分 障碍群体多元的输入法需求与无障碍解决方案 腾讯搜狗输入法一直是“无障碍输入”的践行者。在为障碍人群提供便利程度的变化上,从视力障碍群体逐步发展为涵盖多种障碍人群,如听力障碍人士、肢体障碍人士、老年群体等特殊群体。此外,腾讯搜狗输入法也积极在技术上不断突破,尝试深度解决各类障碍群体在无障碍输入时的困境,满足障碍群体的需求。在本章节会基于腾讯搜狗输入法的实践经验,探讨障碍群体多元的输入法需求与腾讯搜狗输入法对应的无障碍解决方案。一、视力障碍人士1.视力障碍人士的现状目前中国有超1700万的视障人士。视力障碍又称视力残疾,或视觉损伤,是指由于各种原因导致双眼视力障碍或视野缩小,从而难以做到一般人所能从事的工作、学习或其他活动。视力残疾包括全盲(一级盲和二级盲)和低视力(一级低视力和二级低视力)。人类在生活中约有85%以上的信息是通过视觉获取的。在当今的互联网信息传播中,同样偏重于信息的视觉传递方式,其功能也主要是面向健全用户和普通的交互环境,从而导致部分视觉障碍用户在使用互联网产品时感到十分困难。根据2021年《中国数字包容用户调研报告》数据显示,视障人士的手机日均使用时长为5.7个小时;手机使用的TOP5场景为社交聊天、接打电话、购物支付、音乐和新闻阅读;手机APP使用TOP5为微信、QQ、支付宝、淘宝、京东等。在无障碍功能中,6《众声无障碍输入白皮书》 读屏功能是视障用户目前满意度以及提及率最高的功能。视障用户认为物品识别、图片描述、环境播报和纯净无广告等几项功能的重要性排序高,但对应的满意度较低;他们期望智能设备和互联网应用厂商针对上述几项功能进行重点优化。此外,视障人士认为交通出行、疫情防控、在线学习等场景或功能的重要性高,但同时这些也是他们难以独立完成的主要场景或功能,希望这些产品也能得到重点优化。2. 视力障碍人士的输入法需求及具体场景在手机主要的核心使用场景中,视障人士认为文字输入场景是最核心场景之一,但受教育水平(拼音识字基础)、读屏软件与输入键盘兼容性等原因的影响,视障人士在使用拼音(双拼为主)的输入方式打字效率较低。而语音输入能够大幅减少手动摸索键盘所用时间,降低操作成本,为视障人群建立一座通往互联网世界的“无障”桥梁。基础无障碍设计的重点是与视障用户使用的读屏软件(屏幕阅读器)进行适配,使其可以阅读和说出屏幕上显示的文本、图像和按钮。同时,网站所有操作需设置键盘支持导航、信息内容可以被屏幕阅读器识别。如:Emoji表情适配语音播报,表达文字之外的情绪;打字面板、功能面板的操作震动反馈,同时拥有语音提示等。目前面向视障人士的无障碍输入的解决方案主要聚焦在两个方面:一是提升读屏软件与输入键盘的兼容性,保证视障人士可顺畅完成基础打字需求;二是提升语音识别及控制能力,如精准的语音识别能力(含方言识别),以及创新语音指令功能。但目前输入法的无障碍优化力度仍未完全满足视障人士的使用需求,仍存在着比较突出的无障碍基础问题,如无障碍优化并未覆盖全部功能,除语音输入和文字输入等主7《众声无障碍输入白皮书》 流功能之外的其他功能并未完全支持无障碍;又如读屏软件无法朗读表情等。除此之外,目前视障输入的无障碍解决方案探索主要聚焦在语音反馈上,缺少其他感官的反馈机制。3. 搜狗视障无障碍输入解决方案为了改善视障用户在输入法中读屏软件兼容问题,提升语音交互精准度,拓展信息获取渠道等方面的用户体验,腾讯搜狗输入法运用领先的智能按键预测技术,通过字符级文本输入纠错,帮助视障者更精准地打字输入。独创自定义手势和上屏方式、进行AI语音功能无障碍适配、探索振动反馈技术的应用以拓宽信息获取渠道。(1)提升输入法无障碍基础能力,提高与读屏软件的兼容性,目前,PC端腾讯搜狗输入法适配90%以上的主流读屏软件,同时也在不断优化移动端输入法与读屏软件的兼容性;除此之外,腾讯搜狗输入法推出针对视障人群优化无障碍键盘,上线了智能按键预测、自定义上屏方式和候选手势等多个新功能,提升视障群体的输入体验,有效解决了视障用户打字落点不准确的问题,大幅提升了视障群体的输入效率。根据覆盖视障群体的测评数据显示,相比当前其他无障碍输入法的键盘技术,用户输入错误率降低了63%。同时,目前的技术应用能够精确识别视障用户输入的按键,使得视障者在输入速度上提升约12%,实现了毫秒级响应。(2)加强语音交互的精准度,目前腾讯搜狗输入法在AI语音功能方面,也专门进行了无障碍优化,包括10种方言9种外语,现已全方位进行无障碍适配,随时随地说话即可上屏。8《众声无障碍输入白皮书》 (3)解决视障用户与信息产品交互反馈单一问题:为突破目前视障输入交互反馈依赖语音、产品交互效率和准确性一般、隐私无法保障等一系列问题。腾讯搜狗输入法联合触觉反馈技术团队探索在输入法场景下增加振动反馈机制,通过振动反馈辅助视障用户获取信息。在用户不便使用声音反馈时,仍能通过清晰的触觉反馈完善产品使用体验。通过多样性的反馈效果,提升用户的输入效率和准确度,并有效保护用户隐私。二、听力障碍人士1.听力障碍人士的现状根据世界卫生组织估计,全球约有 3.6 亿听力障碍者。2012年,我国官方统计的非衰老带来的听力障碍人群数为 2700 万;2017 年估算中国听力障碍人士已达 7200 万(含老年性耳聋)。听障用户与他人常用的沟通方式以文字、口语为主。通过长期观察听障群体及结合现有调研数据可发现,听障人士与他人(主要为健全人)的交流方式以口语及文字为主,占听障群体近6成;听障人士中的手语表达者仅占约3成 ,其中,自然手语是听障人群最主要的手语使用形式。因此,并非所有听障人士都使用手语,口语也是不能忽视的交流形式。辅助工具以助听器为主。在辅助工具的使用情况上,6 成左右的听障用户表示会在日常使用助听器,其他使用较多的辅助工具主要是在智能设备上使用,包括字幕转换工具和实时语音转换工具。9《众声无障碍输入白皮书》 2. 听力障碍人士在使用输入法时的需求及具体场景听障人士在日常工作生活中的需求与痛点具有较强的同质性,核心痛点在于声音的获取和理解上,主要表现在与人面对面的沟通困难、使用设备获取声音的困难、以及对环境音感知的困难这三方面。基于此,听障人士在使用输入法过程中的困难也主要集中在如何通过输入法这一工具在数字世界实现有效地输入及输出信息。如完整、清晰地获取语音信息,包括直播、无字幕视频、线上会议、聊天语音信息等;以及顺畅地输出信息,含文字、语音信息的输出。目前业界主要通过语音转文字(ASR)和文字转语音(TTS)技术的结合,为听障人士在声音信息的获取与传递方向提供了较为丰富的解决方案,解决听障人士“听”“说”不畅的问题。但这项技术在应用层仍存在未能满足听障人士需求的地方,听障人士在输入效率、输入准确率、输入体验等方面仍有一些困境未得到有效解决,如下:第一重困境是语音与文字互转的效率困境。文字转语音非常慢,影响沟通。比如就医场景,可以明白医生在说什么,与医生交流时就病情情况想去多问几句,但因打字过慢缘故容易被敷衍或催促。AI字幕通话时,通话方可能因为没有耐心等待而挂掉电话。综上所述,可以考虑在输入法中结合不同场景,内置一些快捷回复。第二重困境是语音文字互转的准确率困境。语音转文字,受限于距离,环境噪音等因素,在准确度和速度上仍需提升。第三重困境是语音文字互转功能与输入法之间产品切换的体验问题。听障人士在日常10《众声无障碍输入白皮书》 使用场景中,较多使用语音及文字互转功能,来实现沟通交流。通常语音转文字是一个产品,文字转语音是另一个产品,输入法又是第三个产品,三者之间未能有效结合,需要来回切换,影响使用体验及使用效率。3. 腾讯搜狗输入法的听障无障碍输入