您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [yasna.ai]:对话式研究:其机制及其重要性 - 发现报告

对话式研究:其机制及其重要性

信息技术 2024-05-27 - yasna.ai 付瑶瑶瑶瑶瑶瑶瑶瑶瑶瑶瑶瑶瑶
报告封面

它的机制及其意义 引言 3 参与12名受访者的互动超越硬技能11数据质量 16数量维度19文本聊天是否足够好?15技术规避妥协的基础 4对话调查。硬技能5应用领域 20 介绍 想象一下,你正在为一个小团体组织一次旅行,你的任务是制定一个能让每个人都感到开心的行程。在这种情况下,你会如何揭示每个人的偏好和愿望呢?很可能会通过展开非正式的交谈,要么与他们单独交谈,要么协助小组讨论。换句话说,你会采取定性的方法。在只有10个人可供交谈的情况下,您不太可能部署一项全面的用户与市场研究或概念测试。 然而,如果您的任务涉及为一个拥有200名员工的公司的团队建设活动进行协调,您的策略可能需要转向更加定量方法 这里的要点是,虽然我们天生的偏好倾向于与人类进行对话,但扩大这种参与迫使我们必须采用更结构化的沟通方式,如投票或调查。 这本质上是双方——提问者和回答者——的妥协。在与数百人在合理的时间和精力范围内进行交流的物理不现实性推动着我们转向使用正式工具。它使我们能够扩大规模,但代价是更深层次的理解。 技术基础绕过妥协 不久前,ChatGPT展示了在大型语言模型(LLMs)开发方面取得的重大进展。它擅长遵循指令、回答涵盖广泛主题的问题、撰写类似人类的文本、推理和总结。 尽管这项技术尚未达到通用人工智能的水平,但它已经在各种实用商业应用中证明了自己的价值。例如,客户支持聊天机器人正在迅速变得聪明,在未来几年内,我们可能很难将它们与真人区分开来。其他许多界面也可能经历剧烈的演变,倾向于自然语言处理,并逐渐摆脱传统的基于查询的搜索、列表、排序和筛选。 LLMs现在正在利用人类最强大的工具——语言的能量。这让我们想到,这项技术将颠覆我们生活的许多领域,包括消费者洞察在内。 大型语言模型(LLMs)机器学习模型通过在大规模文本语料库上进行训练,以预测和生成基于接收到的输入的连贯文本。大型语言模型(LLM)利用其从预训练中学到的知识来理解提供的文本输入并生成相关且连贯的文本补全。它们的能力被用于各种需要自然语言处理(NLP)的应用,如自动完成功能、聊天机器人和内容创作,通过有效利用其对语言语法、语义和上下文的理解。 对话调查。硬技能 我们都知道,标准调查中的开放式问题往往会产生令人失望的结果。反馈通常简短,可能缺乏深度。即使在询问通常更积极响应的群体,如同事、员工或客户时,你所收到的反馈可能态度良好,但不一定深入或有见地。 那个原因很简单——对于我们所有人来说,思考、组织思想并构思一个深思熟虑的回答都很困难,更不用说一个典型的实验参与者了。 这是一个很好的概念——女性,62岁 这次加油之旅将变得有趣和刺激——男性,45岁 它让加油的过程更像是一场游戏,即使在油价上涨的情况下,也能找到节省金钱的方法——女性,30岁 非常吸引我——男性,27岁 开放式问题在量化调查中是很好的补充,但它们不足以更深入地了解消费者。 使加油过程更有趣 - 女性,26岁 极好的增加汽油的方法 - 男性,28岁 不知道 - 男,33岁 这似乎是个有趣的想法——女性,27岁 我想能够赢得东西!——男性,33岁 它让填满汽车这个平凡的任务变得更加愉快——女性,30岁 自动面试代理(AIA)是一款基于研究方法和数据进行训练的人工智能聊天机器人,旨在以类似人类的方式遵循指南提问,以便获取澄清以获得满意的回答。 你不能只通过添加更多开放性问题来解决这个难题。当有些人认为进行访谈研究仅仅是重复像“有趣!还有什么吗?请继续”这样的话语时,专业的研究主持人所做的远远不止于此。他们: 很遗憾,扩大这些有才华的调解员的规模并不容易。这正是自动化发挥作用的地方。随着最近自然语言处理(NLP)的进步,自动化这些任务变得越来越可行。这是我们必须要走的方向。为了跟踪进展,有一个衡量自动化面试代理发展阶段的标准是很有帮助的。 一级:基本探测 这个级别是关于入门的。智能代理经过训练,能够将回复分类为“欺诈”、“无信息”或“良好”等类别。然后,它可以根据初始查询和得到的答案提出1-2个相关后续问题。智能代理严格遵循预设的研究指南,仅在特定指示下进行提问。 二级。问题级别自主性 将等级提升至一级后,此刻代理商拥有更多自由。它不仅仅是提出固定数量的问题。相反,它会检查对主问题的回答是否觉得完整。如果不完整,它会不断挖掘直到满意为止。这意味着它不仅在重复脚本,而且是真诚地寻求全面回答。当然,这也意味着它需要在处理不寻常情况方面做得更好,比如有人更乐意闲聊,甚至在偶尔的调情或恶作剧行为。此外,如果您特别想探索某些观点或细节,您还可以指导代理商在何处集中其挖掘方向。 三级。面试水平自主性 现在,代理商处于主导地位。虽然它从面试指南开始,但更多的是一种参考。根据受访者的氛围,代理商可以像人类面试官一样灵活调整对话。这种灵活性使得聊天感觉更自然,这可以提升受访者的体验,并最终提高你收集的数据质量。 无论您需要什么语言——自然的还是专业的。 与人类不同,AIA可以掌握多种语言。该智能助手能够即时翻译指南内容,并用对方的语言提问。这使得位于总部的管理人员能够在全球范围内收集消费者反馈。 LLMs涵盖了来自不同专业领域的数据,使AIA能够深入理解复杂术语。这对于AI调解员与受访者之间的互动至关重要,从而产生更好的回应。对于管理者来说,优势显而易见——组织此类研究的便捷性(尝试找到一个愿意与IT架构师或职业游戏玩家交谈的调解员)以及可扩展性。 AIA在游戏开发面试中说外语。原始指南是用英语编写的,但受访者选择用中文进行沟通。代理人立即切换到受访者的语言,并成功完成了面试。 超越硬技能 许多人认为——而且很难反驳——质量审核远不止是单纯的硬性面试技巧;它需要人文关怀。尽管很难确切地定义这意味着什么,但根据我们的个人经验,我们知道我们愿意与其他人类进行交流。 然而,我们同样知道,我们中的一些人喜欢在淋浴时唱歌,很多人会跟宠物或甚至是汽车说话。船只都有名字,被称作“她”。在我们社会中,与无生命物体的情感联系和拟人化并非鲜见。 受访者喜欢与对话机器人交流。对AI主播的满意度为55%(排名第一)。对于传统调查来说,这个数字是46%。 我们的研究显示,参与者普遍喜欢人工智能引导的文字聊天调查。他们认为这种体验既有趣又吸引人。 这是首次采用人工智能的此类调查——令人兴奋、新颖,充满现场交流的感觉! 访谈后受访者反馈 更重要的是,许多人似乎真的与AI代理互动,经常沉浸在轻松的闲聊、闲谈以及其他仅限于回答问题的“不必要的”玩耍式互动中。 参与受访者 与年轻人互动可能是一项挑战性的任务,但使用聊天格式与这一数字原生代受众非常契合。互动聊天能让他们保持专注并积极回应,这也是为什么它是一种有效接触这一群体的方式。 代理商通过模仿人类版主的举动来提高互动度:对回复做出反应并显示出对后续消息的兴趣。 坦率的对敏感问题的回答 我们的自动审核员已成功赢得受访者的信任,并营造了一个开放、坦诚沟通的安全空间。 安全性感知源于对机器人客观性和公正性引导对话的信仰。参与者赞赏自动审核员的无评判性,这促进了他们分享个人经历和见解的愿望。 在这个安全的环境中,受访者深入探讨深刻个人化的主题,以可能难以在传统由人引导的互动中达到的透明度,讨论与敏感健康相关的话题。 我们的自动审核员还促进了关于私密话题的讨论,例如性行为和个人卫生相关的问题。 受访者公开谈论性玩具。他们声称与AI调解员聊天的体验很舒适。 一些管理自有AIA的有用策略: 训练代理商应对闲聊、调情和恶作剧。关于代理的AI属性,请保持透明。培训代理人,对受访者的正确回答表示赞赏。训练代理以优雅而坚定地处理不良行为。使代理商的化身成为类人形(但不要太像人类!)。给它起个名字。请详细解释研究的目的以及如何使用研究结果。掌握在提问和话题之间进行流畅自然过渡的技巧。确保对方知道有一个人在阅读并使用这些结果。使用模仿策略,如适当的停顿(代理人在“输入”),情绪反应和反应。 聊文字信息足够了吗? 尽管在组织、招募、激励、降低辍学率以及分析结果方面存在困难,面对面深度访谈和焦点小组仍然是收集定性数据的常用方法。 AIA在可预见的未来不会取代他们。但随着品牌团队对消费者反馈需求的不断涌现,专业人士面临着瓶颈,这减缓了创新的过程。 聊天访谈通过扩大消费者反馈的量来解决这一问题。许多消费者习惯于每天发送数百条短信,因此他们在没有额外不便的自然环境中作出回应。 数据质量 在定性研究中导航数据质量可能很棘手。 没有大样本量,我们不能依赖统计数据来验证。相反,我们必须评估更细微的方面,如适度性和参与者参与度,这些方面往往更具主观性。这种主观性可能导致客户倾向于选择与他们“投缘”的调解员,将良好的化学反应误认为是良好的数据。 然而,我们至少可以尝试在定性研究的评估中引入一定程度的客观性。这种类型的研究本质上是关于发现和构思的,它本应帮助我们挖掘生活的真相、问题(即洞见)和想法。 因此,我们可以从量化这类发现和利用这一指标对比各种研究方法开始。 我们的研究表明,自动化的对话调查在一致性上优于传统的开放式问题调查。例如,在一项最近的研究中,对话方法揭示的独特使用场景数量是标准定量方法的二倍。 棺材形状椅子概念测试 《最后一班》是一款形状独特的办公椅,每天都会让你想起生命的短暂和价值。椅子由天然木材制成,并进行了抛光处理。配有坚固的靠背,以保持正确的坐姿。椅子的两侧还增加了侧面板,可以隔离外界,帮助你集中精力完成重要任务。这款椅子适合在办公室、家中使用,并将突出你的幽默感和风格。也可用于埋葬和火化。 这表明我们提问的方式与我们提出的问题一样重要。将自动面试与由人类调解员进行的面试进行比较是一项正在进行的工作。但我们已经见证了两者之间明显的差异。以前的方法还不错,但自动面试已经上升到了一个新的层次。在提高质量/努力比方面,它们具有巨大的潜力。 其他可能以积极方式影响数据质量的因素: 直接消费者连接。无需任何中介。更有效的欺诈预防。安联保险(AIA)在检测机器人和不积极的参与者方面更胜一筹。更精准的目标受众筛选。 定量维度 自动化使我们能够扩大规模。更大样本的好处: 1. 定量抽样提供具体的数值指标,使人们能够立即评估某一现象的普遍程度。这减少了模糊性,并最大限度地降低了仅凭定性数据得出不准确结论的风险。最后,人们可以放心地应用定性方法来测试(确定想法的潜力)。 2. 在大多数行业中,明显的洞察力可能已经被识别。研究的真正潜力在于不那么明显(不那么普遍)的洞察力。 3. 面试过程具有一定的创新性,但并不完全可靠。由于谈话本身的性质或受访者或主持人的认知偏见,一些关键洞察可能会被忽视。定量方法增加了揭示不明显(因此可能更有价值)的洞察的可能性。 4. 定性研究的受访者样本可能存在偏差。谁愿意花费时间就非传统话题进行长时间访谈呢? 应用领域 两个考虑使用对话式研究的明显原因: 定性效率 您希望从洞察力和创意生成过程中去除无聊、情感挑战极大且成本极高的面试小时。或者,您只是需要进行一项定性研究(用户与市场研究、测试某事、在量化前生成假设、在量化后澄清结果、客户或员工反馈调查……),但预算有限或时间紧迫。您正在进行或希望进行跨国、多语言项目。 {量化维度} 您希望将定量和定性结合在一个瓶子里,并充分摇匀。这会开启全新的视角,并可能导致意想不到且令人兴奋的结果,如下面案例所示: 案例研究:效率 750 深度访谈 商业问题:是什么让广告创意人员兴奋? 实地考察:4天 分析:2天 结果:7组创意成功因素,按商业领域和人口统计数据排名。 结果: • 过去12个月顶级广告商名单。 受访者提到了172个品牌。 受访者不仅回忆起了品牌名称,还回忆起了他们产品的名称。 成功公式 AI 人工智能 大规模和速度下类似人类的消费者对话 规模。具有量化维度的质数据。数百次深度访谈,