热门搜索：

品牌跟踪中的响应质量

商贸零售2024-05-16YouGov阿***

在品牌跟踪中提高响应质量：使用感知交叉熵检测响应异常道格拉斯河and迪莉娅 · 贝利1.Introduction品牌跟踪的目的是衡量消费者对品牌态度的变化，并了解这些变化的原因。数据质量问题是持续关注跟踪研究。样本组成的变化可能会影响品牌指标的长期比较。调查农场和机器人增加的活动威胁到数据完整性。而下降的受访者参与度可能会给跟踪数据增加大量噪音。在本白皮书中，我们报告了 YouGov 去年为提高数据质量而采取的措施BrandIndex 。 BrandIndex 是一项每日品牌跟踪调查，基于每天在 YouGov 的面板上进行的超过 25, 000 次访谈。市场研究面板中的数据质量问题已被广泛报道去年。在过去， YouGov 大多不受这些问题的影响。所有 BrandIndex 数据都是从 YouGov 小组成员那里收集的。我们不使用路由器。我们不要求小组成员提供筛选信息，并承诺为符合研究资格提供高额奖励。总的来说，我们更依赖长期受访者参与，而不是短期激励。尽管如此，我们也不能幸免于困扰研究行业的问题。我们密切监控数据完整性，并加强了控制。这意味着由于可疑数据完整性，从我们的小组中删除了比过去更多的小组成员。我们使用标准注意力检查来检测受访者的注意力不集中。我们描述了这些措施，并讨论了它们对 BrandIndex 中数据的影响。我们的主要重点是响应质量，特别是提高品牌知名度衡量的创新 - 这是品牌漏斗顶部的关键指标。如果品牌知名度被错误衡量，那么漏斗中所有其他较低的指标都会受到损害。这种称为感知交叉熵（ ACE ）的新方法直接检测响应异常。相比之下，传统的响应质量方法是间接的，并不基于跟踪指标本身的答案。这是一个重要的区别，因为许多受访者发现跟踪指标回答起来很乏味，并且与其他类型的问题相比，他们可能更容易受到较差的响应质量的影响。The plan of the paper is as follows. Section 2 provides a definition of response quality. Section 3 provides detailed data over time and across geographies of theirfrequency and magnitude. Section 4 then describe the ideas behind ACE and how it is computed. We provide data demonstrating the validity of the ACE approach用于衡量响应质量及其对 BrandIndex 中品牌度量的影响。本节总结了 ACE 和其他数据质量度量对样本量和样本组成的影响的详细数据。最后一节提供了结论和一些一般性讨论。 2.数据质量的含义数据质量是一个多方面的概念，对不同的人来说可能意味着完全不同的事情。特别是，我们专注于对品牌跟踪研究很重要的三个关键要素：代表性, 完整性, and准确度每个概念都涉及一个基本问题，必须对其进行肯定的回答才能进行有效的研究：•样本代表我们正在研究的人群吗？代表性是调查研究最古老和最基本的问题。做调查的目的是描述目标人群，如果样本没有代表性，其他都不重要。•Are the respondents who they say they are? If respondents are not being trufthful about who they are, a seeming representative sample is not what it claims to be. The threat to respondent integrity has become an increasing problems for随着调查农场和机器人的兴起，该行业的受访者歪曲了他们的居住地，他们的人口统计数据，他们是否使用特定的产品，或者是否有资格参加研究，已经成为一个严重的数据质量问题。•他们的答案准确吗？在这里，我们不是指欺诈，而是指通过以下方式回答问题的关心和参与程度诚实的受访者。自我报告的受访者特征并不总是可靠的。大多数人不知道他们去年的家庭收入或可投资资产的价值，但他们的答案通常是合适的，因为调查研究不是一门精确的科学。对于品牌跟踪来说，特别有问题的是受访者，他们会偏离直线或停止关注所询问的内容。这就是注意力不集中的问题。有时很难区分受访者的疏忽和欺诈，因为它们表现在类似的方式：不可靠和不准确的数据。 YouGov 在过去一年中显著提升了其受访者的诚信措施。我们在下面描述了这些措施，但我们在这里的重点是消除我们品牌跟踪调查中脱离的受访者。3.响应质量的测量YouGov 使用各种措施来确保 BrandIndex 中收集的数据的代表性，完整性和准确性。没有单一的措施可以捕获数据质量的所有方面，也没有任何单一的措施本身就足够了。相反，我们使用以下指标的组合：•Paradata•响应速度•注意检查•一致性检查•入射检查•与开放式的接合2023 年， YouGov 引入了响应质量调查，以大大增加可用于检测数据质量问题的预测因子的数量。在机器学习分类器中总共使用了 600 多个预测因子来创建响应质量评分 (RQS) 。我们使用 RQS 来确定哪些小组成员不可靠以及哪些数据应该被丢弃。本节的剩余部分提供了这些方法的一些解释和有关其性能的数据。 3.1.ParadataParadata 是指与调查过程相关的数据，而不是答案本身的内容（ Kreuter （ 2013 ）。在网络调查中，调查过程会生成大量的测量结果，这些测量结果有助于识别注意力不集中（ Callegaro 2013 和 Olson and Parkhurst 2013 ），尤其是欺诈活动。使用受访者浏览器中的数据（如 Cooie 、 IP 地址和地理位置）和设备（如操作系统和设备硬件特征）以及网络设置，可以创建数字指纹以唯一识别受访者。这在跟踪尝试创建多个帐户并提交重复响应的受访者时特别有用。使用 VPN 可以规避其中一些指标，因此除非其他指标非常积极，否则我们不会从使用 VPN 的受访者那里收集数据。来自专门跟踪在线市场研究，广告技术和在线零售行业的欺诈行为的服务的其他数据用于识别不良行为者。YouGov 在注册时检查 paradata ，不允许任何被认为有欺诈高风险的人参加其小组。在注册后的每个后续调查开始时，也会检查 paradata 。评估为中等风险的小组成员会被送往响应质量调查，稍后描述。Table 1 summarizes paradata collected from panelist in 2023. We describe each type of paradata used and their frequencies next.仿真器报告与实际使用的软件或硬件特性不同。仿真器有一些合法用途（例如Procedre，用于跨平台开发，以及使用与当前硬件不兼容的旧软件应用程序，尤其是游戏），但这些用途很少见。模拟器被认为被 “调查农场 ” 用来避免机器指纹识别，这将允许同一用户创建多个帐户而无需检测。在香港以外（下面讨论），我们检测到很少的仿真器。可靠地检测仿真器是困难的, 并且这些估计可能包含一些误报。子网用于组织网络内部的路由。它们也可以用来避免检测到重复的 IP地址，这就是为什么它们是对调查者产生怀疑的原因。除了印度尼西亚 (在印度尼西亚检测到 7.9% 的注册者使用来自同一网络的不同子网的 IP地址) ，这种情况似乎非常罕见。已知的欺诈者是与欺诈相关的第三方服务（主要用于广告技术和电子商务）收集的电子邮件和域名列表。这是美国 (5.6%) ，名单维护得更好。同样，几乎所有地方的频率都很低。重复设备使用设备指纹检测。这变得不如过去有效。 (苹果已限制使用其 API 用于这些目的。) 通过这种方式检测到的虚假账户比例在 1% 到 5% 之间，具体取决于国家。VPN（虚拟专用网络）是当今大多数上班族所熟悉的，但它们也可以用来掩饰用户的位置。 Tor 是一种防止跟踪和指纹的浏览器。两者都有合法用户，但很少被 YouGov 小组成员使用。履带活动是另一个潜在的标志，但不超过任何国家的小组成员的 0.1 ％。There were substantial problems detected in Hong Kong, where nearly a quarter of the respondents appear to be using emulators and an additional 5% failure device fingerprinting. We have also detected more abrasions in BrandIndex tracking metrics in Hongserious concerns about survey integrity, resulting in higher removal rates from panelists and back data than in other markets. See section 4.5 below for more details. 表 1 ：按国家 / 地区检测到的 ParadataCountry无可疑活动模拟器活动子网活动互联网欺诈者重复的设备指纹VPN /代理 / Tor履带活动埃及95.5%2.9%0.1%0.2%1.2%< 0.1%< 0.1%阿联酋94.2%1.6%0.3%0.8%2.9%0.3%< 0.1%UK93.9%1.1%1.5%1.2%2.1%0.1%< 0.1%沙特阿拉伯93.8%1.8%0.3%< 0.1%3.1%1.0%0.0%挪威92.4%2.0%0.5%2.6%2.4%0.2%0.0%澳大利亚92.0%1.7%0.5%4.1%1.7%< 0.1%< 0.1%印度91.5%5.8%0.9%0.5%1.1%< 0.1%< 0.1%US90.2%1.8%0.3%5.6%1.5%0.6%< 0.1%丹麦89.7%1.9%2.3%4.0%2.1%< 0.1%< 0.1%爱尔兰88.5%4.3%3.3%1.1%2.9%< 0.1%0.0%印度尼西亚84.8%0.9%7.9%1.7%4.2%0.4%< 0.1%香港66.5%26.6%0.5%1.2%5.1%< 0.1%< 0.1%3.2.超速现在，大多数调查组织都使用速度检查来淘汰回答调查太快的小组成员。这样做的理由是，这些小组成员要么没有参与，要么可能是机器人。非常快的速度清楚地表明缺乏参与，但缓慢的反应并不一定表明相反。阅读速度差异很大，因此一个人的阅读速度可能非常快，另一个人的阅读速度可能会很慢。调查的长度不同，同一调查中的分支意味着同一调查对于不同的调查将具有不同的长度回答者。因此，需要注意避免因实施速度限制而造成样本偏差。对于 BrandIndex ，我们根据绝对标准，使用特定调查中问题的实际数量及其复杂性来定义最小可接受时间。这允许对超速人数进行有效的时间比较。2023 年，由于超速，从 BrandIndex 样本中删除的小组成员数量显着增加。（请参见下面的图 1 。）在 2020 年的大部分时间里，由于超速而删除了不到 2 ％的 BrandIndex 样本，但这一比率已上升到今天的 6 ％以上。这是指出在此期间参与问题增加的许多指标之一。没有实质性的此调查长度的变化，因此上升代表了小组组成或现有小组成员行为或两者的变化。 Bra

点击免费查看完整报告