AI智能总结
真实的人类数据生成和预测真正的创新成功 2023年12月 AUTHORSColin P Ho, PhD穆蒋明 IPSOS视图AI系列 # IPSOSHiAi 我们都是独一无二的人类。作为消费者,我们的决定是复杂的,情绪化的,context, and often insorral. Although人工智能(AI)制造新产品开发比以往更快,更容易之前,现成的通用模型可以歪曲或歪曲消费者的现实。 生成和分析AI的力量 智能(HI)和人工智能(AI)推动创新并带来影响力,为我们的客户提供以人为中心的见解。 在典型的创新过程中,一个想法阶段之后是评估阶段。AI可以在这两个阶段利用: 我们的HI源于我们的专业知识工程、数据科学和我们独特的高质量数据集-嵌入创造力,对我们的人工智能解决方案有好奇心、道德和严谨性,由我们的益普索Facto GenAI平台提供动力。我们的客户受益于更安全的见解,更快,植根于人类环境。 •在构思阶段,分歧者生成AI的能力可以是借力开发新的产品创意。 在本文中,我们讨论了与真实消费者一起训练AI模型数据,以捕获驱动的本质真实的消费者行为,并产生并预测更好的创新。没有与真实的人类联系,即使是最强大的算法是不够的保证创新的成功。 •在评估阶段,收敛分析AI的能力可以用来预测其市场潜力。 让我们释放HI + AI的潜力! AI提供了一个改善速度,以及潜在的,新的成功率创新,以及我们如何做到这一点将决定我们是否成功。在在应用程序中,用于训练AI的数据至关重要。 《新闻周刊》最近一篇文章的标题,“人工智能:21世纪的黄金”Rush,"1完美地抓住了今天的情绪:大像ChatGPT这样的语言模型(LLM)有涡轮-对人工智能产生了兴趣,并激发了成千上万的公司首先将头fi潜入这个领域。 新产品创意更有可能成功如果这两个相在数据中接地反映消费者内在的人类需求和欲望。这些数据需要是永恒的,或者至少是最新的。因为数据是如此核心对于AI,我们首先解释训练数据确定其模型的准确性。 虽然几乎每个行业都已经或正在开始采用人工智能,为新产品提供最佳应用发展尤为明显。以下页面深入研究更好的应用程序 把自我监督学习想象成孩子自己学习语言。作为一个孩子反复接触到言语和文本,她开始识别模式建立连接。 AI模型变得聪明,因为它们可以学习。他们的学习有两种主要形式: 教AI到底要学什么。对于例如,如果我们想教AI认识到积极和消极的社会媒体帖子,我们需要展示AI每个例子。通过这种方式,AI可以学习与积极相关的特征和消极的帖子,并制定决策对新媒体帖子进行分类的协议它从未接触过。 两种学习形式的共同性需要用我们的例子来推动人工智能想让它学习。让AI变得聪明的不是算法,而是提供的例子。 构建AI的过程就像开发幼儿的大脑。通过提供一个孩子丰富的学习机会,孩子变得聪明。如果为孩子提供机会很少,或者更糟糕的是,不正确的信息,孩子的智力会受到限制或有偏见。 像父母一样思考监督学习指导孩子。如果父母想教她的孩子认识狗和猫,父母会给孩子看照片狗和猫。一个人需要提供示例并告诉机器每个例子代表什么。 来源:益普索 简单来说,AI的发展需要数据,并且数据的质量决定了AI模型的质量。 训练数据的质量可以在与我们评估调查数据质量的方式相同。我们查找与手头任务相关的数据,目标人群和产品的代表类别,并及时(即,重新影响时间段我们正在寻找了解)。这是不可能的夸大训练数据的重要性:AI是只有像提供的数据一样聪明。 2.自我监督学习作品不同的。“培训”涉及喂养大型语言模型(LLM)生成预测的文本量。在这种类型的学习,人们不需要勺子喂AI具体是什么应该学习。AI可以改为学习示例中的结构(例如,这个词通常出现在单词“谢谢”,或通常的单词出现在“爱你”一词之前)。与大量的文本和重复曝光,LLM变得非常擅长预测单词是如何结合在一起的。 LLM接受开放培训互联网信息。人们谁在网上发布可能不是代表人口你感兴趣 我们分享三个将被使用的原则整篇论文(见图1). While this框架是专门为训练而开发的产生或评估新产品创意的人工智能,它也可以用来评估任何AI应用程序的训练数据。 消费者对鼻过敏的未满足需求sprays. Consumers were asked to, in their own言语,表达他们的问题,挫折,或鼻过敏喷雾剂的挑战。我们然后使用LLM生成新产品这些数据的想法。优点是清楚当我们比较产生的想法有和没有调查数据(见图4).总体而言,在没有调查数据的情况下产生的想法是通用的,功能性的,完全没有的情感。相比之下,产生的想法调查数据反映了消费者如何真正表达他们的症状(例如,“粘稠的粘液”,“爆耳”)和情绪(例如,“愉快”,“愉快”、“不适”)。 改进LLM的一种方法是引入额外的数据,以避免单独产生想法来自公共培训数据,特别是当目标是解决具体和细粒度的问题消费者需求。取决于业务挑战,这可以使用各种来源,如调查、社交或搜索数据。虽然益普索同时探索多个用于模型训练目的的数据源,以下部分将更仔细地介绍使用相关、代表性和永恒的调查创新数据(参见图3). 网络世界不是一个完整的代表现实世界。在线内容仅由那些在网上活跃的人,只有一定的被认为值得发布的主题。 为了说明人性化AI的优势模型,我们通过捕获进行了试点 LLM的不同能力使它们非常适合创意生成。因为LLM使任何人都有可能通过自然语言与人工智能互动,任何新手用户都可以写一个提示来生成新产品创意(例如,“请生成十个洗衣液的新产品创意“)。 2.LLM不包含不成文的离线世界的现实:在线世界不是一个完整的代表现实世界。在线内容由只有那些在线活跃的人,只有某些被认为值得发布的主题。对于某些旨在解决的任务具体的挑战,如思维,这可能导致知识差距细粒度和真实的消费者知识需要特定领域和在线数据光靠自己是不够的。 通过及时的工程,AI产生的想法通常口齿清晰,发人深省。鉴于用于训练的大量文本LLM,他们在表达想法方面的卓越流利并不奇怪。虽然强大,有三个很好的理由来改善现成的LLM (请参见图2): 3.LLM在时间胶囊中的功能: LLM 可以收集调查数据就在生成新的想法,并且应该对长达一年或更长时间 通常根据滞后的数据进行训练。对于实例,而ChatGPT - 4首次发布在2023年,它对可用数据进行了培训,直到2021年9月(参见图2)。虽然差距在时间上因模型而异,这些差距将随着时间的推移,研究人员的角色是确保模型继续准确地反映fi等消费者的最新现实。 1.LLM从一个巨大的和未知的互联网景观:我们知道法学硕士学习来自公共互联网信息: web页面、Reddit帖子、在线书籍和其他文本来源。我们不知道这些数据是否来源涵盖特定产品或服务兴趣类别。 第二个想法是在没有调查数据的情况下产生的给出了一个奇怪的结果。第一句描述了一种为人们设计的新产品“敏感皮肤”。鉴于鼻过敏喷雾直接喷入鼻子,这很奇怪LLM建议更常见的术语与皮肤或美容产品有关。 用于训练的大量数据LLM可以推动有价值的想法的发现。然而,LLM的黑匣子性质意味着我们不会知道任何关于使用的数据产生想法-包括其来源,代表性,或永恒。因此,LLM可能偶尔会引入一些想法没有意义,即使他们从一个明智的语言视角。 在LLM可用之前,分析AI支持的研究需求。在世界创新,一种可以瞬间实现的AI预测新产品的成功是许诺的土地,许多企业寻求。然而,与LLM不同的是,现成的分析AI模型不可用。因为概念 评估主要是在市场调查中进行的,需要定制的分析AI模型预测创新成功。建立一个成功的分析AI来预测新的产品的成功与那些对于生成式AI:相关性、代表性、和永恒。 我们认为这是因为LLM学习单词通过联想。在英语中,“鼻”和“过敏”两个词经常放在一起,但是“皮肤”和“过敏”这两个词也是如此感觉,收到一个想法并不奇怪参考敏感皮肤。LLM旨在预测下一个单词,可能这样做不准确或者不适当。 从调查数据中产生想法时,数据的来源,收集的时间,LLM使用背后的原因是可见。使用调查数据的优势产生新产品的想法是100%透明度。理解推理AI做出的决策或预测背后可以提供保证的有效性AI回应。 这种方法确实是我们第一次尝试构建一个分析型AI来预测成功新产品。通过向AI模型提供过去成功和不成功的例子来自益普索概念测试的概念描述数据库,我们探索了以前的功能预测市场成功的概念。这是第一个尝试失败。AI模型的准确性下降短,因为它认为有更多比真正成功的概念。 受数据使用的行业的启发训练分析AI是刺激(例如,图片健康皮肤与癌变皮肤),一些研究人员提倡使用以前的将概念作为训练数据进行测试。也就是说,使用成功和不成功的文字说明过去测试过的用于训练AI模型的概念预测新产品创意的成功。这种方法消除了要求消费者对新产品的反应想法,并允许即时预测。 这并不意味着 从公共培训的LLM中产生的想法。 LLM没有调查数据 LLM与调查数据 结合盐溶液的鼻喷雾剂使用抗- infi炎症药物来帮助减少in flination and clear our thick muus. The喷雾也会有一个令人愉快的味道使用起来更愉快。 一种旨在缓解两者的鼻喷雾剂过敏的症状和潜在的过敏的原因。这可以通过使用组合成分的工作减少炎症,清除鼻塞,并防止组胺的释放。 包含组合的鼻喷雾剂桉树和薄荷油提供救济鼻窦压力,头痛,水汪汪的眼睛,耳朵爆裂。喷雾剂还包含抗炎和镇痛特性减少头部的不适和酸痛。 皮肤敏感的人。这个鼻喷雾将由温和的成分制成不太可能引起刺激或过敏reactions. 作为人类,我们评估一个新产品是否价格合理,具有所需的变体,并且满足我们独特情况的需求。在换句话说,在概念数据上训练的模型是我们的思维方式过于简单化。作为结果,使用概念中的信息单打独斗并不能抓住复杂的消费者决策过程也不满足任何我们框架中的标准(请参见图5). 在诊断问题时,我们发现分析型AI模型在过度的简单的方式。AI预测了一个概念当某些好处或短语存在。这个问题消费者不仅仅是对关键词或短语。消费者要多得多比这复杂;消费者对整个命题,而不仅仅是个别元素。 一段时间以来,我们一直在收集消费者对新产品的最高反应来自单一开放式的产品概念概念后立即提出的问题被查看。截至2023年,我们已经积累了大约500万消费者响应来自新的60多个国家和地区的产品概念七大类(人类食品、饮料、health care, homecare, personal care, beauty护理和宠物护理)。 新产品与已经上的不同市场。在某些情况下,一个人可能想要在决定是否尝试之前的更多信息一个新产品。简而言之,消费者的反应新产品的变化可能很大,而且头等反应让我们能够捕捉到这一切。 我们相信人类的直接和内脏反应新产品的想法是固有的相关和训练AI预测创新的理想数据成功。事实上,从我们的人类数据库反应,我们提出了两个意见: 考虑什么时候可能会通过你的头脑你遇到一个新产品。如果一个人回应食物概念,例如,她直接想法可能包括积极和内脏反应,如“美味”和“看起来”诱人的“,或负面的回应,如”看起来恶心”和“糖太多”。此外对积极或消极的回应,一个人可能会怀疑或冷漠因为他们已经知道营销人员的目标是出售。一个人可以评估是否产品的价格在她的预算范围内,如果 •首先,对新产品的反应不会随着时间的变化。人们将继续对新产品声明持怀疑态度,评估产品价格是否为合理,评估他们是否喜欢产品的外观等,现在和在未来。这个永恒的特征意味着一个人工智能在这些逐字不会过时。 •其次,对新产品的反应是在不同的国家和文化中相似。这种普遍性使发展在相关的AI模型中可推广产品类别或国家/地区。如果方式人们对新产品的反应在不同的产品类别和国家,它消除了建立每个产品类别的模型和我们想要预测的国家。 真理、美丽和正义 在三个验证到真实的关键指标新产品发布-相关性,昂贵和差异化 我们在本文中的重点一直放在质量上训练数