AI智能总结
内容 报告由路透社研究院发布《2024年新闻学》作为我们工作的一部分关于人工智能与新闻未来的研讨会,由种子基金支持资助来自路透新闻,并得以实现通过汤姆森·路透的核心资金基础。 关于作者 理查德·弗莱彻博士他是路透社新闻学院的研究主管。他主要关注全球数字新闻消费趋势、记者和新闻机构使用社交媒体,以及更广泛地,基于计算机技术的新闻业关系。 尼尔斯教授,拉姆修斯·克莱斯是路透社新闻研究所的主任,牛津大学政治传播学教授,并曾担任《》的编辑部主任。国际新闻与政治杂志2015年至2018年。他的工作专注于新闻媒体、政治传播以及数字技术在其中的作用的变化。 致谢 我们感谢Caryhs Innes、Xhoana Beqiri以及YouGov团队的其余成员在开展调查方面所做的努力。同时,我们也感谢Felix Simon在数据分析方面的帮助。我们对RISJ研究团队的其他成员在问卷设计和结果解读方面的贡献表示感激,并对Kate Hanneford-Smith、Alex Reid和RebeccaEdwards在推进项目进展并确保我们保持进度方面提供的帮助表示感谢。 Executive Summary 基于一项针对六个国家(阿根廷、丹麦、法国、日本、英国和美国)的人们如何使用生成式人工智能(AI)以及他们对其在新闻和其他工作与生活领域的应用看法的在线调查,我们提出了以下发现。 关于公众使用生成式人工智能的研究发现 ChatGPT是目前最广为人知的生成式AI产品——在六个被调查的国家中,大约50%的在线人口听说过它。它也是六个被调查国家中最广泛使用的生成式AI工具。尽管如此,ChatGPT的频繁使用并不常见,日本仅有1%的人每天使用它,法国和英国的比例上升至2%,而美国为7%。许多声称使用过生成式AI的人只使用过一两次,它尚未成为人们日常互联网使用的一部分。 更详细地说,我们发现: • 虽然对生成式人工智能的整体认知较为广泛,但在六个国家中被调查的在线人群中,仍有相当一部分——占20%至30%——未曾听说过任何最受欢迎的人工智能工具。 在用途方面,ChatGPT是调查的六个国家中迄今为止最广泛使用的生成式AI工具,其使用范围是下一个最广泛使用的产品(谷歌Gemini和微软Copilot)的两到三倍。 • 年轻人更有可能定期使用生成式人工智能产品。在六个国家中平均计算,56%的18至24岁的人表示他们至少使用过ChatGPT一次,而55岁及以上的人中只有16%。 • 在六个国家中,大致相等的比例的人表示他们使用生成式AI来获取信息(24%)以及创建各种类型的媒体,包括文本、音频、代码、图像和视频(28%)。 • 在六个受调查国家中,只有5%的人表示他们已经使用生成式人工智能来获取最新新闻。 关于不同领域中对生成式人工智能使用公众意见的调研结果 大多数公众预计生成式人工智能将在未来五年内对社会的各个领域产生重大影响,从51%的人预计将对政党产生重大影响,到66%的人预计将对新闻媒体和科学产生重大影响。但是,在人们是否期望不同行业负责任地使用人工智能方面,存在显著差异——从大约一半的人信任科学家和医疗专业人员会这样做,到不到三分之一的人信任社交媒体公司、政治家和新闻媒体会负责任地使用生成式人工智能。 更详细地说,我们发现: • 在未来几年内生成式AI影响的预期在年龄、性别和教育程度方面普遍相似,但在生成式AI对普通人影响方面的预期除外——年轻受访者比年长受访者更有可能预期生成式AI将在他们自己的生活中产生重大影响。 • 被问及他们认为生成式人工智能是否会他们的生活无论好坏,六个受调查国家中的四个国家的大多数人回答“更好”,但许多人没有强烈的观点,并且一个相当大的少数人认为这会使他们的生活变得更糟。当被问及生成式人工智能是否会改善人们的生活时,人们的期望是这样的:社会好坏一般更为悲观。 • 当被问及生成式人工智能是否会改善或恶化不同行业时,人们对科学、医疗保健以及许多日常例行活动(包括媒体空间和娱乐,其中乐观主义者比悲观主义者多17个百分点)持相当乐观的态度,而对于生活成本、就业保障和新闻等问题则持相当悲观的态度(悲观主义者比乐观主义者多8个百分点)。 • 当被问及他们对生成式人工智能的影响的看法时,我们三分之一到一半的受访者选择了中间选项或回答“不知道”。虽然有些人有明确且坚定的观点,但许多人还没有下定决心。 关于公众对新闻业中使用生成式人工智能的看法的研究成果 要求评估他们认为主要由AI生成并辅以人工监管的新闻对新闻质量可能产生的影响,人们普遍认为这种新闻的可信度和透明度较低,但时效性更强,并且(大幅)降低了对出版商的制造成本。非常少的人(8%)认为由AI生成的新闻相较于由人类生成的新闻,更值得付费。 更详细地说,我们发现: • 许多公众认为记者目前正使用生成式AI来完成某些任务,其中43%的人认为他们总是或经常使用它来编辑拼写和语法,29%的人用于撰写标题,27%的人用于撰写文章正文。 •大约三分之一的受访者(32%)认为,人类编辑会检查AI输出内容。确保在发布前它们是正确的或达到高标准。 人们通常比人工智能生产的新闻更舒适。 尽管人们普遍谨慎,但在涉及软新闻话题,如时尚(舒适与不适之间的差异为+7个百分点)和体育(+5)时,对主要由AI生成并辅以人工监管的新闻的舒适度,要高于对“硬”新闻话题的舒适度,包括国际事务(-21)和,尤其是政治(-33)。 • 当被问及主要由AI产生并辅以人工监督的新闻是否应该被标记为AI生成时,绝大多数受访者希望至少部分披露或标记。只有5%的受访者表示我们所列出的任何用例都不需要披露。 • 对应于应该披露或标注的用途,共识较少。大约三分之一的人认为“编辑文章的拼写和语法”(32%)和“撰写标题”(35%)应该被披露,而对于“撰写文章正文”(47%)和“数据分析”(47%),这一比例上升至约一半。 • 又一次,当被问到他们对新闻界中生成式人工智能的看法时,三分之一到一半的受访者选择了中庸的中间选项或回答了“不知道”,反映出很大的不确定性和/或对复杂性的认可。 引言 2022年11月OpenAI的ChatGPT的公测以及随后的进展引发了公众对生成式人工智能的极大兴趣。自2017年发表突破性的“变换器”论文(Vaswani et al. 2017)以来,涉及至少一些生成式人工智能的应用和产品以及底层技术在快速发展(尽管发展不均衡),尤其是基础模型和大型语言模型(LLMs)能够实现的新进展。 这些发展吸引了众多重要的学术关注,从试图改进相关工具的计算机科学家和工程师,到测试其性能是否符合定量或定性基准的学者,再到考虑其法律影响的律师。更广泛的研究工作引起了人们对内置限制的关注,以及关于数据来源和质量的问题,以及这些技术复制甚至加剧刻板印象的倾向,从而加剧了更广泛的社会不平等,以及它们的环境影响和政治经济意义。 一项重要的学术领域已经聚焦于公众对人工智能(AI)的普遍使用和认知,特别是生成式AI(例如,参见Ada Lovelace Institute 2023;Pew 2023)。在本报告中,我们通过使用六个国家的在线调查数据,在此基础上构建研究,以记录和分析公众对生成式AI的态度,其在社会各不同领域的应用,以及在新闻媒体领域更为详细的运用。 我们超越了对包括美国(皮尤2023;2024)、瑞士(弗格勒等人2023)和智利(梅拉多等人2024)等国的已发布工作的研究,不仅在涵盖的问题上,而且在提供六个相对享有特权、富裕、自由和高度连接的国家跨国比较分析方面,特别是对他们新闻媒体系统的特定平台化程度(尼尔森和弗莱彻2023)进行深入分析。 报告重点关注公众,因为我们相信——除了经济、政治和技术因素之外——公众对生成式人工智能的采用和理解将是塑造这些技术如何被开发和使用的,以及它们随着时间的推移将为不同群体和不同社会带来何种意义的几个关键因素(Nielsen 2024)。在人工智能领域有许多强大的利益相关者,也存在许多炒作——通常是积极的推销,但有时是对可能出现的未来风险的极度悲观警告,甚至可能使我们忽视已经存在的问题。但还有一个基本问题是,公众总体上会如何反应这一系列产品的发展。它会是像区块链、虚拟现实和Web3一样吗?都曾大肆宣传,但迄今为止公众接受度不高。或者它会更像互联网、搜索和社交媒体——虽然炒作,但也迅速成为数十亿人日常媒体使用的一部分。 为了深化对这些问题的理解,我们依赖于一项在线调查的数据,该调查旨在了解人们是否以及如何使用生成式AI,以及他们对其在新闻和其他工作与生活领域的应用的看法。在报告的第一部分,我们介绍了研究方法,随后我们继续探讨公众对生成式AI的认识和使用情况,对生成式AI对新闻及其他领域影响的期望,人们如何看待AI目前被记者使用的方式,以及人们如何看待记者应该如何使用生成式AI,最后提供一个结论性讨论。 正如所有基于调查的工作一样,我们依赖于人们的自我理解和回忆。这意味着在此处收集的许多回应将基于对人工智能是什么及其可能意味着什么的广泛概念,特别是在提到生成式人工智能时,人们可能会根据他们使用那些明确定位为基于生成式人工智能的独立产品的经验来回答,例如ChatGPT。大多数受访者不太可能考虑过他们可能遇到的依赖于生成式人工智能但并不那么引人注目的功能——这有时被称为“隐形人工智能”的一种形式(参见,例如,Alm等人,2020年)。我们还意识到,这些数据反映了公众舆论的快照,随着时间的推移可能会波动。 我们希望这里发布的分析和数据将通过补充在新闻机构中使用AI的重要工作(例如,Beckett和Yaseen 2023;Caswell 2024;Diakopoulos 2019;Diakopoulos等人 2024;Newman 2024;Simon 2024),包括其局限性和不平等性(例如,参见Broussard 2018,2023;Bender等人 2021),帮助将公众作为生成AI发展过程中的一个关键部分,并在未来可能影响社会许多不同领域,包括新闻业和新闻媒体。 方法 本报告基于由牛津大学雷特斯新闻研究学院(RISJ)委托尤戈夫(YouGov)进行的调查。主要目的是了解人们是否以及如何使用生成式人工智能,以及他们对其在新闻和工作中其他领域的应用的看法。 数据由YouGov通过在线问卷收集,调查时间介于2024年3月28日至4月30日,涵盖六个国家:阿根廷、丹麦、法国、日本、英国和美国。 优普洛(YouGov)负责现场调查和提供加权数据和表格,而国际关系与战略研究学院(RISJ)负责问卷设计和结果报告与解读。 每个国家的样本都是通过按年龄组、性别、地区和政治倾向的国家代表性配额进行汇编的。数据根据人口普查或行业认可的数据,针对相同的变量进行了加权。 样本量在每个国家大约为2,000。使用非概率抽样方法意味着无法计算个体数据点的传统“误差范围”。然而,+/- 2个百分点的差异或更小的差异在统计学上极不可能具有显著性,并且应该以非常高的谨慎度进行解读。我们通常不认为+/- 2个百分点的差异具有意义,并且作为一般规则,我们在文本中不提及这些差异。 值得注意的是,在线样本往往无法充分代表不在线人群(通常是年龄较大、收入较低且教育水平有限的人)的观点和行为。此外,由于人们通常会选择加入在线调查小组,因此往往过度代表受过良好教育且在社会和政治上活跃的人群。 调查的部分内容要求受访者回忆过去的行动,这些可能存在缺陷或受多种偏见的影响。此外,受访者关于生成式AI的信念和态度可能会受到社会期望偏见的影响,当被问及复杂的社会技术问题时,人们不一定熟悉专家依赖的术语或以相同的方式理解这些术语。我们已经采取了一系列措施来减轻这些潜在的偏见和错误来源,通过实施细致的问卷设计和测试。 本报告中的某些数字并未显示所有百分比。所有百分比均可在以下交互式图表中查看:https://reutersinstitute.politic