您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [Common Sense]:深度伪造技术和语音克隆之消费者情绪报告 - 发现报告

深度伪造技术和语音克隆之消费者情绪报告

商贸零售 2023-11-17 Common Sense ShenLM
报告封面

目录 1.简介//32.SCAMS、攻击向量和积极使用//133.深度意识和情感//234.声音克隆意识和情感//375.比较深度和语音克隆//526.DEEPFAKE和语音克隆关注域//607.其他资源//71 Pindrop致力于不断创新解决方案,以检测和减轻合成音频带来的风险-增强您与客户之间的信任和诚信。 Voicebot制作领先的在线出版物,时事通讯和播客,专注于对话式AI和生成式AI行业。成千上万的行业领导者,工程师,企业家,软件开发人员,投资者,分析师和公司创始人每周都会向Voicebot寻求最新的新闻,数据,分析和见解,以定义下一个伟大的AI计算平台的轨迹。 方法 Synthedia是领先的分析,数据,趋势,新闻和咨询服务提供商,专注于快速增长的生成AI和合成媒体市场。通过每日电子邮件时事通讯,每周新闻直播,会议,报告,社区和战略咨询,Synthedia帮助商业领导者应对二十年来最具颠覆性的技术转变。 该调查于2023年7月在线进行,由2, 027名18岁或18岁以上的美国成年人完成,这些成年人代表了美国人口普查人口的平均水平。 来自Pindrop的一封信 社会工程和技术的结合,试图访问某人的银行帐户,病史或其他私人信息。今天,它是一样的,但是语音克隆和深度伪造是欺诈技术军备竞赛中的最新工具。 每一项新技术都有好的和坏的应用。虽然《星球大战》、《美国达人》、在线游戏和无数幽默的YouTube视频的许多粉丝都喜欢语音克隆和深度假货的出现,但这些技术在欺诈、虚假信息和损害个人声誉方面的应用也越来越多。 Pindrop正在采取行动并提供检测工具,以保护公司和个人免受伤害。实际上,我们已经在这个问题上工作了十年,并拥有11项Deepfake检测专利,其中许多专利已转化为产品。 技术是如此之好,我们被如此多的数字媒体所淹没,以至于人们现在很难区分真假。一项Pindrop研究表明,人们可以以57%的准确率识别深度假。这仅比抛硬币好7 我们与Voicebot合作。ai将阐明消费者对deepfae和语音克隆技术的体验和看法。我怀疑你会发现超过一半的美国人对这种深度的认识S.成年人比预期的要高。语音克隆意识甚至更高,为64%。该技术的扩散迅速发展,消费者对此表示关注。值得庆幸的是,有些公司希望主动保护他们的客户。 %。 解决方案不是停止技术并抛弃好的东西以消除坏的东西。解决方案是创建可以检测深度伪造和语音克隆的工具,并保护用户免受滥用的风险。 Pindrop Security建立在使用AI技术通过区分现实与虚幻来降低风险的基础上。最初,它是人类使用 Vijay Balasubramaniyan,Pindrop首席执行官兼联合创始人 INTRODUCTION Deepfakes的崛起 Deepfaes是AI技术进步带来的最具争议的解决方案之一。好莱坞使用这项技术来贬低演员,并在死后重现演员的肖像,在社交媒体上的喜剧演员,广告商,游戏玩家以及朋友之间的娱乐和娱乐目的。然而,它也被犯罪分子用作欺诈的工具,被心怀不满的人用来损害某人的声誉,被民族国家和政治行为者用来传播虚假信息。 填补信息差距 大多数新闻报道和分析都集中在技术和事件上,而关于消费者对deepfakes的感知和体验的了解很少。Voicebot与Pindrop Security合作,以填补有关deepfakes整体和语音克隆子类别的信息空白。 无论您将deepfake技术视为净正或净负,它的不真实都是我们这个时代的现实。自2019年以来,Voicebot. ai和Synthedia已发表了100多篇有关deepfake技术的文章。大多数是在过去的一年中。该技术正在崛起,质量不断提高,并且变得越来越容易获得。 这些发现可能会让你大吃一惊。我们没有预料到消费者的日常意识或正面和负面情绪的分裂,特别是考虑到所表达的担忧程度。我们也没想到这么多消费者会相信银行、保险、医疗保健、新闻和社交媒体组织已经采取了有意义的措施来保护他们。这一发现表明,期望和现实之间可能存在不匹配。这种情绪似乎确实是主题。 Deepfakes存在多种格式 Voicebot将deepfake技术分为四个类别:音频,视频,文本和图像。核心技术通常相关但不同。对于本报告,我们关注整个deepfake市场和语音克隆的子类别。各种技术可以单独使用,也可以组合使用,可以是静态的,可以是记录的,也可以是实时交付的。 Definitions Deepfakes是以文本,图像,音频或视频格式的AI操纵的数字媒体,它们复制真实的东西或改变真实的东西的关键特征,这可能会改变媒体的解释方式。 语音克隆是AI操纵的音频媒体,它复制了 特定的人。它是一种合成语音,也是deepfakes的子类别。 INTRODUCTION Deepfake技术存在复杂性 Deepfaes不是由单一的技术、技术或模态来表示的。复制人类相似性和生物特征的各种用例涉及不同级别的技术复杂性。通常,技术复杂性越高,市场上的可用性就越低。然而,也有例外。廉价的(或免费的)和相对高质量的语音克隆可供今天的任何人使用,合成语音也是如此。 要考虑的另一个因素是Deepfae是否应用于记录媒体(静态或动态)或实时通信。后者的复杂性更高,但有时会更有效,因为另一方没有时间考虑和审查情况。他们对交换做出反应,可能不会接受真实和虚假之间的细微差别。他们甚至可能认为指标是互联网连接或音频通道的反映。 语音克隆意识比Deepfakes高,关注相似 超过一半的美国成年人知道深度假货和语音克隆,后者获得了更多的认可。考虑到其中一个术语是异国情调,而另一个术语结合了容易识别的日常单词,这可能不足为奇。 意识到深度假货和语音克隆的消费者表达了极大的担忧,在这两个类别中,约有60%的人表示他们“非常”或“极度”关注,超过90%的人表示担心。 银行,政府和媒体是最关注的问题 消费者关注的最大领域涉及敏感的个人身份信息(PII)面临风险以及虚假公共信息可能产生负面影响的领域。 值得注意的是,“医疗保健”和“保险”的担忧大大超过了“银行”。当涉及到深度假货的担忧时,欺诈的可能性是首要考虑因素,人们将其与金钱联系在一起。 “政府”和“媒体”位于PII重消费服务的主食之间。两者都可能受到虚假的虚假信息的影响,并可能导致公众采取适得其反的行动。 其他令人担忧的领域要低得多,只有“家庭公用事业”突破了20%的水平。“其他”的6.2%表明消费者的想象力在他们可能面临的威胁范围内受到限制。 许多消费者认为公司已经做好了准备 尽管消费者对深度假货和语音克隆表示极大关注,但领先机构的准备情况存在高度不确定性。大约25%的美国消费者表示,他们“中立或不确定”,认为企业已准备好在关键行业中使用该技术。 消费者最有信心的是,“银行、保险和医疗保健”已经采取措施保护他们免受风险。大约40%的人表示至少“有点高”的信心。鉴于这项技术的新颖性和最近出现的检测解决方案,消费者的期望似乎超过了现实。 对于“新闻”和“社交媒体”,“低”信心类别要高得多。这一点很重要,因为这些渠道是推动接触次数最多的渠道。 INTRODUCTION 情绪向极端倾斜 大多数消费者情绪是由积极和 deepfake和语音克隆技术的负面影响。事实上,结果看起来很像逆正态分布。 Overall,the unaided positive sential for deepfakes was 38.5%to 48.8%negative. The figures were 34.3% positive to 49.1% negative for voice clones.This reflects a measurable negative sentiment bias. 有趣的是,表达最高关注程度的消费者更有可能对这两种技术表达积极情绪。Deepfaes的阳性率为51.7%,语音克隆在“非常”和“非常”相关人群中显示为45.6%。看来,更多的熟悉可能会导致更积极的兴趣和更多的关注。这些消费者更好地意识到好处和风险。 社交媒体加速Deepfake曝光 消费者最有可能在社交媒体上遇到深度假货和语音克隆。这两个类别的前四名回应是YouTube,TikTok,Instagram和Facebook。您会注意到这些平台上对视频的偏见,因为YouTube和TikTok的遭遇明显更高。尽管所有这些平台都有视频,但两个平台都专门使用媒体。 电影、新闻媒体和电视紧随Facebook和Instagram之后。曝光是广泛的。然而,深度假货体验超过了所有顶级媒体来源的语音克隆,这表明消费者更有可能在多个渠道体验深度假货。这也可能表明,许多人知道语音克隆,但没有亲自遇到它们。 消费者更有可能在Spotify和电话等音频通道上遇到语音克隆。他们也更有可能创建自己的语音克隆。 两个结果的故事 由于不断提高的质量和易于访问的融合以及通过社交和传统媒体的大规模分发,深度假货和语音克隆的供需风暴是完美的。新颖性和实用性带来了许多积极的用途以及消费者的兴趣。同时,出于邪恶目的,不良行为者越来越多地接受增强的现实主义。 消费者的情绪和深度假货和语音克隆的经验是这些考虑的背景。他们的期望是什么?他们担心什么?他们将如何应对组织行动或不采取行动的风险?他们想要什么?这些问题的答案将影响企业如何应对这些技术带来的风险和紧迫性。 Deepfakes和语音克隆可能为创造性追求引入了“最好的时代”。但是,如果您专注于欺诈预防,版权监控,或者只是想保护自己的声誉,那么您是否准备好迎接“最坏的时代”?积极的应用程序会照顾好自己。真正的问题是如何识别和减轻负面使用带来的风险。 上面的数据和结论反映了本报告中发现的一小部分样本。在接下来的页面中,您将找到按媒体消费,年龄,收入和性别细分的消费者情绪和体验的其他分析。您还将找到一些关于deepfake和语音克隆使用的高调正面和负面示例的摘要。 Deepfake和语音克隆诈骗,攻击向量和积极使用 Deepfakes的好,坏和丑陋 使用该技术冒充公司官员并从公司银行帐户中窃取了数百万美元。他们通过冒充孙子孙女窃取了成千上万的人。有人甚至用deepfake冒充乌克兰总统Volodymyr Zelensky并影响了战争。政治人物,名人和家庭成员的肖像都被用来欺诈。 Deepfakes和语音克隆在好,坏,彻头彻尾的丑陋环境中出现。技术意识很高的一个重要原因是,在过去两年中,它出现了许多情况。 从积极的角度来看,主要媒体和社交媒体创作者已经利用该技术来实现其娱乐价值。游戏玩家已经用它来为他们的会话语音聊天增加更多的乐趣,人们也用它来恶作剧朋友。语音克隆也被用作失去自然说话能力的人的假肢。 随着技术的质量和易用性的提高而成本下降,问题可能会变得更糟。然而,这并不是一个完全可怕的情况。检测工具正在出现,并且有很多积极的用例与邪恶的一起激增。接下来的几页重点介绍了最近使用deepfaes和语音克隆的正面和负面示例。你会看到好处和风险以各种形式出现。 However,thenegativeusesareontherating.Scamdistributedonsocialmediaandthroughphonecallsaretargeteddamageconsumers.Criminalshave DeepfakeSimonCowellWowsAGT粉丝 背景 形而上学出现在美国达人(AGT)上,以突出其deepfake技术的娱乐价值。 Venue 该解决方案出现在三个不同的AGT节目中:一次是一位歌手复制Cowell,另一位是包括其他评委在内的三人组,另一位则带回了猫王的肖像和声音克隆。 结果 Metphysic的表现进入了2022年的决赛,并完成了竞争总体排名第四。 “我相信这是该系列中最好的表演。”AGT创作者SimonCow