麦肯锡解释者什么是深度学习? 深度学习是一种机器学习,比传统机器学习更有能力、更自主、更准确。 深度学习已经存在了一段时间,但我们大多数人从未使用过基于深度学习的工具,直到2022年底OpeAI的ChatGPT发布。(即使我们对ChatGPT的输出感到惊讶,我们大多数人也不知道它正在使用深度学习来生成它们。)像它的前辈DALL-E、谷歌的Image和PaLM、稳定扩散等一样,ChatGPT依赖于在海量数据集上训练的大型深度学习模型,根据提示生成内容。但与其前身不同,ChatGPT通过开放访问API工作,这意味着公众可以体验深度学习的力量。第一次。 指令。这些算法可以检测模式,并通过处理数据和经验来学习如何做出预测和建议,而不是通过接收明确的编程指令。这些算法还可以适应新的数据和经验,以随着时间的推移而改进。 现在产生的数据的数量和复杂性太大,人类无法预料,增加了对机器学习的需求,并增强了其潜力。在广泛部署以来的几年中,机器学习在许多行业中产生了影响,包括医学成像分析和高分辨率天气预报。 人工智能和机器学习的世界(深度学习是下一个进化步骤)正在经历一个代代相传的转变,从科学家研究的想法到各种人用于各种任务的工具。麦肯锡的分析显示,在2015年至2021年之间,培训图像分类系统(基于深度学习模型运行)的成本下降了64%。培训时间在同一时期增加了94%。我们还发现,生成AI(geerative AI)每年可以为全球经济增加相当于4.4万亿美元的收入。这些深刻的变化都是由深度学习驱动的。 有关机器学习的更多信息,请查看我们的麦肯锡解释者。 深度学习与机器学习有何不同? 深度学习是机器学习的更高级版本,特别擅长处理更广泛的数据资源(文本以及包括图像在内的非结构化数据),需要更少的人工干预,并且通常可以产生比传统机器学习更准确的结果。深度学习使用神经网络-基于神经元在人脑中的交互方式-通过多个神经元层摄取和处理数据,这些神经元层识别数据的日益复杂的特征。例如,早期神经元层可能会将某些东西识别为特定形状;基于此知识,后一层可能能够将形状识别为停止标志。与机器学习类似,深度学习使用迭代进行自我校正并提高其预测能力。一旦它“学习”物体的外观,它就可以识别新图像中的物体。 但是什么是深度学习?它是如何使这一切成为可能的?继续阅读以找出答案。 了解有关麦肯锡数字的更多信息。 什么是机器学习? 在我们转向深度学习之前,让我们先了解一下基础知识。机器学习是一种人工智能形式,可以适应广泛的输入,包括大数据集和人类 什么类型的神经网络用于深度学习? 深度学习和GeneAI有什么关系? 深度学习中使用的人工神经网络有三种类型: ChatGPT首次使AI对公众可见和可访问。ChatGPT和其他类似的语言模型在称为变压器网络的深度学习工具上进行了训练,以响应提示生成内容。 —前馈神经网络。在1958年首次提出的这个简单的神经网络中,信息仅在一个方向上移动:从模型的输入层到其输出层,而不必向后移动以被模型重新分析。这意味着您可以将数据馈送或输入到模型中,然后“训练”模型以预测有关不同数据集的某些信息。仅作为一个示例,前馈神经网络用于银行业等行业,以检测欺诈性金融交易。它是这样工作的:首先,你训练一个模型,根据你用来手动标记交易是否欺诈的数据集来预测交易是否欺诈。然后,您可以使用该模型来预测新的,传入的交易是否具有欺诈性,因此您可以标记它们以进行更仔细的研究或完全阻止它们。 变压器网络允许ge AI工具在进行预测时对输入序列的不同部分进行不同的加权。与传统机器和深度学习模型相比,由编码器和解码器层组成的变压器网络使Geeral AI模型能够以更灵活的方式学习单词之间的关系和依赖关系。这是因为变压器网络是在大量的互联网上训练的(例如,所有记录和上传的交通录像),而不是特定的数据子集(例如,停车标志的某些图像)。如下面进一步讨论的,在变压器网络架构上训练的基础模型— —比如OpeAI的ChatGPT或Google的BERT — —能够将他们从特定任务中学到的东西转移到更通用的一组任务,包括生成内容。此时,您可以要求模型创建汽车通过停车标志的视频。 —卷积神经网络(CNN)。CNN是一种前馈神经网络,其连接受到大脑视觉皮层组织的启发,视觉皮层是大脑处理图像的部分。因此,CNN非常适合感知任务,例如能够根据照片识别鸟类或植物物种。商业用例包括通过医疗扫描诊断疾病或在社交媒体中检测公司徽标,以管理品牌的声誉或识别潜在的联合营销机会。 基金会模型可以创建内容,但他们不知道对与错之间的区别,甚至不知道什么是社会可以接受的。当ChatGPT首次创建时,它需要大量的人力投入来学习。OpeAI在世界各地雇用了大量的人类工人来帮助磨练技术,清洁和标记数据集,审查和标记有毒内容,然后将其标记为删除。这种人为的输入是使ChatGPT具有革命性的很大一部分。 有关深度学习和神经网络及其用例的更多信息,请参阅我们的AI高管指南。了解有关麦肯锡数字的更多信息。 以下是它们的工作方式 : •首先,CNN接收图像-例如,字母“A ” -它处理为像素集合。 •在隐藏层中,CNN识别出独特的特征-例如,构成字母“A ”的各个行。•如果CNN发现新图像具有相同的唯一性,则可以将不同的图像分类为字母“A ”。以前被确定为构成这封信的特征。 什么是基础模型? 基础模型是在变压器网络架构上训练的深度学习模型:大量非结构化、未标记的数据。 基础模型可用于各种任务,无论是开箱即用,还是通过微调适应特定任务。微调涉及在标记的数据集上进行相对较短的训练时间,该训练时间通常远小于最初对模型进行训练的数据集。这种额外的训练允许模型学习和适应在较小的数据集中发现的细微差别、术语和特定模式。基础模型的示例包括DALL - E 2、GPT - 4和稳定扩散。 -循环神经网络(RNN)。RNN是人工神经网络,其连接包括循环,这意味着模型既向前移动数据,又向后循环数据,以再次运行之前的层。RNN有助于预测情绪或序列的结尾,例如大量的文本、语音或图像样本。他们可以这样做,因为每个单独的输入本身以及与前面的输入组合被馈送到模型中。 什么是大型语言模型? 大型语言模型是一类基础模型,可以处理大量非结构化文本。这些模型可以学习单词或单词部分之间的关系,也称为令牌。这使大型语言模型能够生成自然语言文本,或执行摘要或知识提取等任务。谷歌的双子座运行在一个名为LaMDA的大型语言模型上。 继续以银行为例,RNN可以像前馈神经网络一样帮助检测欺诈性金融交易,但方式更复杂。前馈神经网络可以帮助预测单个交易是否可能是欺诈性的,而循环神经网络可以从个人的金融行为中“学习” — —比如像信用卡历史这样的一系列交易— —并根据个人的整体记录来衡量每笔交易。除了使用前馈神经网络模型的一般学习之外,它还可以做到这一点。 了解有关麦肯锡数字的更多信息。 哪些行业可以从机器学习和深度学习中受益? 呼叫服务检测到呼叫者感到不安,系统可以重新路由到人工操作员或经理。 麦肯锡整理了19个行业和9个业务功能的400多个机器和深度学习用例。根据我们的分析,我们认为几乎任何行业都可以从机器和深度学习中受益。以下是几个领域的用例示例: 了解有关麦肯锡数字的更多信息。如果您有兴趣与麦肯锡合作,请查看与深度学习相关的工作机会。 引用的文章: —预测性维护。这个用例对于任何依赖设备的行业或企业都至关重要。公司可以使用预测性维护来预测何时需要维护,从而减少潜在的停机时间并降低运营成本,而不是等到设备发生故障。机器学习和深度学习具有分析大量多方面数据的能力,可以提高预测性维护的精度。例如,人工智能从业者可以从新的输入中分层数据,如音频和图像数据,这可以为神经网络的分析增加细微差别。 —“技术与生成AI的世代时刻:CIO和CTO指南”,2023年7月11日,Aamer Baig,Sven Blumberg,Eva Li,Douglas Merrill,Adi Pradhan,Megha Sinha,Alexander Sukharevsky和StephenXu —“企业的新的,更快的机器学习飞轮”,2023年3月10日,Medha Bankhwal和Roger Roberts —物流优化。使用AI优化物流可以通过实时预测和行为指导来降低成本。例如,AI可以优化交付流量的路由,提高燃油效率并减少交付时间。 —“产品设计中的深度学习”,2022年12月14日,Mickael Brossard,Jacomo Corbo,Marie Klaeyle和Bill Wiseman —客户服务。呼叫中心中的人工智能技术可以帮助为客户提供更无缝的体验和更高效的处理。该技术超越了理解呼叫者的话:对音频的深度学习分析可以评估客户的语气。如果自动 —“AI高管指南”,2020年11月17日,MichaelChui,Brian McCarthy和Vishnu Kamalnath —“深度学习的起源和先驱”2018年5月8日 —“来自AI前沿的注释:深度学习的应用和价值”,2018年4月17日,Michael Chui,James Manyika,Mehdi Miremadi,Nicolaus Henke,Rita Chung,Pieter Nel和Sankalp Malhotra 了解并直接与麦肯锡深度学习专家接触. Aamer Baig是麦肯锡芝加哥办事处的高级合伙人亚历克斯·辛格拉是QuantumBlack的全球领导者,麦肯锡的AI,也是高级合伙人;Sven Blumberg是杜塞尔多夫办公室的高级合伙人;Michael Chui是麦肯锡全球研究所的合伙人,总部设在湾区办公室;Alex Sukharevsky是伦敦办事处的高级合伙人;以及比尔·怀斯曼是西雅图办公室的高级合伙人.