人工智能词典,第一部分:基础 要点 •人工智能(AI)使计算机和机器能够模拟人类学习、理解、解决问题、决策、创造力和自主性。但就在我们认为已经搞清楚它是什么的时候,AI 又重写了规则。 •创新的步伐正在飞速加快,以至于我们中的许多人难以跟上。而对于那些试图了解的非专家来说,语言和概念可能会让人感到困惑。这个三部分的“词典”系列是为了帮助定义关键术语,并提供关于人工智能——迄今为止最大的一场革命——你需要知道的一切。 •这一部分涵盖了AI基础知识 - 从探索当今广泛使用的常见AI类型,到讨论关键AI技术,包括机器学习、深度学习和自然语言处理。 人工智能 它是什么? 人工智能(AI)是使计算机和机器能够模拟人类学习、理解、解决问题、决策、创造力和自主性的技术。 1它利用复杂的算法,通过数据来处理、学习并制定解决方案,模拟人脑摄入数据、处理数据并从中汲取信息以做出决策的过程。在构建人工智能计算工具时,首先必须精心策划海量数据集,然后设计人工智能算法或模型以适配特定应用场景(这一步骤称为训练)。最后,将处理后的数据输入模型以提取洞见和结论(这一步骤称为推理)。 人工智能的历史发展:生成式、具身式…… 人工智能领域于1956年被认可为一个学术学科。然而,基于人工智能的应用要实现商业化需要数十年的时间,这主要是由于运行这些模型所需的计算能力有限。如今,一些关键的AI技术包括机器学习(ML)、深度学习(DL)和自然语言处理(NLP)。 生成式人工智能(见下文)自ChatGPT发布以来获得了显著的人气。但人工智能的阶段现在正从生成式向 agent(智能体)、物理、科学和通用演变,需要不断增加的基础设施来支持它们(图1)。如今,人工智能可以识别物体、理解自然语言,并执行物理任务(通过机器人)。 图1:人工智能的阶段正从生成式发展到智能体、物理、科学以及通用人工智能,所有这些都需要日益增多的基础设施来支持它们 阐示人工智能的七个阶段 生成式人工智能 它是什么? 生成式人工智能是一种能够根据用户提示或请求生成文本、图像、视频、音频或软件等内容的AI类型。2它使用模拟人脑学习的深度学习(DL)模型。这些模型识别用于“训练”它们的数据库中的模式和关系,并使用这些信息来创建新内容。相比之下,传统人工智能系统被设计用来识别模式并做出预测。 向多模态转变 最初的语言模型的研发和部署是针对基于文本的应用;然而,这项技术现在正被应用到范围更广的一组形式中,包括数字、图像、视频、音乐和编码。随着人工智能的能力和熟练程度提高,多种技术的组合可以逐渐应用于更具挑战性的领域,例如编程、艺术和科学(例如药物发现或基因分析)。 用例:驱动收入提升和/或运营效率 鉴于生成式AI具有广泛的应用场景,它可以嵌入到许多行业,并且其日益增长的应用可以帮助推动收入增长和/或运营效率。为了推动收入增长,AI可以集成到传统和新产品中,例如机器人、自动驾驶汽车或网络安全。AI战略还可以通过优化流程和降低人工成本来提高企业效率和生产力。例如,生成式AI可用于记笔记、编程、创建营销材料、人力资源申请筛选、客户反馈分析、供应链优化和数据库查询。 美國銀行全球研究部認為,生成式人工智能的推出是下一個主要科技周期的開端,接踵而至的是1981年個人電腦(PC)的問世和1994年的互聯網。它是在80年的進步基礎上誕生的,這些進步生產了更強大的芯片和新的神經網絡架構,從而縮短了訓練越來越大的基礎模型的時間和成本。因此,生成式人工智能應用程式可以普及對強大計算智能的訪問權,並在未來一至三年內推動企業效率和生產力的范式轉變。 ChatGPT的兴起 生成式人工智能自2022年11月发布ChatGPT以来广受欢迎——这是首个向大众公开的聊天机器人。此前,人工智能能够读写,但不能内容。然而,像理解 ChatGPT利用机器学习(ML)和自然语言处理(NLP)改变了这一点,为各种各样的目的创建类似人类的对话响应和内容。 自2022年以来,已引入了额外的聊天机器人平台,并且获得了流行。如今,除了文本到文本模型之外,现在还有文本到图像和文本到视频模型。应用场景包括内容生成(例如,写论文、新闻文章、社交媒体帖子、营销内容、故事、音乐、电子邮件等)、数据提取、文本摘要、优化网络浏览器、语言翻译和计算机编程。事实上,程序员们已经使用这项技术进行程序生成或解释代码或概念。 深度学习 它是什么? 深度学习(DL)是机器学习(ML)的一个子集,它使用受大脑功能和结构启发的算法,称为人工神经网络。神经网络由“层”——即数据处理的各个阶段组成。这些层由相互连接的节点组成,每个节点都建立在前一层的基础上,以优化和改进模型的3 相应地,互联的节点(或神经元,如同人脑中的那样)将输入数据转换为抽象和预测。有意义的表示。这种结构允许它在原始数据中提取的模式具有更高的精度。 深度学习有比机器学习更多的层,这允许模型获取更多的概念 传统机器学习模型使用一层或两层的简单神经网络,而深度学习模型则至少使用三层,但通常使用数百层或数千层来训练模型。 通过将数据输入具有多层结构的深度学习系统中,每一层都会增加数据抽象度,这使得计算机系统能够获取先前使用机器学习模型无法实现的概念。 DL的强大之处体现在系统能够确认难以识别的额外数据关系。经过充分训练后,算法网络持续改进预测或解释。 用于需要模式识别的复杂系统的深度学习模型 然而,深度学习可能用于需要模式识别的更复杂的系统,例如图像识别、自动驾驶汽车和语音控制的虚拟助手。 6事实上,DL是自动驾驶程序中算法背后的技术,在某些情况下可以检测驾驶员眨眼的速率,并从这些数据中推断出他们有睡着的风险,从而提醒他们和/或停止车辆。 神经网络的三个特性 每个神经网络都可以用三个属性来描述:1)建筑规定了网络中涉及的变量以及它们之间的关系。在神经网络中,它可以是“神经元”(相互连接的节点)的权重和活动;2)活动规则定义了神经元活动如何相互响应;以及3)学习规则定义了神经网络权重随时间的变化。 多种神经网络构成了生成式AI模型的基础,包括以下: •卷积神经网络(CNNs)用于图像处理问题,例如分类和目标识别。应用案例包括人脸检测、面部表情检测、目标检测和文档分类。 •循环神经网络(RNNs) 可以处理和预测序列数据。传统神经网络是前馈网络,无法处理序列数据(如句子)。应用场景包括自动更正、欺诈检测和分析。 •生成对抗网络(GANs) 使用两个子网络来自动训练一个模型。一个是区分真实数据和生成数据的判别器模型。另一个是生成器模型(通常是CNN),用于生成旨在模仿真实数据的图像,其中每个数据输入都发送到判别器模型。随着模型扩展和学习,生成的输出将越来越接近真实数据。使用GANs的生成式人工智能模型的示例包括图像生成器。 •Transformer模型应用数学方法来理解序列数据(例如,构成句子的单词)之间的关系。它们接收一系列输入并生成可理解输出。这些模型可用于实时文本/语音翻译,以及理解DNA中基因序列的模式/关系。 基础模型 他们是什么? 基础模型(FM)是一种深度学习(DL)模型,在广泛谱系的泛化无标记数据上进行训练,能够执行多种通用任务(例如,理解和用自然语言对话、回答问题以及生成文本和图像)(图2)。7 大型语言模型(LLMs)是一种流行的基础模型,专注于自然语言处理(或,NLP,理解和交流人类语言)。 更通用型与为特定任务创建的机器学习模型 因子机(FMs)与传统机器学习(ML)模型不同,因为传统ML模型通常执行特定任务,例如情感分析、图像分类或趋势预测。然而,由于因子机的规模和通用性,它们可以作为更专业化的下游应用的基模型。这是通过在某个行业或领域内的技术数据上训练FM来实现的。 大型语言模型 他们是什么? 大型语言模型(LLMs)是生成式人工智能基础模型(FMs),能够识别、理解、预测和生成文本,因为它们是为自然语言处理(NLP)任务而设计的。基础模型(FMs)是在大型数据集上训练的深度学习(DL)模型,能够执行各种通用任务。它们可以作为开发更专业化的下游应用的基础。LLMs是专门在语言数据上训练的,这使得它们能够理解和生成自然语言。8 人工智能大语言模型革命加速了工业5.0的采用,后者强调人机协同,如人工智能驱动的机器人,以优化工作流程。我们现在看到人工智能融入到我们生活的方方面面,并对自动化流程进行“人性化”。这正推动社会从人性化时代(工业5.0)迈向工业6.0,后者旨在通过创建基于下一代技术的全面集成、智能制造系统来最小化人工干预(附录3)。 更通用型与传统为特定任务创建的机器学习模型 LLMs的规模和通用性质将它们与传统机器学习(ML)模型区分开来。传统ML模型通常可以执行特定任务,例如文本的情感分析、图像分类和趋势预测。LLMs在大量文本数据集上进行训练,可以像训练数据一样生成文本。这是通过为单词序列分配概率分布来完成的。LLMs可以大规模地生成代码和全新内容,总结内容,检索信息,分析情感和翻译语言。 机器学习 它是什么? 机器学习(ML)是一种人工智能,它允许程序在没有被专门编程的情况下解决复杂问题(图4)。通过对大量句子和消息数据集进行训练,该算法“学习”人类文本语言的规律,然后“预测”接下来可能出现的词语(例如,搜索引擎预测用户可能想输入的下一个词语)。通常情况下,使用机器学习,如果数据类型相同,那么增加数据量将提高输出结果的准确性。 选择数据输入是提高模型性能的关键 目前还没有一种机器学习(ML)方法能够针对任何问题或任何类型的数据提供最准确的响应。而且,虽然机器学习(ML)主要有三个阶段:数据准备、模型训练和开发,以及模型部署(图5),但在应用机器学习(ML)时,特征值选择是最重要的操作之一。特征是输入到机器学习(ML)过程中的数据项,选择和确定这些特征的方怯对机器学习的准确性影响很大。还需要注意的是,机器学习(ML)无法响应尚未学习到的事件。如果系统被强制学习非常规事件,那么这将降低在正常条件下的识别准确性。 深度学习可以独立识别这些数据输入 然而,深度学习(DL),一种机器学习(ML)技术,允许计算机能够1)独立识别这些特征值,2)自行生成程序。这些方面代表了机器学习的突破。为什么呢?因为传统的机器学习更依赖于人工干预来学习——人类确定特征集以理解数据输入之间的差异,这通常需要更结构化的数据来学习。 自然语言处理 它是什么? 自然语言处理(NLP)是人工智能领域的一个分支,使机器能够理解人类语言,包括俚语、缩写和发音,并进而生成类似人类的文本。NLP应用不同的算法来识别和提取自然语言规则,将非结构化的语言数据转换为计算机可以解释的形式。NLP是全面高效分析文本和语音数据的关键工具。 使生成式人工智能能够理解人类语言,进而生成新内容 自然语言处理已经是我们日常生活的一部分——为搜索引擎、翻译应用程序、电子邮件服务的垃圾邮件过滤器、情感分析、聊天机器人和数字助理提供支持。生成式人工智能使用自然语言处理来理解和解释人类语言,使其能够生成新内容。 开源与闭源 他们是什么? 开源指的是在许可证下发布的软件,该许可证授予用户免费使用、学习、修改和分发软件及其源代码的权利。因此,开源模型是公开且免费可访问的模型,开发者可以使用它们来创建各种应用程序。另一方面,闭源模型是专有系统,其源代码不会公开提供。 将访问AI模型民主化,更高的透明度和协作 开源模型允许任何人访问和修改模型,与闭源相比,这带来了更高的透明度和协作性,最终实现了人工智能模型使用和访问的民主化。根据人工智能专家的说法,开源模型可以在公司自己的设备上本地运行,无需模型开发或培训成本,只需推理成本,因此可以大大降低访问成本。10 然而,开源模型可能会有安全风险,包括恶意 代码注入、数据泄露以及恶意行为者可以利用的安全漏洞。11闭源软件另一方面允许开发者确保源代码的安全性和控制权。 开源还