行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

人工智能词典，第1部分：基础知识

信息技术 2025-06-01 美国银行邵泽

人工智能基础知识

核心概念

人工智能（AI）是指使计算机和机器能够模拟人类学习、理解、解决问题、决策、创造和自主性的技术。AI 使用复杂的算法来处理、学习和制定解决方案，利用数据模拟人类大脑的输入、处理和决策过程。AI 工具的开发需要先 curated 大型数据集，然后设计适合特定用例的 AI 算法或模型（称为训练），最后将数据输入模型以获取洞察和结论（称为推理）。

AI 发展阶段

AI 领域于 1956 年被确认为一个学术学科，但由于计算能力限制，基于 AI 的应用直到几十年后才商业化。目前，关键的 AI 技术包括机器学习（ML）、深度学习（DL）和自然语言处理（NLP）。AI 正在从生成式阶段向代理式、物理式、科学式和通用式阶段发展，这些阶段需要不断增加的基础设施支持。

生成式 AI

生成式 AI 是一种能够根据用户提示或请求创建文本、图像、视频、音频或软件的 AI 类型。它使用深度学习模型模拟人脑的学习过程，通过识别数据集中的模式和关系来创建新内容。ChatGPT 的发布使生成式 AI 广受欢迎，其应用包括内容生成、数据提取、文本摘要、优化网络浏览器、语言翻译和计算机编程等。

深度学习

深度学习是机器学习的一个子集，使用受大脑结构和功能启发的算法，即人工神经网络。神经网络由多个处理数据的“层”组成，每个层由相互连接的节点组成，每个节点都在前一层的基础上完善和优化模型预测。深度学习模型比机器学习模型具有更多层，允许模型获取更多概念，并能识别难以发现的数据关系。

神经网络的三种特征

架构：指定网络中涉及的变量及其关系。
活动规则：定义神经元如何相互响应。
学习规则：定义神经网络的权重随时间如何变化。

神经网络的类型

卷积神经网络（CNN）：用于图像处理问题，如分类和对象识别。
循环神经网络（RNN）：可以处理和预测序列数据。
生成对抗网络（GAN）：使用两个子网络自动训练模型，一个用于区分真实和生成数据，另一个用于生成模仿实际数据的图像。
Transformer 模型：应用数学方法来理解序列数据之间的关系，可用于实时文本/语音翻译以及理解 DNA 中遗传序列的模式/关系。

基础模型

基础模型是深度学习模型，在广泛的一般化和未标记的数据上进行训练，可以执行各种一般任务，如理解和对话自然语言、回答问题以及生成文本和图像。大型语言模型（LLM）是基础模型的一种，专注于自然语言处理。

大型语言模型

大型语言模型是生成式 AI 基础模型，能够识别、理解、预测和生成文本。它们通过在大量文本数据上进行训练来理解人类语言，并生成新的文本内容。LLM 的应用包括内容生成、数据提取、文本摘要、优化网络浏览器、语言翻译和计算机编程等。

机器学习

机器学习是一种 AI，允许程序在没有特定编程的情况下解决复杂问题。机器学习模型通过在大量数据集上进行训练来学习人类文本语言的模式，并预测下一个可能出现的单词。机器学习的关键操作是特征值选择，即输入到机器学习过程中的数据项，其准确性受选择和确定这些特征的方法的影响。

自然语言处理

自然语言处理是 AI 的一个领域，使机器能够理解人类语言，包括俚语、缩写和发音，并生成类似人类的文本。NLP 应用不同的算法来识别和提取自然语言规则，将非结构化语言数据转换为计算机可以解释的形式。NLP 是分析文本和语音数据的完整和高效的关键工具，也是生成式 AI 理解和解释人类语言以生成新内容的基础。

开源与闭源模型

开源模型：软件发布在许可证下，允许用户免费使用、研究、修改和分发软件及其源代码。开源模型公开且免费，开发者可以使用它们创建各种应用程序。
闭源模型：专有系统，其源代码不公开。开源模型允许任何人访问和修改模型，从而比闭源模型具有更高的透明度和协作性，最终实现 AI 模型的民主化。

小型语言模型

小型语言模型（SLM）是生成式 AI 模型，能够理解和生成自然语言。它们比大型语言模型更小，参数大小从几百万到几亿不等，而大型语言模型有几百亿甚至几千亿个参数。SLM 通常比 LLM 更高效，需要更少的内存和计算能力，更适合边缘环境、移动应用程序或离线 AI 推理。SLM 的性能在常识推理、问题解决和数学方面正在改进，缩小了 LLM 在一般推理任务中的差距。

SLM 通过知识蒸馏、剪枝和量化实现其较小的尺寸和效率。知识蒸馏将预训练 LLM 的知识转移到较小的模型，剪枝去除不太有用的参数，量化将高精度数据的权重转换为低精度数据，减少表示信息所需的位数。

人工智能词典，第一部分：基础要点 •人工智能（AI）使计算机和机器能够模拟人类学习、理解、解决问题、决策、创造力和自主性。但就在我们认为已经搞清楚它是什么的时候，AI 又重写了规则。 •创新的步伐正在飞速加快，以至于我们中的许多人难以跟上。而对于那些试图了解的非专家来说，语言和概念可能会让人感到困惑。这个三部分的“词典”系列是为了帮助定义关键术语，并提供关于人工智能——迄今为止最大的一场革命——你需要知道的一切。 •这一部分涵盖了AI基础知识 - 从探索当今广泛使用的常见AI类型，到讨论关键AI技术，包括机器学习、深度学习和自然语言处理。人工智能它是什么？人工智能（AI）是使计算机和机器能够模拟人类学习、理解、解决问题、决策、创造力和自主性的技术。 1它利用复杂的算法，通过数据来处理、学习并制定解决方案，模拟人脑摄入数据、处理数据并从中汲取信息以做出决策的过程。在构建人工智能计算工具时，首先必须精心策划海量数据集，然后设计人工智能算法或模型以适配特定应用场景（这一步骤称为训练）。最后，将处理后的数据输入模型以提取洞见和结论（这一步骤称为推理）。人工智能的历史发展：生成式、具身式…… 人工智能领域于1956年被认可为一个学术学科。然而，基于人工智能的应用要实现商业化需要数十年的时间，这主要是由于运行这些模型所需的计算能力有限。如今，一些关键的AI技术包括机器学习（ML）、深度学习（DL）和自然语言处理（NLP）。生成式人工智能（见下文）自ChatGPT发布以来获得了显著的人气。但人工智能的阶段现在正从生成式向 agent（智能体）、物理、科学和通用演变，需要不断增加的基础设施来支持它们（图1）。如今，人工智能可以识别物体、理解自然语言，并执行物理任务（通过机器人）。图1：人工智能的阶段正从生成式发展到智能体、物理、科学以及通用人工智能，所有这些都需要日益增多的基础设施来支持它们阐示人工智能的七个阶段生成式人工智能它是什么？生成式人工智能是一种能够根据用户提示或请求生成文本、图像、视频、音频或软件等内容的AI类型。2它使用模拟人脑学习的深度学习（DL）模型。这些模型识别用于“训练”它们的数据库中的模式和关系，并使用这些信息来创建新内容。相比之下，传统人工智能系统被设计用来识别模式并做出预测。向多模态转变最初的语言模型的研发和部署是针对基于文本的应用；然而，这项技术现在正被应用到范围更广的一组形式中，包括数字、图像、视频、音乐和编码。随着人工智能的能力和熟练程度提高，多种技术的组合可以逐渐应用于更具挑战性的领域，例如编程、艺术和科学（例如药物发现或基因分析）。用例：驱动收入提升和/或运营效率鉴于生成式AI具有广泛的应用场景，它可以嵌入到许多行业，并且其日益增长的应用可以帮助推动收入增长和/或运营效率。为了推动收入增长，AI可以集成到传统和新产品中，例如机器人、自动驾驶汽车或网络安全。AI战略还可以通过优化流程和降低人工成本来提高企业效率和生产力。例如，生成式AI可用于记笔记、编程、创建营销材料、人力资源申请筛选、客户反馈分析、供应链优化和数据库查询。美國銀行全球研究部認為，生成式人工智能的推出是下一個主要科技周期的開端，接踵而至的是1981年個人電腦（PC）的問世和1994年的互聯網。它是在80年的進步基礎上誕生的，這些進步生產了更強大的芯片和新的神經網絡架構，從而縮短了訓練越來越大的基礎模型的時間和成本。因此，生成式人工智能應用程式可以普及對強大計算智能的訪問權，並在未來一至三年內推動企業效率和生產力的范式轉變。 ChatGPT的兴起生成式人工智能自2022年11月发布ChatGPT以来广受欢迎——这是首个向大众公开的聊天机器人。此前，人工智能能够读写，但不能内容。然而，像理解 ChatGPT利用机器学习（ML）和自然语言处理（NLP）改变了这一点，为各种各样的目的创建类似人类的对话响应和内容。自2022年以来，已引入了额外的聊天机器人平台，并且获得了流行。如今，除了文本到文本模型之外，现在还有文本到图像和文本到视频模型。应用场景包括内容生成（例如，写论文、新闻文章、社交媒体帖子、营销内容、故事、音乐、电子邮件等）、数据提取、文本摘要、优化网络浏览器、语言翻译和计算机编程。事实上，程序员们已经使用这项技术进行程序生成或解释代码或概念。深度学习它是什么？深度学习（DL）是机器学习（ML）的一个子集，它使用受大脑功能和结构启发的算法，称为人工神经网络。神经网络由“层”——即数据处理的各个阶段组成。这些层由相互连接的节点组成，每个节点都建立在前一层的基础上，以优化和改进模型的3 相应地，互联的节点（或神经元，如同人脑中的那样）将输入数据转换为抽象和预测。有意义的表示。这种结构允许它在原始数据中提取的模式具有更高的精度。深度学习有比机器学习更多的层，这允许模型获取更多的概念传统机器学习模型使用一层或两层的简单神经网络，而深度学习模型则至少使用三层，但通常使用数百层或数千层来训练模型。通过将数据输入具有多层结构的深度学习系统中，每一层都会增加数据抽象度，这使得计算机系统能够获取先前使用机器学习模型无法实现的概念。 DL的强大之处体现在系统能够确认难以识别的额外数据关系。经过充分训练后，算法网络持续改进预测或解释。用于需要模式识别的复杂系统的深度学习模型然而，深度学习可能用于需要模式识别的更复杂的系统，例如图像识别、自动驾驶汽车和语音控制的虚拟助手。 6事实上，DL是自动驾驶程序中算法背后的技术，在某些情况下可以检测驾驶员眨眼的速率，并从这些数据中推断出他们有睡着的风险，从而提醒他们和/或停止车辆。神经网络的三个特性每个神经网络都可以用三个属性来描述：1)建筑规定了网络中涉及的变量以及它们之间的关系。在神经网络中，它可以是“神经元”（相互连接的节点）的权重和活动；2）活动规则定义了神经元活动如何相互响应；以及3)学习规则定义了神经网络权重随时间的变化。多种神经网络构成了生成式AI模型的基础，包括以下： •卷积神经网络(CNNs)用于图像处理问题，例如分类和目标识别。应用案例包括人脸检测、面部表情检测、目标检测和文档分类。 •循环神经网络(RNNs) 可以处理和预测序列数据。传统神经网络是前馈网络，无法处理序列数据（如句子）。应用场景包括自动更正、欺诈检测和分析。 •生成对抗网络(GANs) 使用两个子网络来自动训练一个模型。一个是区分真实数据和生成数据的判别器模型。另一个是生成器模型（通常是CNN），用于生成旨在模仿真实数据的图像，其中每个数据输入都发送到判别器模型。随着模型扩展和学习，生成的输出将越来越接近真实数据。使用GANs的生成式人工智能模型的示例包括图像生成器。 •Transformer模型应用数学方法来理解序列数据（例如，构成句子的单词）之间的关系。它们接收一系列输入并生成可理解输出。这些模型可用于实时文本/语音翻译，以及理解DNA中基因序列的模式/关系。基础模型他们是什么？基础模型（FM）是一种深度学习（DL）模型，在广泛谱系的泛化无标记数据上进行训练，能够执行多种通用任务（例如，理解和用自然语言对话、回答问题以及生成文本和图像）（图2）。7 大型语言模型（LLMs）是一种流行的基础模型，专注于自然语言处理（或，NLP，理解和交流人类语言）。更通用型与为特定任务创建的机器学习模型因子机（FMs）与传统机器学习（ML）模型不同，因为传统ML模型通常执行特定任务，例如情感分析、图像分类或趋势预测。然而，由于因子机的规模和通用性，它们可以作为更专业化的下游应用的基模型。这是通过在某个行业或领域内的技术数据上训练FM来实现的。大型语言模型他们是什么？大型语言模型（LLMs）是生成式人工智能基础模型（FMs），能够识别、理解、预测和生成文本，因为它们是为自然语言处理（NLP）任务而设计的。基础模型（FMs）是在大型数据集上训练的深度学习（DL）模型，能够执行各种通用任务。它们可以作为开发更专业化的下游应用的基础。LLMs是专门在语言数据上训练的，这使得它们能够理解和生成自然语言。8 人工智能大语言模型革命加速了工业5.0的采用，后者强调人机协同，如人工智能驱动的机器人，以优化工作流程。我们现在看到人工智能融入到我们生活的方方面面，并对自动化流程进行“人性化”。这正推动社会从人性化时代（工业5.0）迈向工业6.0，后者旨在通过创建基于下一代技术的全面集成、智能制造系统来最小化人工干预（附录3）。更通用型与传统为特定任务创建的机器学习模型 LLMs的规模和通用性质将它们与传统机器学习（ML）模型区分开来。传统ML模型通常可以执行特定任务，例如文本的情感分析、图像分类和趋势预测。LLMs在大量文本数据集上进行训练，可以像训练数据一样生成文本。这是通过为单词序列分配概率分布来完成的。LLMs可以大规模地生成代码和全新内容，总结内容，检索信息，分析情感和翻译语言。机器学习它是什么？机器学习（ML）是一种人工智能，它允许程序在没有被专门编程的情况下解决复杂问题（图4）。通过对大量句子和消息数据集进行训练，该算法“学习”人类文本语言的规律，然后“预测”接下来可能出现的词语（例如，搜索引擎预测用户可能想输入的下一个词语）。通常情况下，使用机器学习，如果数据类型相同，那么增加数据量将提高输出结果的准确性。选择数据输入是提高模型性能的关键目前还没有一种机器学习（ML）方法能够针对任何问题或任何类型的数据提供最准确的响应。而且，虽然机器学习（ML）主要有三个阶段：数据准备、模型训练和开发，以及模型部署（图5），但在应用机器学习（ML）时，特征值选择是最重要的操作之一。特征是输入到机器学习（ML）过程中的数据项，选择和确定这些特征的方怯对机器学习的准确性影响很大。还需要注意的是，机器学习（ML）无法响应尚未学习到的事件。如果系统被强制学习非常规事件，那么这将降低在正常条件下的识别准确性。深度学习可以独立识别这些数据输入然而，深度学习（DL），一种机器学习（ML）技术，允许计算机能够1）独立识别这些特征值，2）自行生成程序。这些方面代表了机器学习的突破。为什么呢？因为传统的机器学习更依赖于人工干预来学习——人类确定特征集以理解数据输入之间的差异，这通常需要更结构化的数据来学习。自然语言处理它是什么？自然语言处理（NLP）是人工智能领域的一个分支，使机器能够理解人类语言，包括俚语、缩写和发音，并进而生成类似人类的文本。NLP应用不同的算法来识别和提取自然语言规则，将非结构化的语言数据转换为计算机可以解释的形式。NLP是全面高效分析文本和语音数据的关键工具。使生成式人工智能能够理解人类语言，进而生成新内容自然语言处理已经是我们日常生活的一部分——为搜索引擎、翻译应用程序、电子邮件服务的垃圾邮件过滤器、情感分析、聊天机器人和数字助理提供支持。生成式人工智能使用自然语言处理来理解和解释人类语言，使其能够生成新内容。开源与闭源他们是什么？开源指的是在许可证下发布的软件，该许可证授予用户免费使用、学习、修改和分发软件及其源代码的权利。因此，开源模型是公开且免费可访问的模型，开发者可以使用它们来创建各种应用程序。另一方面，闭源模型是专有系统，其源代码不会公开提供。将访问AI模型民主化，更高的透明度和协作开源模型允许任何人访问和修改模型，与闭源相比，这带来了更高的透明度和协作性，最终实现了人工智能模型使用和访问的民主化。根据人工智能专家的说法，开源模型可以在公司自己的设备上本地运行，无需模型开发或培训成本，只需推理成本，因此可以大大降低访问成本。10 然而，开源模型可能会有安全风险，包括恶意代码注入、数据泄露以及恶意行为者可以利用的安全漏洞。11闭源软件另一方面允许开发者确保源代码的安全性和控制权。开源还

点击免费查看完整报告

人工智能词典，第1部分：基础知识

人工智能基础知识

核心概念

AI 发展阶段

生成式 AI

深度学习

神经网络的三种特征

神经网络的类型

基础模型

大型语言模型

机器学习

自然语言处理

开源与闭源模型

小型语言模型

你可能感兴趣

人工智能词典，第3部分：资源和风险

人工智能词典，第二部分：下一代

欧盟人工智能法案法律深度探讨第1部分：医疗技术可以期待什么，什么时候？

第1部分：主要发现探索范围3会计和过渡财务的人工智能（英）

第3部分：应用实例探索范围3会计和过渡财务的人工智能（英）

第2部分：技术报告探索范围3会计和过渡财务的人工智能（英）

智能工厂建设导则第1部分：物理工厂智能化系统

【政策综述】关于国家标准《电动汽车能量消耗量和续驶里程试验方法第1部分：轻型汽车》（征求意见稿）的...

面向数据驱动营销人员的身份购买者指南：第 1 部分

全球野火/草原火灾与个人险种保险 - 第1部分：影响与机遇

人工智能词典，第1部分：基础知识

你可能感兴趣

人工智能词典，第3部分：资源和风险

人工智能词典，第二部分：下一代

欧盟人工智能法案法律深度探讨第1部分：医疗技术可以期待什么，什么时候？

第1部分：主要发现探索范围3会计和过渡财务的人工智能（英）

第3部分：应用实例探索范围3会计和过渡财务的人工智能（英）

第2部分：技术报告探索范围3会计和过渡财务的人工智能（英）

智能工厂建设导则第1部分：物理工厂智能化系统

【政策综述】关于国家标准《电动汽车能量消耗量和续驶里程试验方法 第1部分：轻型汽车》（征求意见稿）的...

面向数据驱动营销人员的身份购买者指南 ： 第 1 部分

全球野火/草原火灾与个人险种保险 - 第1部分：影响与机遇

【政策综述】关于国家标准《电动汽车能量消耗量和续驶里程试验方法第1部分：轻型汽车》（征求意见稿）的...

面向数据驱动营销人员的身份购买者指南：第 1 部分