AI智能总结
厦门大学大数据教学团队作品2025年2月9日 厦门大学大数据教学团队 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人:林子雨副教授年轻力量:核心成员全部46周岁以下结构合理:教学型、科研型、实验工程师专注专业:从2013年至今,11年专注于大数据教学团队特点:眼光前瞻、紧跟技术、创新实干、执行力强影响力高:多项指标在国内高校大数据教学领域领先•教材数量•教材占有率•MOOC课程学习人数•师资培养•教学研讨会•教学网站访问量•在线讲座观看人数•…… 团队负责人林子雨 厦门大学计算机科学与技术系副教授 以第一作者编著出版15本大数据系列教材被国内1000余所高校采用荣获“2022年福建省高等教育教学成果奖特等奖(个人排名第一)”入选“2021年高校计算机专业优秀教师奖励计划”2018年国家精品在线开放课程(独立主讲)2020年国家级线上一流本科课程(独立主讲)2021年国家级线上一流本科课程(独立主讲)入选“2023年教育部国家智慧教育公共服务平台应用典型案例”个人主页:https://dblab.xmu.edu.cn/post/linziyu/ 本PPT节选自林子雨编著《数字素养通识教程》 林子雨编著《数字素养通识教程——大数据与人工智能时代的计算机通识教育》人民邮电出版社,2025年1月ISBN:978-7-115-65946-0定价:59.8元 面向大一新生的全校大学计算机公共课教材 教材官网: https://dblab.xmu.edu.cn/post/digital-literacy/教材官网提供讲义PPT、MOOC视频、案例视频、上机实验、教学大纲、课程思政案例、开学第一课讲座PPT等丰富的教学资源 《数字素养通识教程》 林 子 雨 编 著 《数 字 素 养 通 识 教 程— —大 数 据 与 人 工 智 能 时 代 的 计 算 机 通 识 教 育 》 人民邮电出版社ISBN:978-7-115-65946-0 2025年1月第1版,定价:59.8元 教 材 官 网 :h t t p s : / / d b l a b . x m u . e d u . c n / p o s t / d i g i t a l - l i t e r a c y / 15年计算机教学生涯感悟升华,15本计算机畅销教材知识凝练数字时代的大学计算机公共课教材,重构大学计算机公共课知识体系深刻变革传统大学计算机通识教育,培养学生计算思维、数据思维和AI思维 《数字素养通识教程》 到B站观看林子雨主讲《数字素养通识教程》MOOC视频(1359分钟)视频地址:https://www.bilibili.com/video/BV1XPf8YZE6M/ 引言 在数字化浪潮汹涌澎湃的当下,大模型如同一颗璀璨新星,强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用,大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破,更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本报告《大模型概念、技术与应用实践》将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。 目录 1.人工智能发展简史2.人工智能思维3.大模型:人工智能的前沿4.AIGC应用与实践 1.人工智能发展简史 1.1图灵测试1.2人工智能的诞生1.3人工智能的发展阶段1.4未来人工智能发展的五个阶段 1.1图灵测试 1950年,“计算机之父”和“人工智能之父”艾伦·图灵(Alan M. Turing)发表了论文《计算机器与智能》,这篇论文被誉为人工智能科学的开山之作。在论文的开篇,图灵提出了一个引人深思的问题:“机器能思考吗?”。这个问题激发了人们无尽的想象,同时也奠定了人工智能的基本概念和雏形 在这篇论文中,图灵提出了鉴别机器是否具有智能的方法,这就是人工智能领域著名的“图灵测试”。如图所示,其基本思想是测试者在与被测试者(一个人和一台机器)隔离的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果被测试者机器让平均每个测试者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能 1.2人工智能的诞生 人工智能的诞生可以追溯到20世纪50年代。当时,计算机科学刚刚起步,人们开始尝试通过计算机程序来模拟人类的思维和行为。在这个背景下,一些杰出的科学家和工程师们开始研究如何使计算机具备更高级的功能 1956年8月,在美国达特茅斯学院举办的人工智能夏季研讨会,是人工智能领域具有里程碑意义的一次重要会议。这次会议汇聚了众多杰出的科学家和工程师,他们共同探讨和研究人工智能的发展和应用前景 这次会议的主题围绕着人工智能的定义、研究方法和应用场景展开。与会者们深入探讨了人工智能的基本概念、算法和技术,以及其在各个领域的应用潜力。他们共同认识到,人工智能的研究和发展将为人类带来巨大的变革和进步 1.2人工智能的诞生 在这次会议上,“人工智能”这个词汇被约翰.麦卡锡(John McCarthy)首次提出。与会者们不仅对人工智能的研究和应用前景进行了深入探讨,还提出了许多重要的观点和思路,为人工智能的发展奠定了基础。这次会议的召开标志着人工智能作为一个独立学科的正式诞生,因此,达特茅斯会议被称为“人工智能的开端”,1956年也被称为“人工智能元年”。这次会议不仅为人工智能的研究和发展奠定了基础,还为人类带来了巨大的变革和进步 1.3人工智能的发展阶段 从1956年人工智能元年至今,人工智能的发展历程经历了漫长的岁月,大致可以划分为以下6个阶段 1.4未来人工智能发展5个阶段 2.人工智能思维 2.人工智能思维 拥有和人工智能协作的能力,懂得如何运用人工智能 每个人都应了解人工智能的基础运行模式 具备区分人的能力和机器的能力 3.大模型:人工智能的前沿 3.7大模型分类3.8大模型应用领域(在各个行业的应用)3.9大模型对工作和生活的影响3.10本地部署大模型3.11基于大模型的智能体 3.1大模型的概念3.2大模型的发展历程3.3人工智能与大模型的关系3.4大模型产品3.5大模型原理3.6大模型特点 3.1大模型的概念 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型 通常说的大模型的“大”的特点体现在:参数数量庞大、训练数据量大、计算资源需求高 2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿,2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6模型的参数量达10万亿 3.1大模型的概念 大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力 学习能力强 语言生成能力 上下文理解能力 可迁移性高 大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色 大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题 学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练 大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答 3.2大模型的发展历程 大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期 3.2大模型的发展历程 n萌芽期(1950-2005) 这是一个以CNN(Convolutional Neural Networks,卷积神经网络) 为代表的传统神经网络模型阶段 n1956年,从计算机专家约翰·麦卡锡提出“人工智能”概念开始,AI发展由最开始基于小规模专家知识逐步发展为基于机器学习 n1980年,卷积神经网络的雏形CNN诞生 n1998年,现代卷积神经网络的基本结构LeNet-5诞生,机器学习方法由早期基于浅层机器学习的模型,变为了基于深度学习的模型,为自然语言生成、计算机视觉等领域的深入研究奠定了基础,对后续深度学习框架的迭代及大模型发展具有开创性的意义 3.2大模型的发展历程 n沉淀期(2006-2019) 这是一个以Transformer为代表的全新神经网络模型阶段 2013年,自然语言处理模型Word2Vec诞生,首次提出将单词转换为向量的“词向量模型”,以便计算机更好地理解和处理文本数据。 2014年,被誉为21世纪最强大算法模型之一的GAN(GenerativeAdversarial Networks,对抗式生成网络)诞生,标志着深度学习进入了生成模型研究的新阶段 2017年,Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础 2018年,OpenAI基于Transformer架构发布了GPT-1大模型,意味着预训练大模型成为自然语言处理领域的主流,其中,GPT的英文全称是Generative Pre-Trained Transformer,是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型 2019年,OpenAI发布了GPT-2 3.2大模型的发展历程 n爆发期(2020-至今) 这是一个以GPT为代表的预训练大模型阶段 2020年6月,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿,成为当时最大的语言模型,并且在零样本学习任务上实现了巨大性能提升。随后,更多策略如基于人类反馈的强化学习(RLHF,ReinforcementLearning from Human Feedback)、代码预训练、指令微调等开始出现,被用于进一步提高推理能力和任务泛化 2022年11月,搭载了GPT3.5的ChatGPT(Chat Generative Pre-trainedTransformer)横空出世,凭借逼真的自然语言交互与多场景内容生成能力,迅速引爆互联网,在全球范围内引起轰动,使得大模型的概念迅速进入普通大众的视野。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务 3.2大模型的发展历程 n爆发期(2020-至今) OpenAI在2023年3月发布了GPT-4,它是一个多模态大模型(接受图像和文本输入,生成文本)。相比上一代的GPT-3,GPT-4可以更准确地解决难题,具有更广泛的常识和解决问题的能力。2023年12月,谷歌发布大模型Gemini,它可以同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。2024年12月,DeepSeek迅速崛起,震撼全球,使得人工智能进入“普惠”时代 3.3人工智能与大模型的关系 人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品 3.4大模型产品 3.