您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[厦门大学大数据教学团队]:DeepSeek大模型赋能政府数字化转型 - 发现报告

DeepSeek大模型赋能政府数字化转型

AI智能总结
查看更多
DeepSeek大模型赋能政府数字化转型

DeepSeek大模型赋能政府数字化转型 厦门大学 厦门大学大数据教学团队作品2025年3月9日 厦门大学大数据教学团队 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人:林子雨副教授年轻力量:核心成员全部46周岁以下结构合理:教学型、科研型、实验工程师专注专业:从2013年至今,11年专注于大数据教学团队特点:眼光前瞻、紧跟技术、创新实干、执行力强影响力高:多项指标在国内高校大数据教学领域领先•教材数量•教材占有率•MOOC课程学习人数•师资培养•教学研讨会•教学网站访问量•在线讲座观看人数•…… 团队联系方式:ziyulin@xmu.edu.cn 大模型系列报告(科普报告,非技术报告) n报告1:大模型概念、技术与应用实践(面向社会大众)n报告2:DeepSeek大模型赋能高校教学和科研(面向高校)n报告3:DeepSeek大模型及其企业应用实践(面向企业)n报告4:DeepSeek大模型赋能政府数字化转型(面向政府部门) 报告下载地址:https://dblab.xmu.edu.cn/post/deepseek/ 目录 1.大模型:人工智能的前沿2.大模型产品3.大模型的行业应用4.政府部门本地部署大模型5. DeepSeek大模型在政务服务领域的应用6. DeepSeek大模型在政府工作中的应用7.智能体的政务应用8. AIGC与政府应用实践 厦门大学大数据教学团队作品 1.大模型:人工智能的前沿 1.1大模型的概念1.2大模型的发展历程1.3人工智能与大模型的关系1.4大模型分类 1.1大模型的概念 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型 通常说的大模型的“大”的特点体现在: 参数数量庞大 训练数据量大 2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿 1.1大模型的概念 大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力 学习能力强 语言生成能力 上下文理解能力 可迁移性高 大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加出色 大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题 学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练 大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答 1.2大模型的发展历程 大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期 1.2大模型的发展历程 1.2大模型的发展历程 1.3人工智能与大模型的关系 人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品 1.4大模型的分类 语言大模型 多模态大模型 视觉大模型 是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAI)、悟空画画(华为)、midjourney等 是指在计算机视觉(Computer Vision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古CV、INTERN(商汤)等 是 指 在 自 然 语 言 处 理 (N a t u r a l L a n g u a g eProcessing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard(Google)、DeepSeek、文心一言(百度)等 1.4大模型的分类 按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级 通用大模型L0 行业大模型L1 垂直大模型L2 是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育” 是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度,相当于AI成为“行业专家” 是指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效果 1.4大模型的分类 大语言模型可以分为通用大模型和推理大模型 推理模型的核心 推理大模型 OpenAI定义推理模型 在OpenAI的官网上,OpenAI定义推理模型是在回答之前进行思考,并在回复用户之前,在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前,先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样 也就是说,如果模型在回复你之前有一长串的思考过程(这个过程必须可以显示输出),探索了很多不同的路径之后给出答案,那么有这个能力的大模型就是推理大模型。推理模型的核心在于处理那些需要多步骤逻辑推导才能解决的复杂问题 推理大模型的概念大规模传播应该开始于2024年9月份2024年9月12日,OpenAI官方宣布了OpenAI o1推理大模型 1.4大模型的分类 Sebastian Raschka博士(Lightning AI的首席教育学家):将“推理”定义为通过生成中间步骤来回答复杂问题的过程2个简单的例子: 非 推 理 问 题 : ”法 国 的 首 都 是 哪 里 ?”( 答 案 直 接 、 无 需 推 导 ) 推理问题: ”一列火车以每小时60英里的速度行驶3小时,行驶距离是多少?”(需先理解”距离=速度×时间”的关系,再分步计算) 通用的大语言模型(LLM)可能直接输出简短答案(如”180英里”) 推理模型的特点在于显式展示中间推导过程 1.4大模型的分类 在应用方面二者各有擅长的领域,而不是简单的谁强谁弱问题 n如果你需要完成数据分析、逻辑推理、代码生成等逻辑性较强且较为复杂的任务,请选择推理大模型n如果你面临创意写作、文本生成、意图识别等发散性较强且较为创意多样的任务,请选择通用大模型 2.大模型产品 2.1国外的大模型产品2.2国内的大模型产品2.3主流大模型“幻觉”评测 2.1国外的大模型产品 nChatGPT ChatGPT是一种由OpenAI训练的大语言模型。它是基于Transformer架构,经过大量文本数据训练而成,能够生成自然、流畅的语言,并具备回答问题、生成文本、语言翻译等多种功能 ChatGPT的应用范围广泛,可以用于客服、问答系统、对话生成、文本生成等领域。它能够理解人类语言,并能够回答各种问题,提供相关的知识和信息。与其他聊天机器人相比,ChatGPT具备更强的语言理解和生成能力,能够更自然地与人类交流,并且能够更好地适应不同的领域和场景。ChatGPT的训练数据来自互联网上的大量文本,因此,它能够涵盖多种语言风格和文化背景 2.1国外的大模型产品 nGemini Gemini是谷歌发布的大模型,它能够同时处理多种类型的数据和任务,覆盖文本、图像、音频、视频等多个领域。Gemini采用了全新的架构,将多模态编码器和多模态解码器两个主要组件结合在一起,以提供最佳结果 Gemini包括三种不同规模的模型:Gemini Ultra、Gemini Pro和Gemini Nano,适用于不同任务和设备。2023年12月6日,Gemini的初始版本已在Bard中提供,开发人员版本可通过Google Cloud的API获得。Gemini可以应用于Bard和Pixel 8Pro智能手机。Gemini的应用范围广泛,包括问题回答、摘要生成、翻译、字幕生成、情感分析等任务。然而,由于其复杂性和黑箱性质,Gemini的可解释性仍然是一个挑战 2.1国外的大模型产品 nSora 2024年2月16日,OpenAI再次震撼全球科技界,发布了名为Sora的文本生成视频大模型,只需输入文本就能自动生成视频。这一技术的诞生,不仅标志着人工智能在视频生成领域的重大突破,更引发了关于人工智能发展对人类未来影响的深刻思考。随着Sora的发布,人工智能似乎正式踏入了通用人工智能(AGI:Artificial General Intelligence)的时代。AGI是指能够像人类一样进行各种智能活动的机器智能,包括理解语言、识别图像、进行复杂推理等。Sora大模型能够直接输出长达60秒的视频,并且视频中包含了高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这种能力已经超越了简单的图像或文本生成,开始触及到视频这一更加复杂和动态的媒介。这意味着人工智能不仅在处理静态信息上越来越强大,而且在动态内容的创造上也展现出了惊人的潜力 2.1国外的大模型产品 nSora 右图是Sora根据文本自动生成的视频画面,一位戴着墨镜、穿着皮衣的时尚女子走在雨后夜晚的东京市区街道上,抹了鲜艳唇彩的唇角微微翘起,即便带着墨镜也能看到她的微笑,地面的积水映出了她的身影和灯红酒绿的霓虹灯,热闹非凡的唐人街正在进行舞龙表演,熙熙攘攘的人群目光都聚焦在跃动的彩龙身上,整个环境的喜庆氛围仿佛令人身临其境 2.1国外的大模型产品 nOpenAI o3 2024年12月20日,OpenAI发布推理模型o3,无论在软件工程、编写代码,还是竞赛数学、掌握人类博士级别的自然科学知识能力方面,o3都达到了很高的水平 2.2国内的大模型产品 2.2国内的大模型产品 nDeepSeek(深度求索) 2024年12月26日,杭州一家名为“深度求索”(DeepSeek)的中国初创公司,发布了全新一代大模型DeepSeek-V3。在多个基准测试中,DeepSeek-V3的性能均超越了其他开源模型,甚至与顶尖的闭源大模型GPT-4o不相上下,尤其在数学推理上,DeepSeek-V3更是遥遥领先。DeepSeek-V3以多项开创性技术,大幅提升了模型的性能和训练效率。DeepSeek-V3在性能比肩GPT-4o的同时,研发却只花了558万美元,训练成本不到后者的二十分之一。因为表现太过优越,DeepSeek在硅谷被誉为“来自东方的神秘力量”。 2025年1月20日,DeepSeek-R1正式发布,拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。 2.2国内的大模型产品 n通义千问 通义千问是阿里云推出的一个超大规模的语言模型,它具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持的能力。通义千问这个名字有“通义”和“千问”两