您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[厦门大学]:2025年DeepSeek大模型及其企业应用实践报告-每个人都可以读懂的大模型科普报告(企业篇) - 发现报告
当前位置:首页/行业研究/报告详情/

2025年DeepSeek大模型及其企业应用实践报告-每个人都可以读懂的大模型科普报告(企业篇)

AI智能总结
查看更多
2025年DeepSeek大模型及其企业应用实践报告-每个人都可以读懂的大模型科普报告(企业篇)

DeepSeek 每个人都可以读懂的大模型科普报告(企业篇) DeepSeek大模型及其企业应用实践 林子雨副教授 厦门大学 厦门大学大数据教学团队作品2025年3月3日 厦门大学大数据教学团队 国内高校大数据教学的重要贡献者 团队负责人:林子雨副教授 年轻力量:核心成员全部46周岁以下 结构合理:教学型、科研型、实验工程师 专注专业:从2013年至今,11年专注于大数据教学 团队特点:眼光前瞻、紧跟技术、创新实干、执行力强影响力高:多项指标在国内高校大数据教学领域领先 教材数量 教材占有率 MOOC课程学习人数 师资培养 教学研讨会 教学网站访问量 在线讲座观看人数 团队联系方式:ziyulinxmueducn 目录 1大模型:人工智能的前沿 2大模型产品 3大模型的行业应用 4企业大模型落地方案 5智能体的企业应用 6厂商提供的企业级大模型服务 7大模型典型应用案例 8AIGC与企业应用实践 9大模型未来发展趋势 厦门大学大数据教学团队作品 1大模型:人工智能的前沿 11大模型的概念 12大模型的发展历程 13人工智能与大模型的关系 14大模型分类 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。 通常说的大模型的“大”的特点体现在: 参数数量庞大 训练数据量大 计算资源需求高 2020年,OpenAI公司推出了GPT3,模型参数规模达到了1750亿。 2023年3月发布的GPT4的参数规模是GPT3的10倍以上,达到18万亿, 2021年11月阿里推出的M6模型的参数量达10万亿。 大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力 上下文理解能力 大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答 语言生成能力 大模型可以生成更自然、更流利的语言,减少了生成输时呈现的错误或令人困惑的问题 学习能力强 大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和应对新的场景时表现更加色 可迁移性高 学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练 12大模型的发展历程 大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期 12大模型的发展历程 12大模型的发展历程 大模型发展对算力的需求演变 人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品 人工智能 机器学习 深度学习 深度学习模型 预训练模型 预训练大模型深预度训学练习 大语言模型 ChatGPT文心一言 预训练大语言模型 GPT 文心ERNIE 语言大模型视觉大模型多模态大模型 是指在自然语言处理(NaturalLanguageProcessing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard (Google)、DeepSeek、文心一言(百度)等 是指在计算机视觉(ComputerVision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古CV、INTERN(商汤)等 是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。代表性产品包括DingoDB多模向量数据库(九章云极DataCanvas)、DALLEOpenAI、悟空画画(华为)、midjourney等 按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级 通用大模型L0 行业大模型L1 垂直大模型L2 是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育” 是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度,相当于AI成为“行业专家” 是指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效果 大语言模型可以分为通用大模型和推理大模型 推理大模型 推理大模型的概念大规模传播应该开始于2024年9月份。2024年9月12日,OpenAI官方宣布了OpenAIo1推理大模型。 OpenAI定义推理模型 在OpenAI的官网上,OpenAI定义推理模型是在回答之前进行思考,并在回复用户之前,在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前,先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。 推理模型的核心 也就是说,如果模型在回复你之前有一长串的思考过程(这个过程必须可以显示输出),探索了很多不同的路径之后给出答案,那么有这个能力的大模型就是推理大模型。推理模型的核心在于处理那些需要多步骤逻辑推导才能解决的复杂问题。 推理大模型DeepSeekR1的对话效果 SebastianRaschka博士(LightningAI的首席教育学家): 将“推理”定义为通过生成中间步骤来回答复杂问题的过程 非推理问题: ”法国的首都是哪里?” (答案直接、无需推导) 推理问题: ”一列火车以每小时60英里的速度行驶3小时,行驶距离是多少?” (需先理解”距离速度时间”的关系,再分步计算) 2个简单的例子: 通用的大语言模型(LLM)可能直接输出简短答案(如”180英里”)推理模型的特点在于显式展示中间推导过程 在应用方面二者各有擅长的领域,而不是简单的谁强谁弱问题 如果你需要完成数据分析、逻辑推理、代码生成等逻辑性较强且较为复杂的任务,请选择推理大模型 如果你面临创意写作、文本生成、意图识别等发散性较强且较为创意多样的任务,请选择通用大模型 特性 推理大模型 通用大模型 适用场景 复杂推理、解谜、数学、编码难题 文本生成、翻译、摘要、基础知识问答 复杂问题解决能力 优秀,能进行深度思考和逻辑推理 一般,难以处理多步骤的复杂问题 运算效率 较低,推理时间较长,资源消耗大 较高,响应速度快,资源消耗相对较小 幻觉风险 较高,可能出现“过度思考”导致的错误答案 较低,更依赖于已知的知识和模式 泛化能力 更强,能更好地适应新问题和未知场景 相对较弱,更依赖于训练数据 常识问题 擅长任务举例解决复杂逻辑谜题,编写复杂算法,数学证明撰写新闻稿,翻译文章,生成产品描述,回答成本通常更高通常更低 2大模型产品 21国外的大模型产品 22国内的大模型产品 23主流大模型“幻觉”评测 厦门大学大数据教学团队作品 ChatGPT ChatGPT是一种由OpenAI训练的大语言模型。它是基于Transformer架构,经过大量文本数据训练而成,能够生成自然、流畅的语言,并具备回答问题、生成文本、语言翻译等多种功能 ChatGPT的应用范围广泛,可以用于客服、问答系统、对话生成、文本生成等领域。它能够理解人类语言,并能够回答各种问题,提供相关的知识和信息。与其他聊天机器人相比,ChatGPT具备更强的语言理解和生成能力,能够更自然地与人类交流,并且能够更好地适应不同的领域和场景。ChatGPT的训练数据来自互联网上的大量文本,因此,它能够涵盖多种语言风格和文化背景 Gemini Gemini是谷歌发布的大模型,它能够同时处理多种类型的数据和任务,覆盖文本、图像、音频、视频等多个领域。Gemini 采用了全新的架构,将多模态编码器和多模态解码器两个主要组件结合在一起,以提供最佳结果 Gemini包括三种不同规模的模型:GeminiUltra、GeminiPro和GeminiNano,适用于不同任务和设备。2023年12月6日,Gemini的初始版本已在Bard中提供,开发人员版本可通过GoogleCloud的API获得。Gemini可以应用于Bard和Pixel8 Pro智能手机。Gemini的应用范围广泛,包括问题回答、摘要生成、翻译、字幕生成、情感分析等任务。然而,由于其复杂性和黑箱性质,Gemini的可解释性仍然是一个挑战 Sora 2024年2月16日,OpenAI再次震撼全球科技界,发布了名为Sora的文本生成视频大模型,只需输入文本就能自动生成视频。这一技术的诞生,不仅标志着人工智能在视频生成领域的重大突破,更引发了关于人工智能发展对人类未来影响的深刻思考。随着Sora的发布,人工智能似乎正 式踏入了通用人工智能(AGI:ArtificialGeneralIntelligence)的时代。 AGI是指能够像人类一样进行各种智能活动的机器智能,包括理解语言、识别图像、进行复杂推理等。Sora大模型能够直接输出长达60秒的视频,并且视频中包含了高度细致的背景、复杂的多角度镜头,以及富有情感 的多个角色。这种能力已经超越了简单的图像或文本生成,开始触及到视频这一更加复杂和动态的媒介。这意味着人工智能不仅在处理静态信息上越来越强大,而且在动态内容的创造上也展现出了惊人的潜力 Sora 右图是Sora根据文本自动生成的视频画面,一位戴着墨镜、穿着皮衣的时尚女子走在雨后夜晚的东京市区街道上,抹了鲜艳唇彩的唇角微微翘起,即便带着墨镜也能看到她的微笑,地面的积水映出了她的身影和灯红酒绿的霓虹灯,热闹非凡的唐人街正在进行舞龙表演,熙熙攘攘的人群目光都聚焦在跃动的彩龙身上,整个环境的喜庆氛围仿佛令人身临其境 OpenAIo3 2024年12月20日,OpenAI发布推理模型o3,无论在软件工程、编写代码,还是竞赛数学、掌握人类博士级别的自然科学知识能力方面,o3都达到了很高的水平 2025年1月国内大模型排行榜 大模型 图标 指标排名 DeepSeek 能力测评第一 豆包 用户数量第一 Kimi 文本处理第一 即梦AI 作图能力第一 通义万相 视频生成第一 智谱清言 文档归纳第一 22国内的大模型产品 DeepSeek(深度求索) 2024年12月26日,杭州一家名为“深度求索”(DeepSeek)的中国初创公司,发布了全新一代大模型DeepSeekV3。在多个基准测试中,DeepSeekV3的性能均超越了其他开源模型,甚至与顶尖的闭源大模型GPT4o不相上下,尤其在数学推理上,DeepSeekV3更是遥遥领先。DeepSeekV3以多项开创性技术,大幅提升了模型的性能和训练效率。DeepSeekV3在性能比肩GPT 4o的同时,研发却只花了558万美元,训练成本不到后者的二十分之一。因为表现太过优越,DeepSeek在硅谷被誉为“来自东方的神秘力量”。 2025年1月20日,DeepSeekR1正式发布,拥有卓越的性能,在数学、代码和推理任务上可与Ope