您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京大学]:DeepSeek与AIGC应用 - 发现报告
当前位置:首页/行业研究/报告详情/

DeepSeek与AIGC应用

信息技术2025-02-20孙萍、周嵘、李娜、张惠军、刘誉北京大学C***
AI智能总结
查看更多
DeepSeek与AIGC应用

DeepSeek内部研讨系列 DeepSeek与AIGC应用 AI肖睿团队 (孙萍、周嵘、李娜、张惠军、刘誉) 2025年2月20日 北大青鸟人工智能研究院 北大计算机学院元宇宙技术研究所 北大教育学院学习科学实验室 摘要 1本次讲座为DeepSeek原理和应用系列研讨的讲座之一,主要介绍DeepSeek的基本概念,以及大模型技术和AIGC工具应用,不需要大家具备专业的AI或IT技术背景。 2本次讲座首先分析当前备受瞩目的DeepSeekR1的概念、优势和历史地位。然后进一步探讨大模型和AIGC的底层工作机制,旨在帮助读者突破工具应用的局限,理解DeepSeek和AIGC的深层次价值。最后,介绍如何科学选择与高效使用AI工具,为大家提供更具深度与实用性的应用场景的指导,给听众带来更落地的AI应用价值。 尽管DeepSeekR1以其低成本和开源策略为行业带来变革,但当前网络上的大量相关内容仅停留在工具应用层面,易对初级AI应用人员造成概念和思维方式的误导,这也是本次讲座希望解决的问题。 目录 01详解DeepSeekR102AIGC的概念和应用 0AIGC的能力揭秘4选择AIGC工具 PART01 详解DeepSeekR1 简介 本部分介绍了DeepSeekR1模型的技术特性、发展历程、应用场景及其在AIGC领域的定位。 首先介绍人工智能的发展历程,以及大模型相关术语,并对比DeepSeekR1与其他模型的性能表现。DeepSeekR1以其低成本、开源策略和卓越的推理能力脱颖而出,尤其在复杂逻辑推理、数学和编程任务中表现优异。 随后介绍DeepSeek公司的背景、市场定位以及DeepSeekR1的技术原理和应用场景,揭示了其在推理密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,并列举接入该模型的第三方应用。 通过对人工智能发展历史以及DeepSeekR1的介绍和分析,本部分旨在为听众提供一个对 DeepSeek的客观、全面的认识,并理解该模型在AIGC领域的重要地位和应用潜力。 人工智能发展历程 202年 GPT4 AIGC的发展历程 1950s1990S 1990s2010S 2010s2022年 大模型相关术语 多模态 文本、图片、音频、视频 AI工具(国内) DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索 通用模型 大语言模型(LLM,LargeLanguageModel) 视频模型 多模态模型 行业模型(垂直模型、垂类模型) 教育、医疗、金融等 大模型的关键发展 生成模型推理模型 ref中文大模型基准测评2024年度报告20250108 生成模型与推理大模型的对比 比较项 GPT4o(生成模型) DeepSeekR1(推理模型) 模型定位 专注于通用自然语言处理和多模态能力,适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。 侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任务,适合高难度问题求解和专业领域应用,在中文表达上容易出彩。 推理能力 在日常语言任务中表现均衡,但在复杂逻辑推理(如数学题求解)上准确率较低。 在复杂推理任务表现卓越,尤其擅长数学、代码推理任务,在部分基准测试(如GPQA)中准确率高于GPT4o。 多模态支持 支持文本、图像、音频乃至视频输入,可处理多种模态信息。 当前主要支持文本输入,不具备图像处理等多模态能力。 应用场景 适合广泛通用任务,如对话、内容生成、多模态信息处理以及多种语言相互翻译和交流;面向大众市场和商业应用。 适合需要高精度推理和逻辑分析的专业任务,如数学竞赛、编程问题和科学研究;在思路清晰度要求高的场景具有明显优势,比如采访大纲、方案梳理;在对中文语言表达和情感表达方面有明显优势。 用户交互体验 提供流畅的实时对话体验,支持多种输入模态;用户界面友好,适合大众使用。 可展示大部分链式思考过程,便于专业用户理解推理过程;界面和使用体验具有较高的定制性,但整体交互节奏较慢。 推理模型的优劣势 优势 劣势 演绎或归纳等推理能力强(如谜题、数学证明) 响应速度慢且计算成本高(需要更多推理时间) 链式思维推理出色(善于分解多步骤问题) 基于知识的任务更容易出错(容易产生幻觉) 擅长复杂决策任务 处理简单任务的时候效率低(容易过度思考) 可以呈现思考过程 常见推理模型 DeepSeekR1 OpenAIo1OpenAIominiGemini20 Grok Kimi15 火爆全网的DeepSeekR1 爆火原因 DeepSeekR1的推理能力进入了第一梯队(媲美OpenAIo1)但训练和推理成本低、速度快、全部开源 DeepSeek打破了硅谷传统的“堆算力、拼资本”的大模型发展路径 01 02 0 打破垄断 价格下调 推动创新 DeepSeekR1以低成本和开源特性打破以往头部企业巨头割据局面 DeepSeekR1的API定价仅为行业均价的110推动了中小型企业低成本接入AI对行业产生了积极影响 DeepSeekR1促使行业开始从“唯规模论”转向更加注重“性价比”和“高效能”方向 对AI行业的重大影响 DeepSeek公司 公司成立背景与 发展历程 大语言模型LLM的创新应用 投资者背景与市 场定位 里程碑 DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于202 年7月17日,是一家创新型科技企业,专注于人工智能基础技术的研究与开发 DeepSeek专注于开发先进的大语言模型LLM和相关技术,旨在通过这些技 术推动人工智能在多个领域的应用和创新 作为由知名私募巨头幻方量化孕育而生的公司,DeepSeek获得了强大的资金支持和行业影响力,幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”,管理资金规模均超过600亿元。这为DeepSeek提供了清晰的市场定位和投资者背景 2025年1月20日推出DeepSeekR1推理模型 官网:wwwdeepseekcom 对话:chatdeepseekcom 新闻:httpsapidocsdeepseekcomzhcnnewsnews250120 Githubhttpsgithubcomdeepseekai DeepSeek产品信息官方渠道 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比 比较方面 生成模型(V) 推理模型(R1) 设计初衷 想要在各种自然语言处理的任务中都能表现好,更通用 重点是为了搞定复杂的推理情况,比如深度的逻辑分析和解决问题 性能展现 在数学题、多语言任务还有编码任务里表现不错,像Cmath能得907分,HumanEval编码任务通过率是652 在需要逻辑思考的测试里很棒,比如DROP任务F1分数能达到922,AIME2024的通过率是798 应用的范围 适合大规模的自然语言处理工作,像对话式AI、多语言翻译还有内容生成等等,能给企业提供高效的AI方案,满足好多领域的需求 适合学术研究、解决问题的应用和决策支持系统等需要深度推理的任务,也能拿来当教育工具,帮学生锻炼逻辑思维 思维链 让模型进行慢思考 让模型自我探索和训练 蒸馏 (Distillation) 在不损失能力的情况下缩小模型 (ChainofThought) 强化学习 (ReinforcementLearning) DeepSeekR1工作原理 DeepSeekR1论文:httpsgithubcomdeepseekaiDeepSeekR1blobmainDeepSeekR1pdf DeepSeekR1论文图解:httpszhuanlanzhihucomp2084475019 DeepSeekR1版本 模型名称 DeepSeekR1671B 满血版,能力最强 DeepSeekR1DistillQwen7B 蒸馏版,能力稍弱实际上是增加了推理能力的Qwen或Llama模型 DeepSeekR1DistillLlama8B DeepSeekR1DistillQwen14BDeepSeekR1DistillQwen2B DeepSeekR1DistillLlama70B 部署DeepSeekR1满血版的算力要求和性能 DeepSeekR1的优势 理科能力强,且准确率高 数学推理 代码生成 复杂任务处理 DeepSeekR1的局限 通用能力 R1的通用能力(尤其是生成能力)低于DeepSeekV R1的幻觉仍旧比较明显(可能源于R1的中文语言表达能力更强) 语言混杂 R1在处理非中英文问题时,偶尔会出现语言混杂现象 这个现象在R1Zero版本中更加明显 提示词工程 使用fewshot提示可能会降低R1性能 使用过多的过程指导指令可能会降低R1的推理能力 DeepSeekR1应用场景 推理密集型任务 编程任务中的代码生成、算法设计,媲美Claude5Sonet 数学问题求解、科学推理和逻辑分析等需要复杂推理的场景。 教育与知识应用 可用于解决教育领域的问题,支持知识理解与解答。 可用于科研任务的实验设计、数据分析和论文撰写。 文档分析与长上下文理解 适合处理需要深入文档分析和理解长上下文的任务,例如复杂信息提取与整合。 开放领域问答与写作 在内容生成、问题回答以及创造性写作中具有广泛应用,例如生成高质量文本或进行内容编辑。 如何使用DeepSeekR1 DeepSeek官方网站和官方app 腾讯系 腾讯元宝 微信AI搜索 腾讯ima个人知识库 AI搜索 秘塔搜索 纳米AI搜索 知乎直答 其它接入DeepSeekR1的产品 MollyR1(向量智能) 问小白 接入DeepSeekR1第三方服务的厂家 互联网大厂: 腾讯:腾讯元宝、ima、微信、腾讯云 百度:百度搜索、文小言 字节跳动:豆包、扣子、飞书 阿里:钉钉 互联网小厂:科大讯飞、知乎、秘塔、纳米AI搜索、 AI初创公司:零一万物、阶跃星辰、minmax、 AI应用公司(教育类):学而思、北大青鸟、网易有道、猿辅导、作业帮、 手机厂商:华为、荣耀、魅族、 其它云服务平台:三大运营商、云服务商(硅基流动等) PART02 AIGC的概念和应用 简介 本部分着重介绍人工智能生成内容(AIGC)的定义、应用范围及其在各行业的实际影响: 首先梳理AIGC相关的术语,包括AI、AGI、生成式AI和决策式AI等,明确了其在人工智能领域的定位。随后,详细列举AIGC在文本、图像、音频和视频生成方面的多样化应用,并探讨其在电商、新闻传媒、影视、游戏、教育和金融等行业的具体实践,展示AIGC在提升效率、降低成本和增强创新方面的核心价值。 此外,还分析AIGC带来的挑战,如数据隐私、伦理问题、生成质量控制以及对就业结构的影响。通过深入探讨AIGC的应用现状和未来趋势,本部分旨在帮助读者全面理解AIGC的潜力和影响,为应 对技术变革提供参考。 本部分的内容参考了《人工智能通识课(微课版)》和相关的视频(B站的思睿观通) 初识AIGC 眼花缭乱的名词 眼花缭乱的名词 AIGeneratedContent (人工智能生成内容) 决策式 AI 生成式 AI AIGC ChatGPT AI人工智能AGI通用人工智能 (artificialgeneralintelligence) 生成图像生成音频 生成文本 生成视频 AIGC能干什么 生成内容 Cursor Windsurf MarsCode GitHubCopilot 社交媒体 阿里云通义灵码 微软“小冰”出版诗集 AI撰写剧本电影《阳春》 新闻 百万字小说《天命使徒》 清华大学的《机忆之地》 Perplexity 知乎直答 秘塔AI搜索引擎 纳米AI搜索 代码 微信搜索(DeepSeekR1、元宝