AI智能总结
行业应用与实践 智灵动力 李祖希 基 础 模 型 、 深 度 思 考 (R 1)、联 网 搜 索 D e e p S e e k受 到 市 场 热 捧 日活数据:上线仅20天,日活用户数量突破2000万大关,日活增长速度超过ChatGPT。 下载数据:自1月26日首次登上苹果App Store全球下载排行榜榜首以来,在140个国家的苹果App Store下载排行榜中始终保持第一的位置;发布前18天内的下载量达到1600万次,几乎是同期ChatGPT下载量的两倍;印度市场贡献了所有平台下载量的15.6%。 云厂商接入:微软Azure、英伟达、阿里云、华为云、腾讯云、百度云等众多云厂商纷纷宣布上线R1,还推出“零代码”“超低价”等优惠活动。 D e e p S e e k- R 1:强 化 学 习 驱 动 的 全 能 推 理 引 擎 DeepSeek-R1是由幻方量化旗下AI公司深度求索(DeepSeek)研发的先进推理模型,特别擅长数学、代码和自然语言推理等复杂任务。 技术特点:利用大规模强化学习技术,仅需少量标注数据即可提升性能;构建智能训练场以动态调整和优化模型推理能力。 该模型采用大规模强化学习技术进行后训练,在仅有少量标注数据的情况下显著提升了模型性能,并且通过智能训练场动态生成题目和实时验证解题过程来进一步增强推理能力。 2025年1月20日,DeepSeek-R1正式发布,并同步开源其模型权重,采用MIT许可协议,极大地降低了AI应用的门槛并促进了开源社区的发展。 开源许可:完全开源,采用MIT许可协议,允许自由使用、修改、分发和商业化。 DeepSeek-R1实现了高性能与低成本的良好平衡,API服务定价极具竞争力。 DeepSeek-R1在多个基准测试中取得了优异成绩,如在Arena排名中位列全类别大模 型 第 三 , 风 格 控 制 类 模 型 分 类 中 与OpenAI o1并列第一。 使 用D e e p S e e k的 多 条 路 径 API接口 适 用 场 景 : 集 成D e e p S e e k模 型 到 第 三 方 应 用 ( 如 聊 天 机 器 人 、 数 据 分 析 工 具 等 ) 。支 持 模 型 :D e e p S e e k - R 1、D e e p S e e k - M a t h等 系 列 模 型 。 开源模型使用 部 分 模 型 ( 如D e e p S e e k - M o E) 已 在G i t H u b开 源 , 支 持 本 地 部 署 。 访 问G i t H u b仓 库 获 取 模 型 权 重 及 推 理 代 码 。百 度 云 :h t t p s : / / c l o u d . b a i d u . c o m /硅 基 流 动 :h t t p s : / / w w w. s i l i c o n f l o w. c o m / 官网页面或手机APP 直接访问对话页面与预训练模型交互,支持多轮对话、代码生成等。 本地化部署 DeepSeek-R1系列(1.5B-671B)、DeepSeek-V3(参数量为671B)、DeepSeek-Janus系列(视觉相关多模态模型)、DeepSeek-Coder和DeepSeek-Coder-V2、DeepSeek-VL(视觉-语言模型) 多模态因果推理 复杂系统优化 知识密集创造 实 时 动 态决 策 超大规模组合优化多目标权衡实时重规划 DeepSeek潜能领域 算法设计与优化 代码开发与调试 数据分析与建模 编写、调试和优化复杂的软件代码,通过分析程序运行日志和错误信息,自动定位问题根源,提出有效的解决方案。 对于需要复杂算法设计和优化的项目,DeepSeek-R1可以提供有力支持,帮助研究人员快速探索不同的算法实现,并进行性能评估。 在处理大规模数据集时,DeepSeek-R1能够高效地进行数据分析,识别模式并建立预测模型,适用于科学研究中的数据驱动发现。 多源信息整合与跟踪 对话与互动 模拟与预测 从多个来源(如新闻、社交媒体、市场报告等)收集信息,并整合为可操作的洞察;能够持续跟踪关键指标的变化,及时发现潜在风险并发出预警。 对未来市场趋势、产品表现或系统行为进行模拟和预测,构建多种未来情景,评估不同策略的效果。 通过较好的逻辑推理、情感分析及上下文理解能力,在对话互动中提供高度个性化和一致性的用户体验。 AI自动化L1-L5:渐进提升全能自理 两者均以“AI自动化程度”为线索,但“L1-L5阶段”更为贴近该线索,强调AI在逐步减少人类干预的过程中实现完全自主,聚焦自动化发展的渐进演变。相较之下,Altman的AGI五阶段更具实践导向。 生成机制:语料预学推理输出 具体框架:以“我喜欢吃苹果。”为例 提示词工程:精准指引效能增益 3.逐步拆解复杂任务 1.设定明确的目标与上下文 2.激活角色与思维模式 •将复杂问题分解为多个独立的步骤•在每一步操作结束后,请求模型总结或验证中间结果•合并多个子任务的输出,形成完整的解决方案或总结 •设定模型为某种特定的身份,如技术专家、教师或HR•指导模型使用某种特定的写作风格(如正式、非正式、技术性等)•让模型模拟某种特定的思维模式,如批判性思维、创造性思维等 •说明任务的具体目标(如获取信息、生成文本、分析数据等)•提供背景信息,以减少模型的猜测•针对不同的场景,给出期望的输出类型(如表格、列表、总结等) 6.动态反馈与迭代优化 5.提供参考材料与外部资源 4.引导深入推理与思考 •在收到回答后,指出模型的误差或不足,并要求修正•让模型根据前一轮的输出进行自我改进•请求模型总结多轮对话中的关键点,确保连贯性和准确性 •向模型提供外部参考文献或文本,并要求根据这些材料生成答案•要求模型在作答时引用或链接到具体的来源•集成外部工具(如代码执行)来完成复杂的计算或查找任务 •让模型分步骤推导出答案,要求“思维链”推理•要求模型在作答前进行简要的自我反思或验证•要求模型解释每一步的思路,而不仅仅是给出最终答案 提示词框架:逻辑锚定思维引导 示例•Task:写一篇关于数据隐私的重要性的简短博客文章。 1.TASTE框架 •Task(任务):定义模型主要任务或生成内容。•Audience(目标受众):明确说明目标受众。•Structure(结构):为输出的内容提供明确的组织结构,包括段落安排、论点展开顺序或其他逻辑关系。•Tone(语气):指定模型回答时的语气或风格。•Example(示例):例子或模板可帮助模型理解输出风格或格式。 •Audience:普通的互联网用户,非技术背景。•Structure:文章需要有明确的开头、中间讨论和结尾,开头提出问题,中间介绍原因和影响,结尾提供建议。•Tone:采用友好、易懂的语气。•Example:类似于《纽约时报》科技专栏的风格。 示例•Aim:创建一篇关于“可持续发展”的文章,解释其核心 2.ALIGN框架•Aim(目标):明确任务的最终目标。 理念。•Level:适合高中生阅读,不需要专业术语。•Input:提供目前的环境问题的背景,讨论应对全球变暖的策略。•Guidelines:文章应使用简洁明了的语言,并避免复杂的技术概念。•Novelty:要求结合最新的环境数据,提出新颖的观点和解决方案。 •Level(难度级别):定义输出的难度级别。•Input(输入):指定需要处理的输入数据或信息,或要求模型依据某些事实或条件进行推理。•Guidelines(指导原则):提供模型在执行任务时应该遵循的规则或约束。•Novelty(新颖性):明确是否需要模型提供原创性、创新性的内容,是否允许引用已有知识。 DeepSeek使用技巧1 扔掉提示词模板,贴合真实需求 DeepSeek是推理型大模型,非指令型 使用时无需复杂专业提示词,应基于真实场景与具体需求提问例如准备与比亚迪供应商谈判,直接说明自身情况与想了解的内容,如“我下周要和供应商谈判,但对动力电池一窍不通。帮我用最通俗的语言说明……”,这样能获得更实用的分析和谈判话术。 本页内容参考:鹤竹子 DeepSeek使用技巧2 巧用“说人话”提示词 例如:回答内耗相关内容时,加“说人话”前很抽象,添加后用日常场景解释,更易理解。【请用以下规范输出:1.语言平实直述,避免抽象隐喻;2.使用日常场景化案例辅助说明;3.优先选择具体名词替代抽象概念;4.保持段落简明(不超过5行);5.技术表述需附通俗解释;6.禁用文学化修辞;7.重点信息前置;8.复杂内容分点说明;9.保持口语化但不过度简化专业内容;10.确保信息准确前提下优先选择大众认知词汇】 本页内容参考:鹤竹子 DeepSeek使用技巧3 运用深度思考提示词 DeepSeek深度思考能力强,但因用户暴增,响应策略调整,思考时间缩短。使用“请在你的思考分析过程中同时进行批判性思考至少10轮,务必详尽”等核心提示词,可恢复其深度思考时间,让它像思考伙伴一样提供更优质回答。 本页内容参考:鹤竹子 DeepSeek使用技巧4 借助文风转换功能 利用“模仿xxx的文风,撰写关于xxxxx的一篇xx文体”提示词,可实现文风转换。它更适合模仿经典作家,虽难以100%还原,但能抓住神韵。如模仿王勃写赋、鲁迅写作风格等,还可结合万能公式“我要xx,要给xx用,希望达到xx效果,但担心xx问题...”,达到特定写作目的。 本页内容参考:鹤竹子 现 阶 段 无 法 完 全 信 任 任 何 一 种 大 模 型 数据处理中的局限性 文本归纳与生成的局限性 案例:要求Claude 3.5 Sonnet将美国301对华关税清单与一份中国出口产品目录进行匹配,并做一些计算初始匹配成功率:<40%问题发现:AI忽略了HS 6位码小数点后的0修改后匹配率提升至80%结论:AI可加速数据处理,但最终结果仍需人工审核。 AI生成的文字是专业和非专业的分水岭:文字从业者:内容错误多,堆砌感重。非从业者:认为“以假乱真”,无需人类干预。结论:AI输出文本无法直接满足专业需求,需反复检查和调整。 AI幻觉:五类七特虚实迷域 D e e p S e e k发 展 优 劣 势 分 析 技术优势:开源模型(如DeepSeek-R1)性能优异,部分指标接近国际领先水平。。 国际知名度不足:相比OpenAI、Google等国际巨头,品牌全球影响力和用户认知度较低,开源生态与开发者社区规模有待扩大。 场景化应用能力:注重技术落地,在搜索增强、数据分析、企业服务等场景有成熟解决方案;提供API和定制化服务,适配不同行业需求 算力资源限制:大模型训练依赖高性能算力,国内GPU供应受限可能影响迭代速度,长期成本控制面临挑战(如芯片禁运风险)。 多模态能力待完善:图像、视频等多模态技术成熟度落后于GPT-4V、Gemini等顶尖模型,跨模态生成与理解的精准度需进一步提升。 研发效率高:通过自研训练框架和优化算法,显著降低模型训练与推理成本;模型参数规模灵活(从轻量级到千亿级),满足多样化需求。 市场竞争激烈:国内厂商(如百度、阿里)及国际巨头均在加速布局,同质化竞争加剧,需持续投入以保持技术领先性。 中文领域优势:中文语料处理能力突出,在语义理解、生成质量上优于部分国际竞品,更贴合中文用户的文化和表达习惯。 商业化变现压力:B端客户对AI付费意愿参差不齐,开源模式与商业盈利的平衡仍需探索。 D e e p S e e k突 破 逆 袭 , 中 美A I博 弈 进 入 新 阶 段 •技 术 价 值:通 过 自 研D u a l P i p e训 练 框 架 、8位 浮 点 量 化 技 术 等 创 新 手 段 , 提 升 计 算 效 率 , 降