AI智能总结
2025年2月10日 欢迎关注视频号@清华沈少阳系列直播 目录 参与式观察一个团队的大模型应用与内化贰 通用大模型怎么了?推理大模型这么火! 概 述 :推 理 大 模 型 建 立 在 通 用 大 模 型 基 础 之 上 , 在 推 理 框 架 上 线 之 前 , 通 用 大 模 型 直 接 回 答 。 那 现 在 就 让 他 基 于 思 维链 , 一 步 一 步 做 好 规 划 、 调 整 、 校 对 并 完 成 输 出 。 所 以 通 用 大 模 型 和 推 理 大 模 型 它 不 是 矛 盾 的 存 在 。 简 单 来 看 , 推 理 大 模 型 和 通 用 大 模 型 功 能 不 一 ,如 果 把A I模 型 比 作 工 具 包 ,D e e p S e e k把 传 统 通 用 大 模 型比 作 一 把 瑞士 军 刀 , 功 能 多 但 不 够 锋 利 ; 推 理 大 模 型 则 像 手 术 刀 , 专 精 切 割 但 用 途 单 一 。 1.需求明确度 ✅任务模糊(如闲聊):选通用模型-HER✅目标明确(如解数学题):选推理模型-Deadline 2.容错成本 ✅允许试错(如写诗):通用模型✅必须精确(如医疗诊断):推理模型 3.资源限制 ✅算力充足:可叠加使用两者✅预算有限:按核心需求单选 通用大模型+推理大模型也是“王炸”组合 实战案例应用:电商客服场景 通用模型:处理90%的常规咨询(查订单、退换货)推理模型:解决5%的复杂纠纷(多环节理赔计算) 顾客:你好,我想查一下我的订单号为123456789的订单状态。通用客服模型:您好!很高兴为您服务。您的订单号123456789目 顾客:好的,我知道了。还有一个问题,我在购买时购买了商品的延长保修服务,这次换货后,保修期怎么计算?推理客服模型:您好,关于延长保修服务的问题,我来为您详细解答。根据我们的保修政策,当您购买商品并附加延长保修服务时,保修期是从商品购买日期开始计算的。如果在保修期内发生换货,新的商品保修期将从换货完成日期重新计算,但总保修时长不会超过原购买的延长保修期限。例如,您购买的商品保修期为1年,同时购买了1年的延长保修服务,总保修期为2年。如果在保修期内换货,新的商品保修期将从换货完成日期开始,再计算剩余的保修时长。如果换货发生在保修期的第10个月,那么新的商品将有14个月的保修期(2年总保修期减去已过的10个月)。如果您还有其他疑问,或者需要进一步确认保修细节,可以提供您的订单号,我为您查询具体的保修信息。 前处于“已发货”状态,发货时间是2025年2月9日。根据物流信息,预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息:[物流单号]。如果您还有其他问题,欢迎随时咨询。顾客:好的,谢谢!另外,我收到商品后发现有一件商品损坏了, 我需要申请退换货。通用客服模型:非常抱歉给您带来不便。关于商品损坏的问题,您 可以选择退货或换货。请先告诉我以下信息:1.您要申请退换货的商品名称和数量; 2.损坏的具体情况(最好提供照片);3.您希望选择退货还是换货。顾客:是这款智能手表,我需要换货。手表的屏幕碎了,我这就拍 照上传。通用客服模型:好的,麻烦您上传照片,我会为您核实情况并处理 换货申请。同时,请您确保商品包装完整,配件齐全,以便我们顺利为您处理换货。(顾客上传照片后) “没有最好的模型,只有最合适的工具——通用模型是社交达人,推理模型是解题高手,用好这对黄金组合,才是AI时代的生存之道。”——DeepSeek行 业 产 品 端 融 合 :谷 歌P a L I - 3、A n t h r o p i cC l a u d e已 尝 试 在 通 用 模 型 中 嵌 入 推 理 模 块技 术 突 破 :思 维 链 (C h a i n - o f - T h o u g h t) 技 术 让两 类 模 型 能 力 边 界 逐 渐 模 糊当 前 建 议 :优 先 关 注 垂 直 领 域 优 化 模 型 ( 如 医 疗 推理 专 用 模 型 ) 通用客服模型:感谢您提供照片,商品损坏情况已经确认。我们已为您发起换货申请,预计换货商品将在3 - 5个工作日内发出。您可以在“我的订单”-“售后服务”中查看换货进度。如果还有其他问题,可以随时联系我们。 直观感受通用大模型和推理大模型的差异 实战案例应用:分析辅助 Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步 DeepSeek:呈现拟人化思考过程 大模型1:将观点作为核心结论,细化后成文 1、对核心定义的具象化和确定性思考:你说的是啥?颗粒度对齐一下 2、需求场景和用途思考,决定大方向正确与否:用来干什么?呈给谁看? …… 大模型2:进一步明确任务 3、定写作方向、基本思路,乃至一级提纲确立类思考:从哪个角度切入? 此刻我的os:结果怎么样再说,看这个思考过程挺靠谱,很有想法! 直观感受通用大模型和推理大模型的差异:DeepSeek生成 实战案例应用:分析辅助 Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步 DeepSeek输出材料:更像个人,不是停留在语义层面的“拟人”,而是在独立、认真思考等更深层面 壹DeepResearch应用概述PART ONE DeepSeek深度思考R1是一款基于深度学习技术的推理模型,其核心功能在于通过强化学习提升模型的推理能力。其设计目标是通过强化学习等技术,引入了自我反思能力,使其在推理过程中能够自我验证和反思,从而提高推理的准确性和可靠性。 (一)DeepSeek深度思考R1概述及主要用途 性能数据:官方数据显示,DeepSeekR1在数学、代码、自然语言推理等任务上的表现已可与OpenAI的顶级模型GPT-4相当。例如,DeepSeek系列模型在美国高级中学数学竞赛AIME2024题目上的一次性解题正确率达到39.2%,而GPT-4仅约9.3%。 现实案例:业内已经出现利用该模型辅助科研的例子。例如,有研究者在实验中让DeepSeek模型逐步求解AIME(美国数学邀请赛)竞赛难题,DeepSeek展现了清晰的链式推理过程,输出的思路连贯且易于理解。 思维链设计:DeepSeek深度思考R1通过原生思维链设计,使模型在推理过程中能够生成详细的推理路径。这种设计不仅提高了推理的准确性,还增强了模型的可解释性。 帮我画出DeepSeek R1的推理过程流程图,流程图的每个阶段需标注关键技术。以下是推理过程文字描述:DeepSeek R1的推理过程可以划分为四个主要阶段,每个阶段都运用了特定的 四步理解DeepSeek R1功能推理流程 AI技术来逐步完善推理链条,最终得出高质量答案。这一流程采用蓝色系流程图设计,结构清晰,便于在PPT中展示和理解。以下是各阶段及其关键技术说明: 1输入阶段(用户问题解析)用户输入自然语言问题,DeepSeek R1首先对问题进行理解与解析。在这一阶 段,模型运用了**自然语言处理(NLP)**技术,将用户的自然语言提问转换为机器可理解的内部表示,提取问题的意图和关键信息。通过对输入的预处理,模型为后续推理做好准备。 2思维链生成(构建初步推理路径)根据解析后的问题,DeepSeek R1开始“思考”,生成解决问题的初步步骤链条 (即思维链)。这一过程运用了**思维链推理(Chain-of-Thought, CoT)**技术。模型被鼓励像人类一样逐步思考,将复杂问题拆解为一系列连贯的中间推理步骤,并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度,让观众看到模型解决问题的思路。 3强化学习优化(自我反思与迭代优化)DeepSeek R1对生成的初步思维链进行自我检查和反思,反复迭代优化推理路径, 以提高推理的正确性。在这个阶段,模型引入了强化学习(ReinforcementLearning)思想进行自我优化。具体而言,DeepSeek R1会对先前步骤的推理结果进行评估,自主发现错误或不合理之处,然后通过调整思维链来纠正偏差。这种自我验证与错误校正的过程可被视为一种自监督优化:模型在没有人工标注指导的情况下,基于试错反馈强化正确的推理路线。通过多轮迭代,DeepSeek R1不断增强自身的推理能力,确保思维链趋于合理和可靠(相当于给模型加入了“元认知”能力,让它会“思考自己的思考”)。 4最终答案生成(输出详细推理链和答案)经过推理优化后,DeepSeek R1输出最终答案,并给出完整的推理过程作为支撑。 在这一阶段,模型基于优化后的思维链生成对用户问题的解答,确保答案准确无误 。 最 终 答 案 不 仅 包 含 直 接 的 回 答 , 还 附 带 详 细 的 推 理 链 条 ( 例 如 以<think></think>标签形式呈现模型的思考过程)供用户参考。这种结果输出方式体现了DeepSeek R1注重可解释性的特点:观众可以直观地看到模型是如何从问题一步步推理得到答案的。 实践:DeepSeek R1擅长做哪类研究分析? 利用DeepSeek深度思考R1做行业研究 实践:DeepSeek R1擅长做哪类研究分析? 多维度的舆情剖析 利用DeepSeek深度思考R1的联网搜索功能,广泛收集与事件相关的多源数据。通过深度推理能力,对数据进行深度挖掘,分析舆情传播路径、情感倾向和关键节点。这种方法能够揭示舆情事件背后的复杂关系和潜在影响因素。02 在研究起始阶段,明确分析报告的核心目标与研究问题。通过精准的问题设定,如“该事件舆情传播的关键节点是什么?”或“公众情感倾向如何影响事件走向?”来引导后续研究方向。这种问题导向有助于聚焦研究重点,避免在海量信息中迷失方向。 从传播、情感、观点等多个维度对舆情事件进行剖析。通过DeepSeek深度思考R1的剖析,理解公众对事件的态度和反应。同时,结合传播路径分析,识别舆情扩散的关键节点和影响因素。 基于DeepSeek深度思考R1的结果,对舆情事件可能带来的风险进行评估。DeepSeek深度思考R1识别潜在的负面舆情风险点,并提出针对性的应对策略。这不仅有助于缓解舆情危机,还能为相关主体提供决策支持。04 在报告撰写中,DeepSeek深度思考R1需采用专业化的语言和结构,确保逻辑严谨、论证充分。同时,通过交叉验证和多源数据对比,验证分析结果的可靠性。这种严谨的呈现方式能够增强报告的可信度和实用性。05 实测DeepSeek R1分析报告:9分 审核重点:1.数据准确度:核对不同来源数据之间的一致性,避免数据矛盾或冲突。对于存在差异的数据,需进行合理解释或 进一步验证。 2.案例贴合度:案例应与研究主题高度相关,能够直接支持报告的分析和结论。对于舆情事件,案例应与事件的性质、背景、传播特点等相匹配。3.观点合规度:确保报告中的观点符合法律法规和政策要求,不涉及违法违规内容,如虚假信息、诽谤、侵权等。4.研判颗粒度:事件的分析应深入到关键问题的核心,揭示事件的本质和内在规律。避免停留在表面现象,缺乏深度剖析。 实操DeepSeek+Mermaid AI组合,三分钟生成思维导图 Mermaid AI是一款基于 Mermaid.js开发的智能绘图工具,能够通过简单的文本提示快速生成各种类型的图表。 好的,感谢确认!接下来,我将根据您提供的信息,生成一个适用于PPT展示的流程图,使用蓝色系设计,并标注每个阶段的关键技术。流程图将采用mermaid.js语法,您可以直接在mermaid.live上生成可视化图表。以下是生成的mermaid.js代码: 1.文本生成图表:用户可以通过输入自然语言描述来生成图表,例如输入“创建一个包含三个步骤的流程图”,Mermaid AI就能生成对应的流程图代