2025年2月10日
欢迎关注视频号@清华沈少阳系列直播
目录
参与式观察一个团队的大模型应用与内化贰
通用大模型怎么了?推理大模型这么火!
概 述 :推 理 大 模 型 建 立 在 通 用 大 模 型 基 础 之 上 , 在 推 理 框 架 上 线 之 前 , 通 用 大 模 型 直 接 回 答 。 那 现 在 就 让 他 基 于 思 维链 , 一 步 一 步 做 好 规 划 、 调 整 、 校 对 并 完 成 输 出 。 所 以 通 用 大 模 型 和 推 理 大 模 型 它 不 是 矛 盾 的 存 在 。
简 单 来 看 , 推 理 大 模 型 和 通 用 大 模 型 功 能 不 一 ,如 果 把A I模 型 比 作 工 具 包 ,D e e p S e e k把 传 统 通 用 大 模 型比 作 一 把 瑞士 军 刀 , 功 能 多 但 不 够 锋 利 ; 推 理 大 模 型 则 像 手 术 刀 , 专 精 切 割 但 用 途 单 一 。
1.需求明确度
✅任务模糊(如闲聊):选通用模型-HER✅目标明确(如解数学题):选推理模型-Deadline
2.容错成本
✅允许试错(如写诗):通用模型✅必须精确(如医疗诊断):推理模型
3.资源限制
✅算力充足:可叠加使用两者✅预算有限:按核心需求单选
通用大模型+推理大模型也是“王炸”组合
实战案例应用:电商客服场景
通用模型:处理90%的常规咨询(查订单、退换货)推理模型:解决5%的复杂纠纷(多环节理赔计算)
顾客:你好,我想查一下我的订单号为123456789的订单状态。通用客服模型:您好!很高兴为您服务。您的订单号123456789目
顾客:好的,我知道了。还有一个问题,我在购买时购买了商品的延长保修服务,这次换货后,保修期怎么计算?推理客服模型:您好,关于延长保修服务的问题,我来为您详细解答。根据我们的保修政策,当您购买商品并附加延长保修服务时,保修期是从商品购买日期开始计算的。如果在保修期内发生换货,新的商品保修期将从换货完成日期重新计算,但总保修时长不会超过原购买的延长保修期限。例如,您购买的商品保修期为1年,同时购买了1年的延长保修服务,总保修期为2年。如果在保修期内换货,新的商品保修期将从换货完成日期开始,再计算剩余的保修时长。如果换货发生在保修期的第10个月,那么新的商品将有14个月的保修期(2年总保修期减去已过的10个月)。如果您还有其他疑问,或者需要进一步确认保修细节,可以提供您的订单号,我为您查询具体的保修信息。
前处于“已发货”状态,发货时间是2025年2月9日。根据物流信息,预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息:[物流单号]。如果您还有其他问题,欢迎随时咨询。顾客:好的,谢谢!另外,我收到商品后发现有一件商品损坏了,
我需要申请退换货。通用客服模型:非常抱歉给您带来不便。关于商品损坏的问题,您
可以选择退货或换货。请先告诉我以下信息:1.您要申请退换货的商品名称和数量;
2.损坏的具体情况(最好提供照片);3.您希望选择退货还是换货。顾客:是这款智能手表,我需要换货。手表的屏幕碎了,我这就拍
照上传。通用客服模型:好的,麻烦您上传照片,我会为您核实情况并处理
换货申请。同时,请您确保商品包装完整,配件齐全,以便我们顺利为您处理换货。(顾客上传照片后)
“没有最好的模型,只有最合适的工具——通用模型是社交达人,推理模型是解题高手,用好这对黄金组合,才是AI时代的生存之道。”——DeepSeek行 业 产 品 端 融 合 :谷 歌P a L I - 3、A n t h r o p i cC l a u d e已 尝 试 在 通 用 模 型 中 嵌 入 推 理 模 块技 术 突 破 :思 维 链 (C h a i n - o f - T h o u g h t) 技 术 让两 类 模 型 能 力 边 界 逐 渐 模 糊当 前 建 议 :优 先 关 注 垂 直 领 域 优 化 模 型 ( 如 医 疗 推理 专 用 模 型 )
通用客服模型:感谢您提供照片,商品损坏情况已经确认。我们已为您发起换货申请,预计换货商品将在3 - 5个工作日内发出。您可以在“我的订单”-“售后服务”中查看换货进度。如果还有其他问题,可以随时联系我们。
直观感受通用大模型和推理大模型的差异
实战案例应用:分析辅助
Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步
DeepSeek:呈现拟人化思考过程
大模型1:将观点作为核心结论,细化后成文
1、对核心定义的具象化和确定性思考:你说的是啥?颗粒度对齐一下
2、需求场景和用途思考,决定大方向正确与否:用来干什么?呈给谁看?
……
大模型2:进一步明确任务
3、定写作方向、基本思路,乃至一级提纲确立类思考:从哪个角度切入?
此刻我的os:结果怎么样再说,看这个思考过程挺靠谱,很有想法!
直观感受通用大模型和推理大模型的差异:DeepSeek生成
实战案例应用:分析辅助
Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步
DeepSeek输出材料:更像个人,不是停留在语义层面的“拟人”,而是在独立、认真思考等更深层面
壹DeepResearch应用概述PART ONE
DeepSeek深度思考R1是一款基于深度学习技术的推理模型,其核心功能在于通过强化学习提升模型的推理能力。其设计目标是通过强化学习等技术,引入了自我反思能力,使其在推理过程中能够自我验证和反思,从而提高推理的准确性和可靠性。
(一)DeepSeek深度思考R1概述及主要用途
性能数据:官方数据显示,DeepSeekR1在数学、代码、自然语言推理等任务上的表现已可与OpenAI的顶级模型GPT-4相当。例如,DeepSeek系列模型在美国高级中学数学竞赛AIME2024题目上的一次性解题正确率达到39.2%,而GPT-4仅约9.3%。
现实案例:业内已经出现利用该模型辅助科研的例子。例如,有研究者在实验中让DeepSeek模型逐步求解AIME(美国数学邀请赛)竞赛难题,DeepSeek展现了清晰的链式推理过程,输出的思路连贯且易于理解。
思维链设计:DeepSeek深度思考R1通过原生思维链设计,使模型在推理过程中能够生成详细的推理路径。这种设计不仅提高了推理的准确性,还增强了模型的可解释性。
帮我画出DeepSeek R1的推理过程流程图,流程图的每个阶段需标注关键技术。以下是推理过程文字描述:DeepSeek R1的推理过程可以划分为四个主要阶段,每个阶段都运用了特定的
四步理解DeepSeek R1功能推理流程
AI技术来逐步完善推理链条,最终得出高质量答案。这一流程采用蓝色系流程图设计,结构清晰,便于在PPT中展示和理解。以下是各阶段及其关键技术说明:
1输入阶段(用户问题解析)用户输入自然语言问题,DeepSeek R1首先对问题进行理解与解析。在这一阶
段,模型运用了**自然语言处理(NLP)**技术,将用户的自然语言提问转换为机器可理解的内部表示,提取问题的意图和关键信息。通过对输入的预处理,模型为后续推理做好准备。
2思维链生成(构建初步推理路径)根据解析后的问题,DeepSeek R1开始“思考”,生成解决问题的初步步骤链条
(即思维链)。这一过程运用了**思维链推理(Chain-of-Thought, CoT)**技术。模型被鼓励像人类一样逐步思考,将复杂问题拆解为一系列连贯的中间推理步骤,并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度,让观众看到模型解决问题的思路。
3强化学习优化(自我反思与迭代优化)DeepSeek R1对生成的初步思维链进行自我检查和反思,反复迭代优化推理路径,
以提高推理的正确性。在这个阶段,模型引入了强化学习(ReinforcementLearning)思想进行自我优化。具体而言,DeepSeek R1会对先前步骤的推理结果进行评估,自主发现错误或不合理之处,然后通过调整思维链来纠正偏差。这种自我验证与错误校正的过程可被视为一种自监督优化:模型在没有人工标注指导的情况下,基于试错反馈强化正确的推理路线。通过多轮迭代,DeepSeek R1不断增强自身的推理能力,确保思维链趋于合理和可靠(相当于给模型加入了“元认知”能力,让它会“思考自己的思考”)。
4最终答案生成(输出详细推理链和答案)经过推理优化后,DeepSeek R1输出最终答案,并给出完整的推理过程作为支撑。
在这一阶段,模型基于优化后的思维链生成对用户问题的解答,确保答案准确无误 。 最 终 答 案 不 仅 包 含 直 接 的 回 答 , 还 附 带 详 细 的 推 理 链 条 ( 例 如 以