202 DeepSeek开启A算法变革元年 1、人工智能的发展已到战略拐点 经过近七十年的发展,人工智能自出现至今其核心能力一直在提升,到如今已经成为覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合 人类情感、伦理与道德观念的智能机器迈进。 发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。随着技术能力的提升,技术进化引发经济进化,从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。 图1:技术革命的周期性示意图 技第一阶段 术能力 第二阶段 新产品、新产业的爆炸性增长和迅速创新 第三阶段 全部集群(新产业、技术体系和基础设施) AI所处位置 第四阶段 创新和市场潜力的全面扩张 产业范式的颠覆式创新扩张 第五阶段 新产品和新产业接近成熟,已经构建独立的技术体系 酝酿期构造范式 成长期 产业化 成熟期 产业发展 技术大爆炸 看得到新技术看得懂新技术 新产品、新产业、新技术体系接连出现并持续更新 用得上新技术用得好新技术 中国式新技术 2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现 DeepSeek通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知 训练算力(petaFLOPs)1.E+12 1.E+10 Megatron-TuringNLG530BPaLM(540B) GeminiUltra GPT-4 Claude2 o1 GPT-4o 1.E+08 1.E+06 1.E+04 1.E+02 GPT-3175B(davinci) BERT-Large AlexNetTransformer GLM-130B Llama2-70B Baichuan2-13BBaichuan2-7B DeepSeek-R1-671B DeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5B 2011201220132014201520162017201820192020202120222023202420252026 2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现 DeepSeek通过重新设计AIInfra,验证“性价比”训练路径 DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+ 多轮强化学习的办法,在提高了模型高 准确性的同时,也显著降低了内存占用和计算开销。 DeepSeek-R1提供了一种低成本训 练的方法,而不是说只能通过低成本模 来进行训练。型 反而通过优化,DeepSeek-R1可能效 实现了算力与性能的近似线性关系。果 低 每增加一张GPU,模型推理能力可稳定提升,无需依赖复杂的外部监督机制。这一特性直接验证了“算力即性能”的ScalingLaw,为AI芯片市场及AIInfra市场提供了明确的增量需求逻辑。 DeepSeek-R1的效果示意:更少的GPU(或其他AI芯片)带来同样的效果 DeepSeek-R1 少GPU数量多 备注:该图仅为示意,不代表实际情况下具体数量与效果的对比 *该图为无编码基础分析师通过DeepSeekR1协作利用python编码生成 3、数据拐点:AI基础大模型的参数量迎来拐点 2025年发布的大模型,都具有低参数量的特征,为本地化部署到AI终端运行提供了可能 2024年之前,最大参数量一直在增长 2025年发布的大模型开始分化为两极 图:AI预训练模型的参数规模呈现走势 高参数量 低参数量 Llama3-400B-InTraining 4万亿 DeepSeek-R1-671B, 6710 MiniMax-Text-01, 4560MiniMax-VL-01,4560 GPT-1BERT-LargeGPT-21.17亿3.4亿15亿 Facebook94亿 GPT-31750亿 新版BERT4810亿 StableLMM61750 亿 DeepSeek-R1-Distill- Qwen-32B,320 DeepSeek-R1-Distill- Phi-4,140Qwen-1.5B,15 2018年6月2018年10月2019年2月2019年7月2020年6月2021年12月2023年 2024年 2025年1月 2025年1月 2025年1月 2025年1月 2025年1月 2025年1月 4、技术路径的循环:算法创新再次成为新的突破点 核心三要素的创新循环 AI技术创新一直在围绕核心三要素在动态循环,2025年再次进入算法创新阶段 AI技术成熟度 图:每年AI技术创新发展的方向围绕三要素迭代展开 算法创新 算力 创新 数据 算法创新 创新 算力、数据、算法的三角创新体系,在动态 ?循环之中再次进入算法创新阶段。 •2022年:算法创新为主,ChatGPT发布, 引发Transformer架构的风潮迭起 •2023年:数据创新为主,数据合成、数据标注等成为高质量数据集建设的热点方向 •2024年:算力创新为主,算力迈向超万卡时代,算力运营商等产业新物种诞生 时间•2025年:再次进入算法创新阶段 2022年 2023年 2024年 2025年未来 5、算法变革元年:DeepSeek的推理模型开启算法变革的元年 R1-zero完全基于RL(强化学习)进行训练,以第三阶段为主,通过自我学习来提高性能 图1:传统AI基础大模型的训练过程三个阶段都注重图2:DeepSeek聚焦的训练过程核心在第三阶段 第三阶段 采用PPO强化学习算法针对奖励模型来优化策略 采用GRPO算法,通过对比分析方式针对奖励模型来进行优化 核心创新点 •GRPO算法对比分析,提升训练效率•"冷启动数据"建立基础的推理框架•推理导向的强化学习•利用训练得到的检查点来收集新的监督训练数据•全场景强化学习•蒸馏赋予小型模型推理能力 阶段训练模型 阶段收集比较数据并训 型(RM)练奖励模型 阶段收集演示数据策略模型并训练有监督 策略 •数据集中随机抽取问题 •使用PPO模型生成回答 •RM模型给出质量分数 •基于质量分数优化PPO模型参数第 强化学习优化模型 •循环迭代出新模型 强化学习 第二阶段 训练奖励模型(RM) 第一阶段 训练监督策略模型 收集比较数据并训练奖励模型 收集演示数据并训练有监督 策略 •数据集中随机抽取问题 •生成多个不同的回答 •标注答案排名顺序 •排序结果数据来训练奖励模型 •RM模型给出高质量回答的分数 •数据集中随机抽取问题 •生成多个不同的回答 •标注高质量答案 •用标注好的数据来微调模型 第训练奖励 第训练监 5、算法变革元年:DeepSeek的推理模型开启算法变革的元年 DeepSeek-R1的训练流程:通过RL强化LLM的推理能力 R1-zero完全基于RL(强化学习)进行训练,未使用任何监督训练或人类反馈,能够通过自我学习来提高性能。 R1是在R1-zero的基础上,通过少量冷启动数据进行微调,提高了输出质量和可读性。 DeepSeek-R1的训练过程 6、算法变革的第二条路径:非Transformer架构的算法模型 除了基于Transformer架构的算法创新之外,非Transformer架构的新算法也成为近期新出现的重点发展方向。 一种新架构模型LFM(LiquidFoundationModel),超越了同等规模的Transformer模型如Llama3.2。它用的是一种液态神经网络(LNN),其计算单元植根于动态系统理论、信号处理和数值线性代数。其小巧便携的特性使得它能够直接部署在手机上进行文档和书籍等分析。 因此,甲子光年智库判断,2025年将是算法变革的元年。未来最适合人类使用的大模型,可能会是非Transformer架构的算法模型。 图:LFM架构模型性能超越同等规模的Transformer模型 MMLU-Pro测试分数 LFM40B MoE (A12B) Llama3.170B Qwen257BA14B Gemma227B LFM1.3B LFM3B Phi-3.53.8B Mixtral47BA13B Llama3.18B Llama3.23B Gernma22.6B Mistral7B Jamba1.552BA12B Llama3.21B Phi-1.5 StableLM21.6BPhi-23B Danube21Smol8LBM ReneCartesia RecurrentGemma22.7B 1.3B RWKV612.67B 60 50 40 30 20 10 1B 2B 3B 7B8B 14B 27B 70B 100B LFMTransformer RNN Hybrid 活跃参数数量 6、算法变革的第二条路径:非Transformer架构的算法模型 AI终端推动端侧模型和端侧算力需求增加,小参数量模型需求爆发推动算法变革到来 AI处理重心正向端侧转移,催生小语言模型的需求爆发2024年AI终端已经开始爆发 图1:AI处理重心向端侧转移图2:2023-2026年中国AIPC出货量及占比(百万台) AIPCAI手机AIPC占比AI手机占比 74.6%80.3% 5.0% 8.1% 54.7% 28.0% 16.0% 338.8 38.0% 471.2 XR等便携 戴设备 AI 5G AIPC AI 终端侧 中心云 边缘云 AI手机 智能汽车 人形机器人 190.4 57.0 3213138 202320242025E2026E 7、算法变革推动AI超级产品蕴生: 2024城头变幻大王旗,2025年AI超级应用开始出现,DAU达2161万 为2024年的AI超级应用的头把交椅处于不断变动之中。甲子光年智库统计汇总了近13个月中访问量最高的产品访问量数据,发现第一名的AI产品是处于不断变动状态的,可以用一句话来形容。那就是城头变幻大王旗。基本上每个解读的头把交椅都会发生变化。 2025年的开年,DeepSeek用短短二十天的时间就实现了DAU2161万的数据,超过了ChatGPT发布之处的数据表现,具有成为AI超级应用的潜力。 图:近一年中各月AI产品访问量最高的产品数据走势图 2500 2000 TOP1访问量(M) DeepSeek2161万DAU 1500 1000 500 0 文心一言文心一言文心一言百度文库百度文库百度文库 百度搜索AI 豆包豆包豆包 360AI搜索豆包 1月2月3月4月5月6月7月8月9月10月11月12月25年1月 -500 8、算法变革推动AI普惠应用 DeepSeek的模型实现AI时代的“小米模式”,实现技术和价格的双重普惠 如果说Transformer的应用标志着基础模型时代的开始(基础模型的庞大规模和应用范围突飞猛进),可以称为AI技术的“iPhone时刻”。那么DeepSeek从建立之初的“价格屠夫”模式就赢得了开发者市场的关注,可以看做是AI时代的“小米模式”。 小米1代手机 相同点 DeepSeekR1 直接挑战了国际品牌的高价策略国际品牌(如三星、HTC)高价策略 (3000-4000元) 挑战高价策略 受众群体扩大,普惠开发者 直接挑战OpenAI的闭源技术模式及OpenAIO1的价格策略(O1正式版需要200美元) 将高性能智能手机推向大众市场 让更多中国普通用户使用推理型模型,中文语言能力较海外更强,同时具有极强的代码及数学能力 2010-2016年中国智能手机出货量(亿台) 短期影响 小米第一代手机(小米手机1)于2011年8月发布,定价1999元。 在出货量增长和价格体系两方面实现重构:高性能+低价格 4.234.2 4.7 5.2 0.4 0.95 2.58 长期影响 小米1代手机 相同点 DeepSeekR1 带