您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [甲子光年]:2025年DeepSeeK开启AI算法变革元年 - 发现报告

2025年DeepSeeK开启AI算法变革元年

信息技术 2025-02-05 - 甲子光年 机构上传
报告封面

DeepSeek开启AI算法变革元年 出品机构:甲子光年智库研究团队:宋涛、刘瑶、翟惠宇、何伟康、小麦发布时间:2025.02 1、人工智能的发展已到战略拐点 经过近七十年的发展,人工智能自出现至今其核心能力一直在提升,到如今已经成为覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合人类情感、伦理与道德观念的智能机器迈进。 发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。随着技术能力的提升,技术进化引发经济进化,从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。 2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现 DeepSeek通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知 2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现 DeepSeek通过重新设计AI Infra,验证“性价比”训练路径 DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。 DeepSeek-R1提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。 反而通过优化,DeepSeek-R1可能实现了算力与性能的近似线性关系。每增加一张GPU,模型推理能力可稳定提升,无需依赖复杂的外部监督机制。这一特性直接验证了“算力即性能”的Scaling Law,为AI芯片市场及AI Infra市场提供了明确的增量需求逻辑。 3、数据拐点:AI基础大模型的参数量迎来拐点 2025年发布的大模型,都具有低参数量的特征,为本地化部署到AI终端运行提供了可能 2024年之前,最大参数量一直在增长 4、技术路径的循环:算法创新再次成为新的突破点 AI技术创新一直在围绕核心三要素在动态循环,2025年再次进入算法创新阶段 核心三要素的创新循环 算力、数据、算法的三角创新体系,在动态循环之中再次进入算法创新阶段。 •2022年:算法创新为主,ChatGPT发布,引发Transformer架构的风潮迭起•2023年:数据创新为主,数据合成、数据标注等成为高质量数据集建设的热点方向•2024年:算力创新为主,算力迈向超万卡时代,算力运营商等产业新物种诞生•2025年:再次进入算法创新阶段 5、算法变革元年:DeepSeek的推理模型开启算法变革的元年 R1-zero完全基于RL(强化学习)进行训练,以第三阶段为主,通过自我学习来提高性能 5、算法变革元年:DeepSeek的推理模型开启算法变革的元年 DeepSeek-R1的训练流程:通过RL强化LLM的推理能力 R1-zero完全基于RL(强化学习)进行训练,未使用任何监督训练或人类反馈,能够通过自我学习来提高性能。 R1是在R1-zero的基础上,通过少量冷启动数据进行微调,提高了输出质量和可读性。 DeepSeek-R1的训练过程 6、算法变革的第二条路径:非Transformer架构的算法模型 除了基于Transformer架构的算法创新之外,非Transformer架构的新算法也成为近期新出现的重点发展方向。 一种新架构模型LFM(Liquid Foundation Model),超越了同等规模的Transformer模型如Llama 3.2。它用的是一种液态神经网络(LNN),其计算单元植根于动态系统理论、信号处理和数值线性代数。其小巧便携的特性使得它能够直接部署在手机上进行文档和书籍等分析。 因此,甲子光年智库判断,2025年将是算法变革的元年。未来最适合人类使用的大模型,可能会是非Transformer架构的算法模型。 6、算法变革的第二条路径:非Transformer架构的算法模型 AI终端推动端侧模型和端侧算力需求增加,小参数量模型需求爆发推动算法变革到来 AI处理重心正向端侧转移,催生小语言模型的需求爆发 2024年AI终端已经开始爆发 7、算法变革推动AI超级产品蕴生: 2024城头变幻大王旗,2025年AI超级应用开始出现,DAU达2161万 为2024年的AI超级应用的头把交椅处于不断变动之中。甲子光年智库统计汇总了近13个月中访问量最高的产品访问量数据,发现第一名的AI产品是处于不断变动状态的,可以用一句话来形容。那就是城头变幻大王旗。基本上每个解读的头把交椅都会发生变化。 2025年的开年,DeepSeek用短短二十天的时间就实现了DAU2161万的数据,超过了ChatGPT发布之处的数据表现,具有成为AI超级应用的潜力。 8、算法变革推动AI普惠应用 DeepSeek的模型实现AI时代的“小米模式”,实现技术和价格的双重普惠 如果说Transformer的应用标志着基础模型时代的开始(基础模型的庞大规模和应用范围突飞猛进),可以称为AI技术的“iPhone时刻”。那么DeepSeek从建立之初的“价格屠夫”模式就赢得了开发者市场的关注,可以看做是AI时代的“小米模式”。 8、算法变革推动AI普惠应用 DeepSeek的“高性价比”有望解锁具身智能的理解与推理 DS不仅在推理模型上实现了突破,在多模态方面也保持了进步,并于近日开源发布了Janus-Pro多模态模型。基于算法工程方面的优化,DS能够实现性价比更高的模型推理能力(价格低、效率高、性能强、可部署在端侧平台),DS有望以强大的推理能力和多模态感知能力,重塑机器人交互与决策,同时通过低成本、高效率的解决方案,加速具身智能的普及与应用。 DeepSeek的性价比&效率优势,有望加速具身智能技术发展普及 低成本和高效率对于实现规模化应用和商业化至关重要 •性能更强的中小模型蒸馏•更低的计算成本在真实硬件上运行 降低训练成本 降低推理成本 •以较低的成本训练出高质量的模型 加速研发速度、加速迭代速度、降低开发门槛 端侧平台部署、提升反应速率、降低计算能耗 DS R1-推理能力的基石 DSJanus-Pro-多模态感知理解的引擎 •通过强化学习自主探索,发展出复杂的推理能力•实现机器人自主规划任务和解决复杂问题的能力•链式思考能力:帮助机器人在执行任务时分解步骤,进行逻辑推理,从而更可靠地完成目标•不针对特定任务,追求通用推理能力•适应不同具身场景•冷启动训练减少了对大量标注数据的依赖,降低数据成本,并解决了R1-zero的可读性问题 多模态融合感知 •能够有效融合视觉和语言信息,使得机器人可以理解复杂的场景描述和人类指令 自主决策 链式思考 •可生成高质量的图像,对虚拟环境建模、仿真测试等具有重要意义。 图像生成 通用性 •视觉编码方法解耦,对不同的任务进行优化,例如同时提升感知能力和生成能力•缓解多模态理解和生成任务之间的冲突 编码器解耦 8、算法变革推动AI普惠应用 推理成本的颠覆性降低,将会推动C端产品的大多数应用场景进入实际落地阶段 大模型的价格正在快速下降,而开放权重也在加速,并为开发者提供更多选择。OpenAI的o1每输出100万令牌收费60美元,而DeepSeek-R1只需2.19美元。这将近30倍的价差,让算力成本不再是模型门槛,正在让基础模型层“平民化”。推理成本的颠覆性降低,将会推动C端产品在大多数应用场景得到落地。尤其是在星云象限和星团象限之中的应用场景,将会得到全面的落地。 备注说明:1.满意度:一个用来衡量个人或组织对特定产品、服务、经验或事件的满意程度的指标。当使用体验大于预期时会获得满意感。 9、全球AI科技竞争进入G2时代 DeepSeek将成为特朗普制定人工智能政策的重要参考,预示着AI进入G2竞争时代 •2025年1月23日,刚就任的美国总统特朗普签署了一项行政命令,废除了拜登政府“有害的”人工智能政策,要求一个跨部门小组在6个月内为“人工智能行动计划”(Artificial Intelligence Action Plan)。DeepSeek的出现和美国政商各届的反应将成为特朗普政府制定计划的重要参考。 拜登政府《关于安全、可靠和可信地开发和使用人工智能的行政命令》 特朗普政府在人工智能领域的计划和对华反制措施(待定) •2023年10月,拜登总统签署了《关于安全、可靠和可信地开发和使用人工智能的行政命令》,该行政命令的目的是确保AI技术的发展既能促进创新,又能有效地应对技术带来的潜在风险。该行政令也是美国迄今为止最全面的人工智能监管原则,标志着美国政府在定义AI监管和问责制方面的关键一步。 •主要内容和目标:加强AI安全性和可靠性;保护隐私和数据安全;消除AI中的偏见和歧视;促进AI的可解释性和透明度;确保AI技术的创新和竞争力;跨部门合作与国际合作;AI的国家安全考量;监管和监督机制;社会影响评估。•主要特点:该行政令要求AI开发者在公开发布任何可能引发风险的AI系统之前,必须根据《国防生产法》向政府提交安全测试报告。意在通过政府主导的方式,全面规范人工智能的开发与应用。此外,该行政令明确提出了推动AI安全性和透明性的重要措施。规定了各机构制定测试人工智能系统的标准和指标、人工智能模型的安全测试、责任追究机制、算法透明度要求,并纳入了限制偏见和歧视的条款,体现对隐私和公平的保护的强监管立场。 •调动企业力量发展人工智能:相比拜登政府坚持通过政府干预进行对人工智能监管,特朗普政府更倾向于依靠企业和资本的力量发展人工智能,特朗普会通过发动和建立“企业家朋友圈”,搭建起从基础层、中间层到应用层的“四梁八柱”。•限制对美国人工智能大模型使用:美国政府等相关部门高度怀疑中国大模型“窃取”了美国大模型企业的技术和训练成果,•扩大对芯片的出口管制:一方面,扩大对英伟达芯片对华出口限制,英伟达对中国的部分“特供型号”有望加入限制名单;另一方面,加强对新加坡等转运国和部分芯片贸易公司的调查和限制。•限制中国大模型应用:来自中国的大模型应用将被加入限制名单,有望被从美国及其盟国的app store下架,目前,DeepSeek已经被爱尔兰、意大利等美国的追随国下架,未来可能进一步扩大。 T H A N K S谢谢 北京甲子光年科技服务有限公司是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、AR/VR交互技术、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地 智库院长 宋涛微信stgg_6406 联系咨询合作