【特辑】DeepSeek:中国新一代AI的影响与未来展望 SampleReport 2025/02/11 <关于重大事件解读报告> 本报告专注于解读近期发生的可能对行业趋势、业内企业、行业投资者产生显著影响的事件,如政策发布、行业峰会、专业展会、技术革新、尖端产品发布等。通过对重大事件进行及时、深入的分析评论,我们期望能够帮助您洞察市场动态、产品创新和业务商机。 重点导读 2025年Q1,中国AI企业DeepSeek凭借颠覆性技术突破与开源战略,引发全球AI竞争格局剧变。以557万美元超低成本实现媲美GPT-4的性能,训练效率较传统模型提升45倍,直接冲击以往依赖“算力堆砌”的商业模式。这一突破导致美股芯片巨头Nvidia单日市值蒸发5890亿美元,倒逼AI行业 从“堆算力”转向“提效率”。DeepSeek的开源战略进一步打破技术壁垒,MIT许可证下代码全球扩散,吸引AMD等厂商合作,推动硬件生态多元化。 对中国而言,DeepSeek标志着中美AI竞争转折点:技术封锁被突破,对日本,利用此次机遇,结合自身优势,可在中美博弈中构建“第三极”角色。这场变革揭示技术民主化趋势——开放与合作将成为重塑全球AI规则的核心动力,中国从“跟随者”迈向“规则制定者”,而日本可借势挖掘本土优势,共同定义AI未来。 目录 1.DeepSeek事件梳理 图表1.1DeepSeek关键事件时间轴 (1)技术突破与市场冲击(2025年1月) (2)开源战略的全球扩散引发竞争格局变化(2025年2月初) 2.背景概要 (1)DeepSeek为什么会诞生? (2)深度求索是谁? 3.DeepSeek开源对中国的影响:中美AI竞争转折点 (1)影响1:重构技术壁垒,从“算力”指向“效率” 图表3.1DeepSeek(包含R1、R132B、V3)和OpenAI性能测试对比 图表3.2DeepSeek与谷歌(Gemini)、OpenAI、Claude参数规模以及基准测试结果对比图表3.3DeepSeek与谷歌(Gemini)、OpenAI、Claude实际能力对比 图表3.4DeepSeek-V3和Qwen2.572B、Llama3.1405B、Claude-3.5以及OpenAI-4o在不同测试中的得分对照表 (2)影响2:颠覆产业链盈利结构,低成本铸就新价格壁垒 图表3.5DeepSeek与谷歌(Gemini)、OpenAI、Claude开发成本对比 图表3.6DeepSeek与谷歌(Gemini)、OpenAI、Claude实际使用成本对比(包含API调用和本地部署) (3)影响3:技术封锁的突破和上游国产化产业链的协同带动 4.DeepSeek开源对日本的影响:AI竞争的新机遇 (1)硬件适配 (2)本地化应用 (3)联合研发与地缘政治的双赢局面 5.结语 问题1:还会有更多的DeepSeek吗? 问题2:DeepSeek未来值得作为行业标杆,还是会成为颠覆者?总结1:对中国的产业影响 总结2:对日本的战略启示 1.DeepSeek事件梳理 图表1.1DeepSeek关键事件时间轴 出处:SPEEDA整理发布注:图中K线为Nvidia(NASDAQ:NVDA)60分钟K线图(GMT+8) 节点事件归纳和分析 (1)技术突破与市场冲击(2025年1月) 2025年1月28日:DeepSeek发布两款大模型DeepSeek-V3和DeepSeek-R1,宣布训练成本仅 557万美元,性能对标GPT-4o1和Llama405B,引发全球关注。 同日,美国股市开盘暴跌,Nvidia的股价单日下跌17%,市值蒸发5890亿美元;AMD、博通等芯片厂商股价同步下滑,电力供应商联合能源跌幅达21%。 Nvidia回应:称“DeepSeek的成功验证了Nvidia芯片的有效性”,强调推理阶段仍需大量GPU支持。 ~仅限Speeda用户~ ~该部分内容可在Speeda平台上的完整报告中查阅~ (2)开源战略的全球扩散引发竞争格局变化(2025年2月初) 2025年2月4日,DeepSeek正式开源其代码及模型权重,并采用MIT许可证,允许商业修改。开源模型发布后迅速登顶苹果应用商店下载榜,覆盖160多个国家。同日,AMD宣布支持DeepSeek模型训练,并将DeepSeek-V3模型集成至其InstinctMI300XGPU。 分析师洞察: 此前,由于OpenAI与Nvidia的深度绑定,AMD等厂商在AI竞争中难以突破技术联盟的壁垒。而此次AMD主动支持DeepSeek,不仅直接向Nvidia等竞争对手发起挑战,也有望推动硬件性能的进一步提升,为AI开发者提供更多选择。这一变化无疑对Nvidia构成压力,后续Nvidia股票的价格走势验证了这一论断的准确性。 补充:关于“DeepSeek利用PTX编写代码绕过Cuda生态” 分析师认为这个说法并不准确。PTX仍然是NvidiaGPU的专有技术,运行在Nvidia硬件上,并依赖Nvidia的驱动程序和运行时环境。因此,DeepSeek使用PTX编写代码,实际上是在CUDA生态内进行更底层的优化,而非绕过CUDA生态。但不排除未来DeepSeek采用异构计算支持,适配ROCm (AMD)等其他计算框架的可能性。 2.背景概要 (1)DeepSeek为什么会诞生? 关于DeepSeek诞生的原因,我们认为可以从以下几个方面进行解释: -内生需求驱动:DeepSeek的诞生源于人工智能在实际场景中的高效应用需求,尤其是在复杂数据分析、智能决策、自动化任务处理等方面。当前,AI技术的发展已经进入应用深化阶段,企业和组织需要更高 效、低成本、易部署的AI解决方案,以降低使用门槛并提升实际落地价值。DeepSeek作为开源大模型,在数据效率、训练方法和推理优化上进行了针对性设计,以满足这一趋势。 -行业痛点推动:DeepSeek的出现针对企业级用户在金融、医疗、教育等关键行业的智能化痛点。这些行业在数据安全、隐私保护、算力成本、本地化部署等方面有着更高的要求。特别是在芯片受限、数据出境受阻的环境下,企业对高效、可控、可私有化部署的大模型需求日益增加,而DeepSeek在模型压缩、本地化部署、算力优化方面的特性,使其在这些场景中具备较强竞争力。 -技术范式的转变:DeepSeek还承载着打破美国AI领域“唯算力论”主导地位的使命。传统AI训练范式强调巨量算力(如OpenAI依赖的大规模GPU集群),但DeepSeek选择了优化算法、提升数据效率的路径,试图通过更优的训练策略以及更高效的数据利用率来减少算力依赖。这种范式的转变,既是对AI技术发展方向的探索,也是在国际技术竞争环境下对封锁压力的一种应对策略。 -团队创新和中国式AI业务环境:这次DeepSeek的成功展示了中国年轻一代开发者在激进创新方面的表现,他们突破了传统范式,并积极拥抱开源生态。这种态度背后,源自中国AI行业的激烈竞争,促成了高效且务实的创业文化。这种文化要求开发团队深入了解实际业务环境和痛点,并基于此制定开发路径和最终呈现结果。在这样的环境下,中国的年轻团队更擅长采用“小步快跑”的方式,通过快速试错来验证技术路线,从而实现更敏捷的开发,这种研发环境与当代年轻团队的开发心态高度契合。同时,充足的资本也为中国AI开发者提供了更多试错的机会,极大地提升了他们的快速迭代能力。再加上上文提到的行业内部需求的推动,外部封锁压力的加大,内外力相结合,最终催生了DeepSeek。 (2)深度求索是谁? 首先我们需要明确深度求索和幻方量化的关系。 -深度求索是DeepSeek的开发团队,是由幻方量化核心团队孵化,深度求索是幻方量化的子公司,也是幻方量化在人工智能领域的战略延伸。 -深度求索的技术直接服务于幻方量化的量化投资业务,通过大模型高效分析市场多模态数据,提取交易信号,并优化交易策略。 然后关于团队的组成和背景信息如下: -该团队由全球顶尖的人工智能专家、工程师和行业研究者组成,核心成员拥有清华大学、麻省理工学院、卡内基梅隆大学等世界一流高校的学术背景,并在谷歌、微软、Meta等科技巨头拥有多年研发经验。 -团队非常年轻,平均年龄不到30岁。 -团队跨学科融合了自然语言处理、深度学习、大数据分析等领域的深厚积累,专注于探索AI技术的创新边界与应用落地。 最后是重点核心成员简介:梁文锋和罗福莉。 梁文锋(CEO) 17岁考入浙江大学,毕业后先后创立了杭州雅克比投资管理有限公司和杭州幻方科技有限公司,2023年创办了DeepSeek,专注于大模型研发,致力于以低成本、高性能技术挑战国际巨头的市场地位。 罗福莉(天才少女) 罗福莉是深度求索团队中的“天才少女”,保研北大,“一年发表8篇顶会论文”,硕士毕业后通过阿里最高级别校招进入达摩院,后跳槽到DeepSeek。 3.DeepSeek开源对中国的影响:中美AI竞争转折点 ~仅限Speeda用户~ ~该部分内容可在Speeda平台上的完整报告中查阅~ 图表3.1DeepSeek(包含R1、R132B、V3)和OpenAI性能测试对比 出处:SPEEDA整理发布 图表3.2DeepSeek与谷歌(Gemini)、OpenAI、Claude参数规模以及基准测试结果对比 出处:SPEEDA整理发布注:基准测试受评测集和版本迭代影响较大,数学(GSM8K)、代码(HumanEval)和综合知识(MMLU)为常见评测指标 图表3.3DeepSeek与谷歌(Gemini)、OpenAI、Claude实际能力对比 出处:SPEEDA整理发布 图表3.4DeepSeek-V3和Qwen2.572B、Llama3.1405B、Claude-3.5以及OpenAI-4o在不同测试中的得分对照表 (2)影响2:颠覆产业链盈利结构,低成本铸就新价格壁垒 出处:SPEEDA整理发布 DeepSeek近期发表了一系列技术文献,详细披露了其模型的训练方法与应用技术。研究显示,DeepSeek-V3的训练成本仅为557万美元,这一数字远低于OpenAI动辄十亿美元的研发投入,标志着AI领域“轻资产化”的重要转折。DeepSeek的低成本(见图表3.5)策略不仅体现在训练环节,其 API调用费用也极具竞争力,仅为1元人民币/100万输入tokens,显著低于行业平均水平。这种成本优势直接传导至用户端,推动了AI服务的普及,同时也对OpenAI的商业模式构成了挑战(见图表 3.6)。随着越来越多的用户转向DeepSeek,OpenAI的市场地位或将受到冲击,其盈利能力和预期估值 也可能面临长期压力。作为美国技术方面的头部代表和AI布局的重要棋子,Nvidia和OpenAI的困境在宏观层面具有更深层的含义:中美AI竞争中的转折点。 图表3.5DeepSeek与谷歌(Gemini)、OpenAI、Claude开发成本对比 出处:SPEEDA整理发布注1:成本差异关键点在于模型架构(Moevs稠密模型)、数据清洗效率、硬件利用率(谷歌TPU成本低于GPU)注2:DeepSeek优势:通过稀疏激活和领域数据筛选降低算力需求,适合垂直场景部署。 图表3.6DeepSeek与谷歌(Gemini)、OpenAI、Claude实际使用成本对比(包含API调用和本地部署) (3)影响3:技术封锁的突破和上游国产化产业链的协同带动 出处:SPEEDA整理发布 在更加宏观的层面,这次DeepSeek的发布标志着中国在AI核心技术领域取得重大突破,同时也意味着美国技术封锁的失效。面对GPU供应受限的挑战,DeepSeek通过算法优化实现了技术突破,展现了中国在AI领域的自主创新能力.这一突破将不仅推动了国产芯片(如昇腾)的发展,还会带动HBM(高带宽内存)产业链的完善,为中国构建完整的AI技术生态奠定基础。更重要的是,DeepSeek的成功证明了中国在核心