行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

电子元器件行业：DeepSeek缩小中美AI差距，先进芯片制造亟待突破

电子设备 2025-02-03 国泰君安证券张曼迪

DeepSeekV3和R1模型在开源生态、工程创新及post-training拓展红利下达到行业领先水平。开源生态推动模型能力边界提升，如DeepSeek、Qwen、Llama等模型媲美闭源模型；DeepSeek通过工程创新提升模型能力，如无辅助损失策略、多token预测、FP8低精度训练、MoE架构等；post-training范式在早期阶段收益显著，DeepSeek快速引入思维链技术。美国通过AI出口管制和加大国内投资打压别国AI产业，如BIS发布AI出口管制规则，封锁16nm以下先进制程，特朗普宣布“星际之门”计划投资5000亿美元。DeepSeek的成就反映中美AI差距缩小，引发地缘政治关注，但面临OpenAI和微软调查及部分国家限制使用。中国AI模型通过算法工程创新取得优秀表现，但先进制程产能不足是核心瓶颈，中芯国际在先进制程领域布局领先，受益于中国AI产业发展机遇。催化剂包括关键技术突破和下游需求快速增长，风险提示地缘政治风险、AI商业化进展不及预期、技术突破/创新不及预期。

DeepseekV3和R1达到行业领先水平，这得益于开源生态、工程创新、以及post-training的拓展红利。1）开源让更多企业可以互相学习，站在“巨人的肩膀上”，不断推高能力边界，DeepSeek、Qwen、Llama等模型均具备媲美闭源模型的能力，DeepSeek即是开源的受益者也是领先的推动者；2）DeepSeek在算力资源有限的情况下，进行了大量工程创新，通过无辅助损失的策略、多token预测提升模型能力，通过首次引入FP8低精度训练、较宽的MoE架构、双管道训练、跨节点all to all的通信Kernel、优化内存占用等方式提升训练效率，通过MLA（多头注意力）机制来提升推理效率；3）post-training（后训练）依然处于拓展曲线初期，收益较大，而竞争者差距较小。此前的范式借助预训练的scaling law提升性能，但这一方向成本和难度正在逐步增加。而新的范式专注于通过合成数据生成、在现有模型基础上进行post-training的强化学习，从而提升推理能力。当前仍处于新范式下的scaling law早期阶段，可以快速获得巨大收益。美方通过制裁和加大投资，意图打压别国科技产业发展，实现美国领先。2025年1月，拜登政府下，BIS发布了历史上第一个AI出口管制规则，对世界不同国家进行分类管理，此外，还出台规则，封锁 16nm 以下的先进制程，将中国、新加坡的多个实体列入实体清单，意图打压别国AI产业发展。特朗普宣布“星际之门”计划，预计在未来四年内投资5000亿美元，用于建设支持AI发展的基础设施。而DeepSeek取得的成果，也反映出中美在AI产业的差距缩小，引发地缘政治角度的热议，DeepSeek目前也面临OpenAI和微软的调查和部分国家的限制使用。中国AI模型通过算法工程创新，取得了优秀的表现，但先进制程依然是AI产业规模化发展的核心瓶颈，亟待突破。目前，中国大陆7nm 及以下先进制程产能与台积电等代工厂依然有数量级的差距，所对应的晶体管数量约有几十倍的差距，中国大陆先进制程供应能力亟待提升。中芯国际作为中国大陆最先进、规模最大、配套服务最完善的专业晶圆代工企业，在先进制程领域布局领先，有望引领行业，充分受益于中国AI产业的发展机遇，予以推荐。催化剂：关键技术突破、下游需求快速增长风险提示：地缘政治风险、AI商业化进展不及预期、技术突破/创新不及预期 1.DeepSeek的创新启示 1.1.开源生态愈发繁荣，不断推高能力边界 2025年1月20日，DeepSeek发布R1模型，能力媲美OpenAI o1模型，开源优势显现。DeepSeek不仅开源了6710亿参数的R1模型，还开源了基于不同参数的qwen和llama架构的几个蒸馏模型。杨立昆表示，“开源代码正在超越私有模型，DeepSeek从开放研究和开放源码中受益（例如来自Meta的PyTorch和Llama），提出了新想法，并将它们建在其他人的工作之上。” 除DeepSeek外，其他中国AI企业也在积极参与开源的发展。Qwen、MiniMax等开源模型均已是语言领域佼佼者，腾讯混元-Video视频生成模型是目前参数量最大的开源视频生成模型，快手可图文生图模型也已开源。开源模型正在推动基础模型层降本，有助于推动应用繁荣。开源权重加速了模型价格平民化，给了开发者更多选择，OpenAI的o1每百万输出token要花费60美元，而DeepSeek R1只需2.19美元。面对DeepSeek的竞争，OpenAI也发布了最新推理模型——o3-mini，并支持免费使用，这是OpenAI首次向ChatGPT的免费用户提供推理模型，并表示会考虑开源。对于开发者来说，开源推动应用开发的成本大幅降低，端侧Agent等场景有望受益，有助于推动应用的繁荣，进而带来AI产业需求增长。 1.2.技术、硬件进步共同推动AI模型进步据Anthropic CEO达里奥·阿莫迪，影响AI系统有三个重要的基本因素：1）拓展定律（scaling laws），即其他条件相同的情况下，扩大AI训练范围可以全面改善认知任务的效果；2）曲线改变（shifting the curve），这主要指模型架构的改进，或是底层硬件上更有效地运行模型的方法。达里奥认为，当前算法进步导致的效率提升可能是每年4倍；3）范式转变（shifting the paradigm）。拓展类型在不断增加，2020年至2023年，主要拓展预训练模型，而2024年起，使用强化学习（RL）训练模型，生成思维链的范式已经成为了拓展的新焦点。提升AI模型训练、推理性价比的方式也对应为提升硬件效率、提升数据质量及范围、改进模型算法、寻找新的拓展范式。对于Deepseek而言，受限于美国芯片出口禁令，其先进AI芯片资源相对有限。Semianalysis认为，其拥有超5万张的H系列芯片（其中3万张为H20），据《财经十一人》报道，幻方量化拥有1万片以上的A100芯片。与OpenAI、谷歌、xAI（10万卡H100集群）、Anthropic（亚马逊将与其合作，打造几十万卡Trainium 2集群）等海外公司相比，算力资源较少。 DeepseekV3的创新之处在于算力相对有限的情况下，进行了大量工程算法上的创新，提升模型表现，这也顺应了AI成本持续下降的大趋势。其主要创新在于通过无辅助损失的策略、多token预测提升模型能力，通过首次引入FP8低精度训练、较宽的MoE架构、双管道训练、跨节点all to all的通信Kernel、优化内存占用等方式提升训练效率，通过MLA（Multiple-head latent attention，多头注意力）机制来提升推理效率。图1：MMLU任务得分超过42的大语言模型中，每100万个token处理成本最低的模型图2：MMLU任务得分超过特定值的大语言模型中，每100万个token处理成本最低的模型图3：自DeepSeek V3和R1发布以来，AWS H100的GPU定价在许多地区上涨 1.3.后训练仍处于scaling law初期，Deepseek积极追赶 Deepseek R1模型能取得和OpenAI o1模型相当的性能，重要原因之一在于推理新范式下，参与者的差距相对更小。此前的范式借助预训练的scaling law提升性能，但这一方向成本和难度正在逐步增加。而新的范式专注于通过合成数据生成、在现有模型基础上进行post-training（后训练）的强化学习，从而提升推理能力。当前仍处于新范式下的scaling law早期阶段，可以快速获得巨大收益。OpenAI o1于2024年9月宣布，而Deepseek比以往更快地学习o1方法，引入思维链（Chain of Thought），在资源较少的情况下在推理方向做到了行业前沿。图4：思维链展现了deepseek思考过程，从开始的按步骤比较，到后续的验证，最终得出了比较大小的正确答案 2.美国持续加码AI出口管制，多国限制使用DeepSeek 2.1.美国实施AI出口管制和加大国内投资，旨在保持美国领先美国BIS出台AI领域的出口管制措施，对全球进行分类管理。2025年1月13日，BIS发布历史上第一个人工智能出口管制规则，将世界不同国家分为三类，1）tier 1是美国的18个核心盟友伙伴国家，对其芯片销售不受限制；2）tier 2是除tier 1和tier3以外的国家，包含新加坡等国家，美国对其的芯片出口将不超过特定的配额，规则也允许在这些国家的实体通过获取合法身份（VEU）来获取更多数量芯片。总部位于美国的公司，只允许在美国以外的地区部署不超过50%的AI算力；3）tier 3则是D:5组美国武器禁运国（包含中国、俄罗斯等）和中国澳门，对他们的芯片出口严格限制没有发生变化。此外，在AI模型权重方面，规则限制先进闭源模型的权重转移至不可信行为方，开源模型的权重发布则未受限制。美国封锁 16nm 以下先进制程，并将中国、新加坡的多个实体列入实体清单。2025年1月16日，BIS发布两条规则，一项是更新先进计算半导体的出口管制，增加对芯片工厂和封装公司的出口管控，涵盖了14纳米或16纳米及以下节点的芯片，美国还将加强代工厂调查并防止先进芯片流向中国。另一项是将25家中国公司和2家新加坡公司列入实体名单。除了密集出台管制措施，打压别国AI产业发展，美国还通过大规模投资推动AI领域发展。2025年1月21日，特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划，预计在未来四年内投资5000亿美元，用于建设支持AI发展的基础设施。这一计划由OpenAI、软银集团和甲骨文公司联手打造，旨在确保美国在全球AI竞争中的领先地位。特朗普表示，该项目将"几乎立即创造10万个美国就业岗位"，并为全球带来巨大的经济效益。 DeepSeek反映出中美在AI领域的差距在缩小，再次引发地缘政治角度的热议。美国Anthropic CEO达里奥·阿莫迪评级Deepseek取得的成就，并呼吁美国政府继续维持芯片管制，将H20这样的中国特供版芯片也纳入限制范围，最终打造以美国为主导的单极世界。 2.2.OpenAI调查DeepSeek蒸馏行为，多国限制DeepSeek使用据彭博社报道，OpenAI和微软展开了联合调查，针对DeepSeek2024年使用OpenAI API接口的账户进行审查，并以涉嫌违反服务条款的模型蒸馏为由，取消了他们的访问权限。据《金融时报》，OpneAI称他们掌握了DeepSeek使用其模型进行违规蒸馏的“证据”。爱尔兰、意大利等国针对DeepSeek的数据安全问题提起质询，DeepSeek App已在意大利国内的应用市场全面下架。美国得克萨斯州禁止在当地政府拥有的电子设备中使用DeepSeek和小红书。 3.中国AI模型积极进行工程创新，芯片瓶颈亟待突破中国AI企业在先进算力匮乏的情况下，依靠工程创新，持续进步。但依然不排除美国BIS会进一步加码对芯片、模型的管制，以争取美国AI产业的发展时间，拉大中美科技领域的差距。因此，半导体自主可控迫在眉睫，也是中国AI产业规模化发展、走向繁荣的必备保障，其中，先进制程是关键瓶颈。台积电持续加大资本开支，以满足不断增长的先进制程和先进封装需求。 2025年，台积电资本开支预计将提升至380-420亿美金。约70%将投资于先进制程技术，包括3纳米及2纳米，以满足AI及高效能运算（HPC）需求。此外，10-20%的资本支出将用于特殊制程技术，另有10-20%投入先进封装、测试及光罩制作等项目。据Semiwiki，台积电2024、2025、2026年cowoswafer的月产能预计分别为35k~40k、65k~75k、90k~110k。2025年，台积电资本开支预计将提升至380-420亿美金。图5：台积电25财年资本开支预计大幅增长至380-420亿美元从先进制程产能角度看，台积电产能储备全球领先。 7nm 月产能预计在15-20万片/月， 5nm 月产能预计超20万片/月， 3nm 扩产积极，预计24年底月产能在12.5万片/月，而性能更为先进的 2nm 预计在25年下半年量产，预计月产能达5-6万片，并在26年实现产能翻倍。与N3E相比， N2 节点的晶体管密度提高了15%，芯片在相同晶体管数和主频的情况下，功耗可降低25%~30%；或者在相同晶体管数和功耗情况下，性能可以提高10%~15%。目前，中国大陆 7nm 及以下先进制程产能与台积电等代工厂依然有数量级的差距，所对应的晶体管数量约有几十倍的差距，中国大陆先进制程供应能力亟待提升。中芯国际作为中国大陆最先进、规模最大、配套服务最完善的专业晶圆代工企业，在先进制程领域布局领先，有望引领行业，充分受益于中国AI产业的发展机遇，予以推荐。图6：台积电积极布局先进制程， 7nm 及以下产能全球领先图7：台积电先进制程路线图 4.风险提

点击免费查看完整报告

电子元器件行业：DeepSeek缩小中美AI差距，先进芯片制造亟待突破

你可能感兴趣

计算机行业：中美AI产业差距缩小，资金与人才投入加速行业发展

中美互联网厂商AI布局对比：模型与资本开支差距缩小

电子元器件行业国产替代板块系列报告：晶圆厂龙头先进制程突破在即，半导体材料国产化超预期

电子元器件行业系列四：加速端侧AI推广落地，Deepseek本地部署加速端侧AI推广落地

电子元器件行业简评报告：华为发布全球首款移动端AI芯片，AI将加速发展

电子元器件行业：华为发布Mate10系列，AI芯片引领行业趋势

中航先进制造软通动力DeepSeek华为主权AI大赛道

东北先进材料石化哈里斯民调支持率上升摇摆州与特朗普差距缩小

电子行业周观点：北京提出推动国产AI芯片突破，LED照明芯片价格调涨

AI行业跟踪32期：Llama 3.1与闭源模型差距缩小，谷歌对AI投资态度积极