您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:电子元器件行业:DeepSeek缩小中美AI差距,先进芯片制造亟待突破 - 发现报告

电子元器件行业:DeepSeek缩小中美AI差距,先进芯片制造亟待突破

电子元器件行业:DeepSeek缩小中美AI差距,先进芯片制造亟待突破

DeepseekV3和R1达到行业领先水平,这得益于开源生态、工程创新、以及post-training的拓展红利。1)开源让更多企业可以互相学习,站在“巨人的肩膀上”,不断推高能力边界,DeepSeek、Qwen、Llama等模型均具备媲美闭源模型的能力,DeepSeek即是开源的受益者也是领先的推动者;2)DeepSeek在算力资源有限的情况下,进行了大量工程创新,通过无辅助损失的策略、多token预测提升模型能力,通过首次引入FP8低精度训练、较宽的MoE架构、双管道训练、跨节点all to all的通信Kernel、优化内存占用等方式提升训练效率,通过MLA(多头注意力)机制来提升推理效率;3)post-training(后训练)依然处于拓展曲线初期,收益较大,而竞争者差距较小。此前的范式借助预训练的scaling law提升性能,但这一方向成本和难度正在逐步增加。而新的范式专注于通过合成数据生成、在现有模型基础上进行post-training的强化学习,从而提升推理能力。当前仍处于新范式下的scaling law早期阶段,可以快速获得巨大收益。 美方通过制裁和加大投资,意图打压别国科技产业发展,实现美国领先。2025年1月,拜登政府下,BIS发布了历史上第一个AI出口管制规则,对世界不同国家进行分类管理,此外,还出台规则,封锁 16nm 以下的先进制程,将中国、新加坡的多个实体列入实体清单,意图打压别国AI产业发展。特朗普宣布“星际之门”计划,预计在未来四年内投资5000亿美元,用于建设支持AI发展的基础设施。而DeepSeek取得的成果,也反映出中美在AI产业的差距缩小,引发地缘政治角度的热议,DeepSeek目前也面临OpenAI和微软的调查和部分国家的限制使用。 中国AI模型通过算法工程创新,取得了优秀的表现,但先进制程依然是AI产业规模化发展的核心瓶颈,亟待突破。目前,中国大陆7nm 及以下先进制程产能与台积电等代工厂依然有数量级的差距,所对应的晶体管数量约有几十倍的差距,中国大陆先进制程供应能力亟待提升。中芯国际作为中国大陆最先进、规模最大、配套服务最完善的专业晶圆代工企业,在先进制程领域布局领先,有望引领行业,充分受益于中国AI产业的发展机遇,予以推荐。 催化剂:关键技术突破、下游需求快速增长 风险提示:地缘政治风险、AI商业化进展不及预期、技术突破/创新不及预期 1.DeepSeek的创新启示 1.1.开源生态愈发繁荣,不断推高能力边界 2025年1月20日,DeepSeek发布R1模型,能力媲美OpenAI o1模型,开源优势显现。DeepSeek不仅开源了6710亿参数的R1模型,还开源了基于不同参数的qwen和llama架构的几个蒸馏模型。杨立昆表示,“开源代码正在超越私有模型,DeepSeek从开放研究和开放源码中受益(例如来自Meta的PyTorch和Llama),提出了新想法,并将它们建在其他人的工作之上。” 除DeepSeek外,其他中国AI企业也在积极参与开源的发展。Qwen、MiniMax等开源模型均已是语言领域佼佼者,腾讯混元-Video视频生成模型是目前参数量最大的开源视频生成模型,快手可图文生图模型也已开源。 开源模型正在推动基础模型层降本,有助于推动应用繁荣。开源权重加速了模型价格平民化,给了开发者更多选择,OpenAI的o1每百万输出token要花费60美元,而DeepSeek R1只需2.19美元。面对DeepSeek的竞争,OpenAI也发布了最新推理模型——o3-mini,并支持免费使用,这是OpenAI首次向ChatGPT的免费用户提供推理模型,并表示会考虑开源。对于开发者来说,开源推动应用开发的成本大幅降低,端侧Agent等场景有望受益,有助于推动应用的繁荣,进而带来AI产业需求增长。 1.2.技术、硬件进步共同推动AI模型进步 据Anthropic CEO达里奥·阿莫迪,影响AI系统有三个重要的基本因素:1)拓展定律(scaling laws),即其他条件相同的情况下,扩大AI训练范围可以全面改善认知任务的效果;2)曲线改变(shifting the curve),这主要指模型架构的改进,或是底层硬件上更有效地运行模型的方法。达里奥认为,当前算法进步导致的效率提升可能是每年4倍;3)范式转变(shifting the paradigm)。拓展类型在不断增加,2020年至2023年,主要拓展预训练模型,而2024年起,使用强化学习(RL)训练模型,生成思维链的范式已经成为了拓展的新焦点。 提升AI模型训练、推理性价比的方式也对应为提升硬件效率、提升数据质量及范围、改进模型算法、寻找新的拓展范式。 对于Deepseek而言,受限于美国芯片出口禁令,其先进AI芯片资源相对有限。Semianalysis认为,其拥有超5万张的H系列芯片(其中3万张为H20),据《财经十一人》报道,幻方量化拥有1万片以上的A100芯片。与OpenAI、谷歌、xAI(10万卡H100集群)、Anthropic(亚马逊将与其合作,打造几十万卡Trainium 2集群)等海外公司相比,算力资源较少。 DeepseekV3的创新之处在于算力相对有限的情况下,进行了大量工程算法上的创新,提升模型表现,这也顺应了AI成本持续下降的大趋势。其主要创新在于通过无辅助损失的策略、多token预测提升模型能力,通过首次引入FP8低精度训练、较宽的MoE架构、双管道训练、跨节点all to all的通信Kernel、优化内存占用等方式提升训练效率,通过MLA(Multiple-head latent attention,多头注意力)机制来提升推理效率。 图1:MMLU任务得分超过42的大语言模型中,每100万个token处理成本最低的模型 图2:MMLU任务得分超过特定值的大语言模型中,每100万个token处理成本最低的模型 图3:自DeepSeek V3和R1发布以来,AWS H100的GPU定价在许多地区上涨 1.3.后训练仍处于scaling law初期,Deepseek积极追赶 Deepseek R1模型能取得和OpenAI o1模型相当的性能,重要原因之一在于推理新范式下,参与者的差距相对更小。此前的范式借助预训练的scaling law提升性能,但这一方向成本和难度正在逐步增加。而新的范式专注于通过合成数据生成、在现有模型基础上进行post-training(后训练)的强化学习,从而提升推理能力。当前仍处于新范式下的scaling law早期阶段,可以快速获得巨大收益。OpenAI o1于2024年9月宣布,而Deepseek比以往更快地学习o1方法,引入思维链(Chain of Thought),在资源较少的情况下在推理方向做到了行业前沿。 图4:思维链展现了deepseek思考过程,从开始的按步骤比较,到后续的验证,最终得出了比较大小的正确答案 2.美国持续加码AI出口管制,多国限制使用DeepSeek 2.1.美国实施AI出口管制和加大国内投资,旨在保持美国领先 美国BIS出台AI领域的出口管制措施,对全球进行分类管理。2025年1月13日,BIS发布历史上第一个人工智能出口管制规则,将世界不同国家分为三类,1)tier 1是美国的18个核心盟友伙伴国家,对其芯片销售不受限制;2)tier 2是除tier 1和tier3以外的国家,包含新加坡等国家,美国对其的芯片出口将不超过特定的配额,规则也允许在这些国家的实体通过获取合法身份(VEU)来获取更多数量芯片。总部位于美国的公司,只允许在美国以外的地区部署不超过50%的AI算力;3)tier 3则是D:5组美国武器禁运国(包含中国、俄罗斯等)和中国澳门,对他们的芯片出口严格限制没有发生变化。此外,在AI模型权重方面,规则限制先进闭源模型的权重转移至不可信行为方,开源模型的权重发布则未受限制。 美国封锁 16nm 以下先进制程,并将中国、新加坡的多个实体列入实体清单。2025年1月16日,BIS发布两条规则,一项是更新先进计算半导体的出口管制,增加对芯片工厂和封装公司的出口管控,涵盖了14纳米或16纳米及以下节点的芯片,美国还将加强代工厂调查并防止先进芯片流向中国。 另一项是将25家中国公司和2家新加坡公司列入实体名单。 除了密集出台管制措施,打压别国AI产业发展,美国还通过大规模投资推动AI领域发展。2025年1月21日,特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划,预计在未来四年内投资5000亿美元,用于建设支持AI发展的基础设施。这一计划由OpenAI、软银集团和甲骨文公司联手打造,旨在确保美国在全球AI竞争中的领先地位。特朗普表示,该项目将"几乎立即创造10万个美国就业岗位",并为全球带来巨大的经济效益。 DeepSeek反映出中美在AI领域的差距在缩小,再次引发地缘政治角度的热议。美国Anthropic CEO达里奥·阿莫迪评级Deepseek取得的成就,并呼吁美国政府继续维持芯片管制,将H20这样的中国特供版芯片也纳入限制范围,最终打造以美国为主导的单极世界。 2.2.OpenAI调查DeepSeek蒸馏行为,多国限制DeepSeek使用 据彭博社报道,OpenAI和微软展开了联合调查,针对DeepSeek2024年使用OpenAI API接口的账户进行审查,并以涉嫌违反服务条款的模型蒸馏为由,取消了他们的访问权限。据《金融时报》,OpneAI称他们掌握了DeepSeek使用其模型进行违规蒸馏的“证据”。 爱尔兰、意大利等国针对DeepSeek的数据安全问题提起质询,DeepSeek App已在意大利国内的应用市场全面下架。美国得克萨斯州禁止在当地政府拥有的电子设备中使用DeepSeek和小红书。 3.中国AI模型积极进行工程创新,芯片瓶颈亟待突破 中国AI企业在先进算力匮乏的情况下,依靠工程创新,持续进步。但依然不排除美国BIS会进一步加码对芯片、模型的管制,以争取美国AI产业的发展时间,拉大中美科技领域的差距。因此,半导体自主可控迫在眉睫,也是中国AI产业规模化发展、走向繁荣的必备保障,其中,先进制程是关键瓶颈。 台积电持续加大资本开支,以满足不断增长的先进制程和先进封装需求。 2025年,台积电资本开支预计将提升至380-420亿美金。约70%将投资于先进制程技术,包括3纳米及2纳米,以满足AI及高效能运算(HPC)需求。此外,10-20%的资本支出将用于特殊制程技术,另有10-20%投入先进封装、测试及光罩制作等项目。据Semiwiki,台积电2024、2025、2026年cowoswafer的月产能预计分别为35k~40k、65k~75k、90k~110k。2025年,台积电资本开支预计将提升至380-420亿美金。 图5:台积电25财年资本开支预计大幅增长至380-420亿美元 从先进制程产能角度看,台积电产能储备全球领先。 7nm 月产能预计在15-20万片/月, 5nm 月产能预计超20万片/月, 3nm 扩产积极,预计24年底月产能在12.5万片/月,而性能更为先进的 2nm 预计在25年下半年量产,预计月产能达5-6万片,并在26年实现产能翻倍。与N3E相比, N2 节点的晶体管密度提高了15%,芯片在相同晶体管数和主频的情况下,功耗可降低25%~30%;或者在相同晶体管数和功耗情况下,性能可以提高10%~15%。 目前,中国大陆 7nm 及以下先进制程产能与台积电等代工厂依然有数量级的差距,所对应的晶体管数量约有几十倍的差距,中国大陆先进制程供应能力亟待提升。中芯国际作为中国大陆最先进、规模最大、配套服务最完善的专业晶圆代工企业,在先进制程领域布局领先,有望引领行业,充分受益于中国AI产业的发展机遇,予以推荐。 图6:台积电积极布局先进制程, 7nm 及以下产能全球领先 图7:台积电先进制程路线图 4.风险提