AI智能总结
苏林, CFA(852) 3911 8023clintsu@ccbintl.com 科技行业 DeepSeek爆火后,影响几何? ►DeepSeek性能表现几乎追平美国龙头 ►全球人工智能发展加速,中美差距缩小 ►开源和闭源竞争加剧 ►训练算力需求短期内降温 深度求索(DeepSeek),一家位于杭州的人工智能初创公司,发布了全新强化学习版本DeepSeek模型DeepSeek R1及相关应用程序,其性能几乎追平与现有领先AI模型,但成本却非常低,这引发市场对大规模算力部署和资金投入必要性的担忧。通过强化学习,R1模型在数学、编码、自然语言推理等领域拥有卓越的表现。据DeepSeek介绍,其V3模型(R1之前的模型)的训练成本估计仅为Llama 3或GPT-4的8-9%左右。 可以追溯到几十年前,涉及许多领域,例如计算机操作系统中的Linux(开 放)与Windows(封 闭)、 智 能 手 机 操 作 系 统 中 的Android(开放)与iOS(封闭)、指令集中的RISC-V(开放)与x86(封闭)等。在DeepSeek R1之前,大语言模型的市场份额和性能主要由GPT等闭源模型主导。随着DeepSeek R1的表现追平同业龙头,开源模型和封闭模型之间的竞争可能会迅速升温。 训练算力需求热潮降温。据DeepSeek,V3模型的训练过程仅需280万GPU小时左右,成本约560万美元(假设使用H800,每GPU小时的租赁成本为2美元),仅为Llama 3.1(约5,800万美元)的9%,GPT-4(约6,300万美元)的8%,Claude 3.5Sonnet(约3,000-5,000万美元)的11-18%。如此高的训练效率主要得益于在负载均衡、通信、内存的策略优化以及使用MoE模型。AI模型的训练过程是一个极其耗费算力的过程,需要强大的算力基础设施能力。而作为最常用的训练加速器,NVIDIA的AI GPU需求巨大,而台积电和SK海力士的供应有限,一直处于供不应求的状态。同时,其他与训练相关的ASIC和通信器件(例如高端光学模块)的需求也一直很旺盛。随着DeepSeek的成功,高效训练和推理可能是大多数玩家会选择的道路。对高性能GPU或其他器件的需求可能会在短期内降温,但仍将保持增长,因为AI的发展不会停止。 重 点 关 注 股 票 :我 们 建 议 关 注 国 内 算 力 股 , 包 括 中 芯 国 际(981HK/688981CH,优于大市/中性)、北方华创(002371CH,优 于 大 市)、 中 微(688012CH,优 于 大 市)、 深 南 电 路(002916CH,优于大市)、中际旭创(300308CH,优于大市)、寒武纪(688256CH,未评级)、海光(688041CH,未评级);服务器和数据中 心供应 商包括联 想(992HK,优于大 市)、中兴 通讯(763HK/000063CH,优 于 大 市/优 于 大 市)、 浪 潮 信 息(000977CH,未评级)、紫光股份(000938CH,未评级)、工业富联(601138CH,未评级)。 全球AI发展或进一步加速,边缘AI及应用将是下一轮竞争的焦点。DeepSeek的成功表明,通过使用强化学习和MoE(专家混合模型)技术,训练过程可以更加高效和节省成本。当然,这需要更高水平的编码和工程设计。同时,它的推理能力几乎与GPT-o1等现模型相当。在MoE下,数千亿个参数被分类为各个领域的数百名专家,因此在推理时只激活相关领域的某些专家,这大大提高了计算和推理效率,并降低了训练成本。考虑到OpenAI、Meta、谷歌、微软等人工智能巨头拥有巨大的计算能力,这种MoE的成功使用可能会大大加速人工智能的发展。边缘AI一直备受关注,因为安全和隐私问题对于用户,尤其是企业和政府来说是不可忽视的。将人工智能模型从云端转移到边缘可以解决这一问题,但需要本地设备上更多的计算能力。自2023年底以来,AI电脑和AI智能手机已成为一种趋势。在CES2025上占据了焦点的AI眼镜也进入了战场。 中美人工智能技术差距将加速缩小。自2022年GPT-3.5发布以来,得益于美国领先的芯片设计和制造能力以及对中国的供应限制,美国AI发展迅速。领先企业纷纷推出自己的大语言和多模态模型。在中国,百度、阿里巴巴和字节跳动等大型互联网公司借助其已经建立的计算能力和强大的数据优势,推出了自己的模型文心一言、通义千问和豆包。同时其他一些参与者和初创公司也展示了自己的模型,并获得了良好的市场反响,包括月之暗面的Kimi、Minimax和DeepSeek。DeepSeek在没有最先进的AIGPU的情况下,通过工程创新实现了突破并证明了其卓越的性能。未来中美人工智能发展之间的技术差距可能会进一步缩小。同时,美国可能会实施更多限制,进一步限制中国获得现有的相关AI ASIC。 开源与闭源的竞争愈演愈烈。DeepSeek是开源AI模型之一,其代码和模型结构对用户和社区开放,可供查看和编辑。大部分开源模型可以免费使用,但如果不支持云端使用,则可能需要一定的部署成本。Meta的Llama 3.1和Gemma-7B是两种开源模型。而GPT是一种闭源模型,其源代码和结构不公开,通常需要许可证才能使用,费用相对较高。其他闭源模型包括百度的文心一言、苹果的Siri、快手的可灵等。开源与闭源之间的竞争 多模态AI与AI Agent步入焦点。与大语言模型这类单模态模型(文本)不同,多模态AI是指能够同时处理和整合多种类型数据(如文本、图像、音频、视频等)的AI模型。典型的例子有快手的可灵(文本/图像转图像/视频)、DALL•E(文本转图像)、StableDiffusion(文本/图像转图像)等。多模态AI拓宽了AI的能力,丰 Agent需要多模态AI,因此需要更多时间来开发。Agent AI潜力巨大,可用于人形机器人、智能家居、自动驾驶、医疗保健、客户服务等领域。 富了输入、处理和输出的数据类型,可广泛应用于医疗、制造、AR/VR等多个领域。再进一步,AI Agent出现了。AI Agent是一种能够感知环境、收集和处理信息、做出决策并做出反应的AI系统。它的主要特征有:(1)独立,不受人为干扰;(2)交互,与用户和其他系统通信;(3)自适应,根据环境和变化调整行为;(4)目标驱动,优化路径和行为以达到某一目标。当然,AI 评级定义: 优于大市─于未来12个月预期回报为高于10%中性─于未来12个月预期回报在-10%至10%之间弱于大市─于未来12个月预期回报低于-10% 分析师证明: 本文作者谨此声明:(i)本文发表的所有观点均正确地反映作者有关任何及所有提及的证券或发行人的个人观点,并以独立方式撰写;(ii)其报酬没有任何部分曾经,目前或将来会直接或间接与本文发表的特定建议或观点有关;及(iii)该等作者没有获得与所提及的证券或发行人相关且可能影响该等建议的内幕信息/非公开的价格敏感数据。本文作者进一步确定(i)他们或其各自的关联人士(定义见证券及期货事务监察委员会持牌人或注册人操守准则)没有在本文发行日期之前的30个历日内曾买卖或交易过本文所提述的股票,或在本文发布后3个工作日(定义见《证券及期货条例》(香港法例第571章))内将买卖或交易本文所提述的股票;(ii)他们或其各自的关联人士并非本文提述的任何公司的雇员;及(iii)他们或其各自的关联人士没有拥有本报告提述的证券的任何金融利益。 免责声明: 本文由建银国际证券有限公司编写。建银国际证券有限公司为建银国际(控股)有限公司(「建银国际控股」)和中国建设银行股份有限公司(「建行」)全资附属公司。本文内容之信息相信从可靠之来源所得,但建银国际证券有限公司,其关联公司及/或附属公司(统称「建银国际证券」)不对任何人士或任何用途就本文信息的完整性或准确性或适切性作出任何形式担保、陈述及保证(不论明示或默示)。当中的意见及预测为我们于本文日的判断,并可更改,而无需事前通知。建银国际会酌情更新其研究报告,但可能会受到不同监管的阻碍。除个别行业报告为定期出版,大多数报告均根据分析师的判断视情况不定期出版。预测、预期及估值在本质上是推理性的,且可能以一系列偶发事件为基础。读者不应将本文中的任何预测、预期及估值视作为建银国际证券或以其名义作出的陈述或担保,或认为该等预测、预期或估值,或基本假设将实现。投资涉及风险,过去的表现并不反映未来业绩。本文的信息并非旨在对任何有意投资者构成或被视为法律、财务、会计、商业、投资、税务或任何专业意见,因此不应因而作为依据。本文仅作参考资讯用途,在任何司法管辖权下的地方均不应被视为购买或销售任何产品、投资、证券、交易策略或任何类别的金融工具的要约或招揽。建银国际不对收件人就本报告中涉及的证券的可用性(或相关投资)做任何陈述。本文中提及的证券并非适合在所有司法管辖权下的地方或对某些类别的投资者进行销售。建银国际证券及其它任何人仕对使用本文或其内容或任何与此相关产生的任何其它情况所引发的任何损害或损失(不论直接的、间接的、偶然的、示范性的、补偿性的、惩罚性的、特殊的或相应发生的)概不负上任何形式的责任。本文所提及的证券、金融工具或策略并不一定适合所有投资者。本文作出的意见及建议并没有考虑有意投资者的财政情况、投资目标或特殊需要,亦非拟向有意投资者作出特定证券、金融工具及策略的建议。本文的收件人应仅将本文作为其做出投资决定时的其中一个考虑因素,并应自行对本文所提及的公司之业务、财务状况及前景作出独立的调查。读者应审慎注意(i)本文所提及的证券的价格和价值以及来自该等证券的收益可能有所波动;(ii)过去表现不反应未来业绩;(iii)本文中的任何分析、评级及建议为长期性质的(至少12个月),且与有关证券或公司可能出现的表现的短期评估无关联。在任何情况下,未来实际业绩可能与本文所作的任何前瞻性声明存在重大分歧;(iv)未来回报不受保证,且本金可能受到损失;以及(v)汇率波动可能对本文提及的证券或相关工具的价值、价格或收益产生不利影响。应注意的是,本文仅覆盖此处特定的证券或公司,且不会延伸至此外的衍生工具,该等衍生工具的价值可能受到诸多因素的影响,且可能与相关证券的价值无关。该等工具的交易存在风险,并不适合所有投资者。尽管建银国际证券已采取合理的谨慎措施确保本文内容提及的事实属正确、而前瞻性声明、意见及预期均基于公正合理的假设上,建银国际证券不能对该等事实及假设作独立的复核,且建银国际证券概不对其准确性、完整性或正确性负责,亦不作任何陈述或保证(不论明示或默示)。除非特别声明,本文提及的证券价格均为当地市场收盘价及仅供参考而已。没有情况表明任何交易可以或可能依照上述价格进行,且任何价格并不须反映建银国际证券的内部账簿及记录或理论性模型基础的估值,且可能基于某些假设。不同假设可能导致显著不同的结果。任何此处归于第三方的声明均代表了建银国际对由该第三方公开或通过认购服务提供的数据、信息以及/或意见的阐释,且此用途及阐释未被第三方审阅或核准。除获得所涉及到的第三方书面同意外,禁止以任何形式复制及分发该等第三方的资料内容。收件人须对本文所载之信息的相关性、准确性及足够性作其各自的判断,并在认为有需要或适当时就此作出独立调查。收件人如对本文内容有任何疑问,应征求独立法律、财务、会计、商业、投资和/或税务意见并在做出投资决定前使其信纳有关投资符合自己的投资目标和投资界限。 使用超链接至本文提及的其它网站或资源(如有)的风险由使用者自负。这些链接仅以方便和提供信息为目的,且该等网站内容或资源不构成本文的一部分。该等网站提供的内容、精确性、意见以及其它链接未经过建银国际证券的调查、核实、监测或核准。建银国际证券明确拒绝为该等网站出现的信息承担任何责任,且不对其完整性、准确性、适当性、可用性及安全性作任何担保、陈述及保证(不论明示或默示)。在进行任何线上或线下访问或与这些第三方进行交易前,使用者須对该等网站全权负责查询、调