您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:美银研报重点关注DeepSeek开源周活动及其对人工智能应用的推动作用 - 发现报告

美银研报重点关注DeepSeek开源周活动及其对人工智能应用的推动作用

2025-03-05未知机构M***
AI智能总结
查看更多
美银研报重点关注DeepSeek开源周活动及其对人工智能应用的推动作用

DeepSeek于2月24 – 28日举办了开源周活动,发布了一系列开源项目,包括FlashMLA、DeepEP、DeepGEMM、优化的并行策略以及Fire – Flyer文件系统(3FS)。 3月1日,DeepSeek在社交媒体上进一步披露了数据,表明其V3和R1模型每日的理论成本利润 美银-研报重点关注DeepSeek开源周活动及其对人工智能应用的推动作用 DeepSeek于2月24 – 28日举办了开源周活动,发布了一系列开源项目,包括FlashMLA、DeepEP、DeepGEMM、优化的并行策略以及Fire – Flyer文件系统(3FS)。 3月1日,DeepSeek在社交媒体上进一步披露了数据,表明其V3和R1模型每日的理论成本利润率高达545%。 本报告分析了这些发展对行业的重要影响,主要涉及软件算法优化对AI硬件性能的提升、降低LLM应用门槛以及更经济的API定价如何推动AI应用普及。 软件算法优化提升AI硬件性能 DeepSeek开源周活动揭示了软件算法优化对AI硬件性能提升的巨大潜力。 首日发布的FlashMLA是为英伟达Hopper GPU(如H800)量身定制的优化MLA解码内核,能够更高效地处理可变长度序列,显著减少基于Transformer模型的解码时间。 第二天推出的DeepEP是一个开源库,旨在为MoE模型训练和推理优化EP通信。 第三天公布的DeepGEMM是一个FP8 GEMM库,为DeepSeek – V3和R1模型的训练和推理管道提供支持。 第四天推出了优化的并行策略,包括两项创新:DualPipe(双向管道并行算法)和EPLB(面向MoE模型的专家并行负载均衡器)。 最后一天发布了3FS,这是一个专为AI应用中大规模数据管理而设计的专用文件系统。 成本效益提高推动LLM普及 DeepSeek报告的成本利润数据反映了LLM开发和应用的成本效益正在提高。 DeepSeek估计其V3和R1模型的日推理成本为约8.7万美元,这是基于每小时2美元的英伟达H800 GPU租用率计算的。 同时,假设所有处理的tokens都按DeepSeek – R1的定价计费,预计每日总收入约为56.2万美元。 虽然实际收入可能因模型间定价差异、某些服务的免费访问以及非高峰时段的折扣率而降低,但DeepSeek能够在较低运营成本下实现高理论利润率,这有助于民主化LLM开发,使其对初创企业和小型企业更加易于接触和实施。 API定价助力AI应用商业化 API定价方面的比较显示,DeepSeek – R1的API定价远低于OpenAI的o1,使其成为最具成本效益的LLM之一。 根据研究报告中的图表4显示,DeepSeek – R1在成本和质量比较中表现优异,这表明随着API定价对软件公司开发AI应用变得更加经济实惠,它可能会加速AI应用和商业化的步伐。 总体而言,SaaS业务模型的软件公司可能会从中受益更多,因为它们需要更短的时间将AI功能添加到现有软件产品中或推出新的AI产品。 按功能划分,办公软件、ERP和金融行业的软件领导者可能会看到更快的AI商业化。 金山软件(C – 1 – 7;港币40.35元)是美银在中国软件领域的首选。 主要LLM发布情况 研究报告还提供了自2024年12月以来发布的主要LLM列表,显示了国内外公司最近发布的新模型。 这些包括Meta的Llama 3.3(开源非推理模型)、Google的Gemini 2.0(封闭源非推理模型)、DeepSeek的DeepSeek – V3(开源非推理模型)和DeepSeek – R1(开源推理模型)、字节跳动的Doubao1.5 – Pro(封闭源非推 理模型)、阿里巴巴的Qwen2.5 – Max(封闭源非推理模型)、OpenAI的o3 – mini(封闭源推理模型)、xAI的Grok – 3/Grok – 3 mini(封闭源非推理模型)、Anthropic的Claude 3.7 Sonnet(封闭源推理模型)以及OpenAI的GPT – 4.5(封闭源非推理模型)。 中国软件公司与DeepSeek集成情况 报告还详细列出了中国多家软件公司与DeepSeek集成的产品,这些公司涵盖办公软件、企业服务、网络安全、IT外包/咨询、金融行业软件、数字营销软件、汽车软件和物业软件等多个领域。 这表明DeepSeek的技术已在中国软件生态系统中获得广泛应用。 主要集成DeepSeek的公司包括金山软件(WPS Lingxi)、福昕软件(Foxit PDF编辑器/ Foxit AI助手)、金蝶(Cosmic平台、Cloud Constellation等)、用友网络(YonBIP/YonSuite等)、启明星辰和安恒信息等网络安全公司,以及中软国际、软通动力等IT服务提供商。 LLM定价比较 报告还提供了LLM定价比较,显示中国公司开发的LLM的输入和输出API定价普遍低于OpenAI。 DeepSeek – V3的标准价格(香港时间8:30am– 00:30am)为每百万tokens输入$0.27(缓存未命中)、$0.07(缓存命中),输出$1.10;优惠价格(香港时间00:30am– 8:30am)为每百万tokens输入$0.135(缓存未命中)、$0.035(缓存命中),输出$0.55。 作为比较,OpenAI的GPT – 4.5定价为每百万tokens输入$75(缓存未命中)、$37.50(缓存命中),输出$150。 美银对金山软件的价格目标及风险 美银的价格目标(PO)对金山软件为53港元,基于30倍12个月远期估计P/E,依据过去七年的历史平均值(不包括亏损期),认为这一估值方法能更好地反映其盈利增长前景。 上行风险包括新游戏收入贡献强于预期、金山办公室在中国比竞争对手更早推出AI驱动的办公软件、子公司和联营公司的股价显著上涨。 下行风险包括新游戏发布延迟或新游戏审批暂停、金山办公室收入增长慢于预期以及金山云净亏损扩大。 总结 综上所述,DeepSeek的开源周活动及其公布的模型运营数据表明,通过软件算法优化可以显著提升AI硬件性能,降低LLM开发和应用的门槛,使AI技术更加经济实惠,从而加速软件公司的AI应用和商业化进程。