行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业周报：Llama4多版本参数亮眼，DeepSeek公布推理时Scaling新论文

信息技术 2025-04-08 宝幼琛华鑫证券罗鑫涛Robin

核心观点与关键数据

算力动态

算力租赁价格平稳：本周算力租赁价格保持稳定，不同显卡配置的价格如A100-40G、A100-80G、A800-80G等均无显著变化。
Llama 4多版本参数亮眼：Meta开源首个原生多模态Llama 4，支持12种语言，发布两款模型：
- Llama 4 Scout：1090亿参数，17B活跃参数，16个专家，1000万上下文，可处理20+小时视频。
- Llama 4 Maverick：4000亿参数，17B活跃参数，128个专家，100万上下文，LMSYS排行榜上排名第二（ELO得分1417）。
技术亮点：Llama 4采用MoE架构，计算效率更高；支持多模态，采用早期融合技术；MetaP新训练方法优化超参数设置；支持200种语言预训练。

AI应用动态

Gemini搜索访问量环比+9.62%：AI相关网站流量数据中，Gemini访问量增速最快。
DeepSeek公布推理时Scaling新论文：
- 提出SPCT学习方法，提升GRM推理时间可扩展性。
- DeepSeek-GRM-27B基于Gemma-2-27B后训练，通过多次采样和元RM提升奖励质量。
- 实验结果显示SPCT显著提高GRM质量和可扩展性，优于现有方法。

AI融资动向

星海图完成A2、A3轮系列融资：总融资额超3亿元，2025年累计融资近1亿美元。
投资关注点：公司全栈要素齐备，具备端到端AI算法、全链路研发制造及商业化验证能力。
估值目标：若估值达50亿元，将成为业内第二梯队“排头兵”。

行情复盘

AI指数表现：AI算力指数/AI应用指数/万得全A/中证红利日涨跌幅分别为1.36%/0.19%/0.37%/0.97%。
个股表现：开普云（+10.52%）最大涨幅，宝信软件（-6.75%）最大跌幅；海信视像（+6.99%）最大涨幅，国光电器（-15.03%）最大跌幅。

投资建议

政策利好：美国白宫发布指令要求联邦机构任命AI官并制定应用战略。
推荐关注：嘉和美康（临床AI）、科大讯飞（AI核心）、寒武纪（芯片技术）、鼎通科技（高速连接器）、亿道信息（AI眼镜合作）、迈信林（算力扩张）、泓淋电力（高速铜缆）、唯科科技（新能源业务）。

风险提示

AI底层技术迭代速度不及预期。
政策监管及版权风险。
AI应用落地效果不及预期。
推荐公司业绩不及预期风险。

2025年04月08日 Llama 4多版本参数亮眼，DeepSeek公布推理时Scaling新论文 —计算机行业周报投资要点推荐(维持) ▌算力：Llama4多版本参数亮眼，2万亿多模态巨兽重登王座分析师：宝幼琛S1050521110002baoyc@cfsc.com.cn Meta官宣开源首个原生多模态Llama 4，首次采用MoE架构，支持12种语言，首批发布一共两款：第一款是Llama4Scout，规模较小，其共有1090亿参数，17B活跃参数，16个专家，1000万上下文；第二款是Llama4Maverick，规模较大，其共有4000亿参数，17B活跃参数，128个专家，100万上下文。在大模型LMSYS排行榜上，Llama 4 Maverick冲上第二（ELO得分1417），仅次于闭源Gemini2.5Pro。Llama4Scout最大亮点在于支持1000万上下文，相当于可以处理20+小时的视频，仅在单个H100 GPU（Int4量化后）上就能跑。在基准测试中，性能超越Gemma3、Gemini2.0Flash-Lite、Mistral3.1。Llama4模型是Llama系列模型中首批采用混合专家（MoE）架构的模型。在MoE模型中，单独的token只会激活全部参数中的一小部分。与传统的稠密模型相比，MoE架构在训练和推理时的计算效率更高，并且在相同的训练FLOPs预算下，能够生成更高质量的结果。资料来源：Wind，华鑫证券研究相关研究 1、《计算机行业周报：阿里深夜开源Qwen2.5-Omni，DeepSeek-V3上线新版本》2025-04-052、《计算机行业点评报告：文远知行（WRD.O）：收入承压与商业化突破并行，自动驾驶长赛道静待拐点》2025-04-043、《计算机行业点评报告：禾赛科技（HSAI.O）：激光雷达龙头加速业绩兑现，多元布局打开成长空间》2025-04-04 Llama 4是一个原生多模态模型，采用了早期融合技术，能把文本和视觉token无缝整合到一个统一的模型框架里。早期融合是个大进步，因为它可以用海量的无标签文本、图片和视频数据一起来预训练模型。 Meta还开发了一种叫做MetaP的新训练方法，能让他们更精确地设置关键的模型超参数，比如每层的学习率和初始化规模。这些精心挑选的超参数在不同的批大小、模型宽度、深度和训练token量上都能很好地适配。Llama 4通过在200种语言上预训练实现了对开源微调的支持，其中超过10亿个token的语言有100多种，整体多语言token量比Llama 3多出10倍。 ▌AI应用：Gemini搜索访问量环比+9.62%，DeepSeek公布推理时Scaling新论文近期，来自DeepSeek、清华大学的研究人员探索了奖励模型（RM）的不同方法，发现逐点生成奖励模型（GRM）可以统一纯语言表示中单个、成对和多个响应的评分。基于这一初步成果，论文的作者提出了一种新学习方法，即自我原则批评调整（SPCT），以促进GRM中有效的推理时间可扩展行为。通过利用基于规则的在线RL，SPCT使GRM能够学习根据输入查询和响应自适应地提出原则和批评，从而在一般领域获得更好的结果奖励。基于此技术，DeepSeek提出了DeepSeek-GRM-27B，它基于Gemma-2-27B用SPCT进行后训练。对于推理时间扩展，它通过多次采样来扩展计算使用量。通过并行采样，DeepSeek-GRM可以生成不同的原则集和相应的批评，然后投票选出最终的奖励。通过更大规模的采样，DeepSeek-GRM可以更准确地判断具有更高多样性的原则，并以更细的粒度输出奖励，从而解决挑战。除了投票以获得更好的扩展性能外，DeepSeek还训练了一个元RM。从实验结果上看，SPCT显著提高了GRM的质量和可扩展性，在多个综合RM基准测试中优于现有方法和模型，且没有严重的领域偏差。作者还将DeepSeek-GRM-27B的推理时间扩展性能与多达671B个参数的较大模型进行了比较，发现它在模型大小上可以获得比训练时间扩展更好的性能。虽然当前方法在效率和特定任务方面面临挑战，但凭借SPCT之外的努力，DeepSeek相信，具有增强可扩展性和效率的GRM可以作为通用奖励系统的多功能接口，推动LLM后训练和推理的前沿发展。 ▌AI融资动向:星海图“小步快跑式”融资，今年估值已翻倍 4月3日，星海图宣布接连完成A2、A3轮系列融资，领投方为凯辉基金，总融资额超3亿元人民币。这意味着2025年以来星海图已累计融资近1亿美元。星海图本次A2、A3轮系列融资由凯辉基金领投，联想创投、海尔资本等产业资本参投，老股东IDG资本、高瓴创投、百度风投、同歌创投等追投，其中部分老股东多轮满额、超额持续加注。星海图A1轮融资于今年2月完成，总融资额近3亿元，由蚂蚁集团独家领投，高瓴创投、IDG资本、北京机器人产业基金、百度风投、同歌创投等老股东追加投资。由此可见，星海图于2025年展开的A轮系列累计融资总额已达约1亿美元。星海图介绍，投资人最关注的是公司全栈要素齐备且实力较强的特点。具身智能产品的成功不只靠模型，而是底层零部件、整机设计及制造、场景理解能力等的系统性能力。公司创始团队具有业内领先的模型技术实力和产业落地经验，硬件能力也在过去一年里快速补齐。星海图目前已成为国内极少数同时具备端到端AI算法能力、全链路正向研发制造能力以及实际商业化验证能力的具身智能公司之一。星海图若估值达到50亿元，将成为业内第二梯队的“排头兵”。 ▌投资建议 4月8日消息，美国时间周一，白宫发布指令，要求联邦各机构任命首席人工智能官，并制定扩大政府人工智能应用的战略。备忘录还指示各机构在六个月内“制定人工智能战略，识别并消除负责任使用该技术的障碍，并实现全机构范围内的提升应用成熟度。我们仍然坚定认为，AI应用有望在今年诞生部份现象级应用。建议关注临床AI产品成功落地验证的嘉和美康（688246.SH）、以AI为核心的龙头厂商科大讯飞（002230.SZ）、芯片技术有望创新突破的寒武纪（688256.SH）、高速通信连接器业务或显著受益于GB200放量的鼎通科技（688668.SH）、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息（001314.SZ）、加快扩张算力业务的精密零部件龙头迈信林（688685.SH）、持续加码高速铜缆的泓淋电力（301439.SZ）、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技（301196.SZ）等。风险提示 1）AI底层技术迭代速度不及预期。2）政策监管及版权风险。3）AI应用落地效果不及预期。4）推荐公司业绩不及预期风险。正文目录 1、算力动态：算力租赁价格平稳，LLAMA 4多版本参数亮眼.....................................51.1、数据跟踪：算力租赁价格平稳......................................................51.2、产业动态：Llama 4多版本参数亮眼，2万亿多模态巨兽重登王座.......................52、AI应用动态：GEMINI搜索访问量环比+9.62%，DEEPSEEK公布推理时SCALING新论文.............72.1、流量跟踪：Gemini搜索访问量环比+9.62%...........................................72.2、产业动态：DeepSeek公布推理时Scaling新论文......................................73、AI融资动向：星海图“小步快跑式”融资，今年估值已翻倍..............................104、行情复盘..............................................................................115、投资建议..............................................................................136、风险提示..............................................................................13 图表目录图表1：本周算力租赁情况...............................................................5图表2：Llama4Maverickinstruction-tunedbenchmarks&Llama4Scoutinstruction-tunedbenchmarks........................................................................6图表3：2025.3.31-2025.4.4 AI相关网站流量.............................................7图表4：SPCT的两个阶段................................................................8图表5：不同方法和模型在奖励模型基准测试上的整体结果...................................9图表6：本周AI初创公司融资动态........................................................10图表7：本周指数日涨跌幅...............................................................11图表8：本周AI算力指数内部涨跌幅度排名................................................11图表9：本周AI应用指数内部涨跌幅度排名................................................12图表10：重点关注公司及盈利预测........................................................13 1、算力动态：算力租赁价格平稳，Llama4多版本参数亮眼 1.1、数据跟踪：算力租赁价格平稳本周算力租赁价格保持平稳。具体来看，显卡配置为A100-40G中，腾讯云16核+96G价格为28.64元/时，阿里云12核+94GiB价格为31.58元/时；显卡配置为A100-80G中，恒源云13核+128G价格为8.50元/时;阿里云16核+125GiB价格为34.74元/时；显卡配置为A800-80G中，恒源云16+256G价格为7.50元/时。 1.2、产业动态：Llama4多版本参数亮眼，2万亿多模态巨兽重登王座 Meta官宣开源首个原生多模态Llama4，首次采用MoE架构，支持12种语言，首批发布一共两款：第一款是Llama 4 Scout，规模较小，其共有1090亿参数，17B活跃参数，16个专家，1000万上下文；第二款是Llama4Maverick，规模较大，其共有4000亿参数，17B活跃参数，128个专家，100万上下文。在大模型LMSYS排行榜上，Llama 4 Maverick冲上第二（ELO得分1417），仅次于闭源Gemini 2.5 Pro。Llama 4 Scout最大亮点在于支持1000万上下文，相当于可以处理20+小时的视频，仅在单个H100 GPU（Int4量

点击免费查看完整报告

计算机行业周报：Llama4多版本参数亮眼，DeepSeek公布推理时Scaling新论文

核心观点与关键数据

算力动态

AI应用动态

AI融资动向

行情复盘

投资建议

风险提示

你可能感兴趣

行业周报：英伟达业绩亮眼，DeepSeek新突破，重视全球AI共振

计算机行业周报：DeepSeek发布V3.2双模型，谷歌DeepThink引领推理革命

计算机行业周报：大模型Scaling Law开启新范式，端侧智能加速落地

电子行业周报：英伟达业绩亮眼，训练推理共同出击

通信行业周报：DeepSeek打破scaling law，国产基础设施打造价值网络

传媒行业周观点：米哈游新游《崩坏：星穹铁道》表现亮眼，电竞国家集训队名单公布

医药生物行业：ESMO2020多项重磅进展公布，新靶点、新疗法表现亮眼，联合用药大势所趋

年报点评报告：《星之翼》等新游表现亮眼，AI应用“给麦”融合DeepSeek技术

交运行业周报：16年邮政数据公布，快递表现亮眼

建筑装饰行业周报：8月投资数据公布，竣工持续亮眼表现，基建形成一定拖累