您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华鑫证券]:计算机行业周报:Gemma 4 12B开启本地多模态AI新时代,MiniMax M3正式发布 - 发现报告

计算机行业周报:Gemma 4 12B开启本地多模态AI新时代,MiniMax M3正式发布

信息技术 2026-06-10 任春阳 华鑫证券 @·*&&
报告封面

Gemma 4 12B开启本地多模态AI新时代,MiniMax M3正式发布 —计 算 机行 业 周 报 投资要点 推荐(维持) ▌算力:算力租赁价格平稳,MiniMax新一代旗舰大模型MiniMax M3正式发布 分析师:任春阳S1050521110006rency@cfsc.com.cn 2026年6月1日,MiniMax发布新一代旗舰大模型MiniMaxM3。该模型在架构与能力上实现双重突破:采用MSA稀疏注意力机制,支持100万上下文窗口,预填充与解码速度较上代分别提升9倍和15倍以上;同时为原生多模态模型,支持图片、视频输入及电脑操作,在多模态测试集OmniDocBench中得分超越Gemini 3.1 Pro,并在面向自主Agent的端到端评测框架Claw-Eval中取得最高分。 行 业 相 对 表 现 ▌AI应用:Character.AI周访问量环比+11.57%,Gemma 4 12B开启本地多模态AI新时代 2026年6月4日,谷歌发布了轻量级多模态模型Gemma 412B,一款能够在16GB内存的轻薄笔记本上全离线流畅运行的高性能模型。该模型抛弃了传统的编码器结构,能够直接处理文本、图像和音频输入。与此同时,DeepMind的首席执行官Demis Hassabis也公开表示,Gemma 4全系列模型的下载量已突破1.5亿次。 相 关 研 究 ▌AI融资动向:Ramp完成7.5亿美元后估值达440亿美元 1、 《 计 算 机 行 业 周 报 :ClaudeOpus4.8发布,小米MiMo大模型API永久降价》2026-06-022、 《 计 算 机 行 业 点 评 报 告 :Symbotic(SYM):Q2营收增长势头强劲,调整后EBITDA同比翻倍》2026-05-313、《计算机行业点评报告:小马智行(PONY):Robotaxi商业化加速兑现,全球版图扩张与成本下探》2026-05-29 2026年6月4日,AI金融公司Ramp完成7.5亿美元资,投后估值攀升至440亿美元,累计融资规模达30亿美元。本轮融资由Iconiq Capital、新加坡主权财富基金GIC以及安大略省教师退休金计划联合领投,高盛成长股权、摩根士丹利投资管理及 业客户,以AI驱动的企业信用卡及财务自动化平台为核心,推出自主AI智能体用于欺诈检测和交易审核,并于2026年3月上线新功能,支持AI智能体完成企业支付等操作。 ▌投资建议 2026年6月2日,英伟达宣布其Spectrum-X以太网硅光技术已全面量产。新一代Spectrum-X交换机基于光电一体封装技术(CPO)构建,支持其VeraRubin平台在数据中心实现横向扩展与跨区域扩展,为AI工厂部署提供网络支撑。公司通过与台积电、SPIL、T X以太网硅光技术的量产,四家企业分别在硅光芯片制造、芯 片级封装测试、激光芯片与光模组、系统组装环节提供核心技术支持。作为英伟达全栈协同设计的典范,该技术相较传统收发器网络实现能效与AI集群正常运行时间均提升5倍,部署效率提升30%,为百万GPU级AI工厂奠定了坚实的网络基 础 , 目 前 已 获 得CoreWeave、Lambda及Oracle CloudInfrastructure的率先采用。其大规模CPO部署突破了光互连在功耗、可靠性与部署时间方面的瓶颈,消除了制约AI集群规模扩张的关键障碍。光通信是英伟达战略布局的核心方向之一,在本周举办的Computex2026上,光互连领域龙头企业迈威尔科技首席执行官与黄仁勋同台出席。黄仁勋表示迈威尔科技有望成为下一家市值突破万亿美元的科技企业,并透露双方正进一步深化战略合作关系,共同打造支撑下一代人工智能数据中心运行的关键网络与连接基础设施体系。 2026年截至6月,英伟达已密集对四家美国行业龙头企业进行 大 规 模 投 资 :3月 分 别 向 迈 威 尔 科 技 、Lumentum及Coherent各注资20亿美元,其中与迈威尔科技的合作旨在将其定制AI芯片和网络技术整合进英伟达NVLink系统,对Lumentum和Coherent的投资则全面押注光互联技术 与封装集成;5月宣布与康宁达成多年期商业与技术合作伙伴关系,总投资上限32亿美元,支持其将美国光连接制造能力提升10倍、光纤产量提升超50%,并在北卡罗来纳州和得克萨斯州新建三座先进制造工厂。英伟达作为全球人工智能产业绝对龙头,其全栈式技术协同与产业链资本投入,构成了行业长期增长最坚实的确定性基础。Spectrum-X硅光互联平台全面量产及共封装光学(CPO)架构大规模商用,标志着光通信行业进入技术迭代与需求爆发的共振期。AI算力建设需求的加速将驱动光通信板块景气度持续上行。 中长期,建议关注专注于半导体等高端制造业的罗博特科(300757.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)、AI智能文字识别与商业大数据领域巨头的合合信息(688615.SH)、深耕工业AI与软件并 长 期 服 务 高 端 装 备 等 领 域 头 部 客 户 的 能 科 科 技(603859.SH)。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:算力租赁价格平稳,MINIMAX新一代旗舰大模型MINIMAX M3正式发布.................51.1、Tokens跟踪.......................................................................51.2、数据跟踪:腾讯云下调DeepSeek-V4系列模型价格,阿里云上线Qwen3.7-Plus..............61.3、产业动态:MiniMax新一代旗舰大模型MiniMax M3正式发布..............................72、AI应用动态:CHARACTER.AI周访问量环比+11.57%,GEMMA 4 12B开启本地多模态AI新时代........92.1、周流量跟踪:Character.AI周访问量环比+11.57%......................................92.2、产业动态:下载量突破1.5亿次,Gemma 4 12B开启本地多模态AI新时代.................93、AI融资动向:RAMP完成7.5亿美元4、行情复盘..............................................................................145、投资建议..............................................................................166、风险提示..............................................................................17 图表目录 图表1:TOKENS规模LEADERBOARD..............................................................5图表2:市场份额占据示意....................................................................6图表3:MINIMAX M3基准测试结果横向对比图....................................................7图表4:MINIMAX M3于POSTTRAINBENCH后训练能力测试中的表现情况...............................7图表5:MINIMAX M3自动优化CUDA内核成果图...................................................8图表6:MINIMAX M3模型API调用价格表........................................................8图表7:2026.5.29-2026.6.4 AI相关网站流量...................................................9图表8:GEMMA 4 12B与GEMMA 4 26B-A4B在单张RTX 4090显卡上的对比..........................10图表9:GEMMA 4 12B的无编码器统一架构......................................................11图表10:GEMMA 4 12B与传统多模态模型的对比.................................................11图表11:上周AI初创公司融资动态...........................................................12图表12:上周(2026.6.1-2026.6.5日)指数日涨跌幅...........................................14图表13:上周(2026.6.1-2026.6.5日)AI算力指数内部涨跌幅度排名............................14图表14:上周(2026.6.1-2026.6.5日)AI应用指数内部涨跌幅度排名............................15图表15:图表16:重点关注公司及盈利预测............................................................17 1、算力动态:算力租赁价格平稳,MiniMax新一代旗舰大模型MiniMax M3正式发布 1.1、Tokens跟踪 根据OpenRouter公开数据,2026年6月1日至6月7日,周度Token消耗量有所上升,调用量为36.1T,环比上周增加13.52%。在Tokens规模Leaderboard前五名中,DeepSeek的DeepSeek V4 位居第二,Minimax的Minimax M3以2.5T tokens位居第三;Xiaomi的MiMo-V2.5以2.19Ttokens位列第四;OpenRouter旗下的Owl Alpha以1.95Ttokens位居第五; 从市场份额维度来看,DeepSeek以6.75T tokens占据18.7%的份额,稳居首位;Anthropic以5.29T tokens占据14.6%,位列第二;Google、MiniMax、Xiaomi则分别以4.29T、3.05T、2.95Ttokens,对应占据11.9%、8.4%、8.2%的市场份额。 6月1日,微软旗下人工智能编程工具GitHub Copilot正式实施计费模式调整,从固定额度订阅制转向按Token用量计费。新模式下,Copilot按照用户实际Token消耗(包括输入、输出及缓存)核算成本,具体费率则按照不同模型的API定价执行。 6月5日,腾讯云总经理、TokenHub负责人高航于AI产业应用大会上透露,公司大模型服务平台TokenHub上线三个月以来,每月连续增长呈翻倍态势,现日Token消耗量已突破5万亿。 6月5日,华为云发布四大基础设施新品之一——AICS灵衢智算集群。该集群基于华为独立自主的所有算力芯片和全栈全国产化的算力硬件系统,支持10万卡级规模,总算力达200E 务可用性高达99.95%。 近期,中国信通院联合多家机构将于6月16日在北京举办高质量Token服务研讨会。