行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

中信科技小米MiMoV25ProUltraSpeed极速推理模式

2026-06-12 未知机构尊敬冯

小米大模型团队近日推出MiMo-V2.5-Pro-UltraSpeed极速推理版本与MiMo Code V0.1.0开源编程助手。

核心观点与关键数据

MiMo-V2.5-Pro-UltraSpeed：采用1T参数MoE架构，UltraSpeed模式输出速度首破1000 tokens/s，依托1个标准8卡通用GPU节点实现，发布后12小时内收到逾3000家企业试用申请。
UltraSpeed模式技术实现：通过MXFP4量化、DFlash投机解码及TileRT系统优化协同，以约3倍标准版定价换取约10倍输出速度。
应用场景价值：在固定延迟预算内大批量调用模型推理场景（如在线内容审核、实时风控评分）中，吞吐量提升直接降低单位调用成本，加速商业落地。
MiMo Code开源编程助手：以MIT协议完全开源，个人与企业可自由使用及二次开发。
性能表现：同等MiMo-V2.5底模加持下，Agent系统层面SWE-Bench Pro得分62%（超出ClaudeCode的57%），Terminal Bench 2领先5个百分点（差异源于Agent编排机制）。
长程编码任务优化：引入三重持久记忆机制（项目记忆+会话检查点+任务进度）与/dream自动记忆压缩命令，解决上下文丢失问题。
生态与导流：完全开源策略有利于扩大开发者生态，并形成对小米云服务及MiMo API调用的正向导流。

小米大模型团队近日同步推出MiMo-V2.5-Pro-UltraSpeed极速推理版本与MiMo Code V0.1.0开源编程助手。旗舰MiMo-V2.5-Pro为1T参数MoE架构，UltraSpeed模式输出速度首破1000 tokens/s， ☀【中信科技】小米MiMo-V2.5-Pro-UltraSpeed极速推理模式及MiMo Code V0.1.0编程助手正式发布，AI进程进一步加速小米大模型团队近日同步推出MiMo-V2.5-Pro-UltraSpeed极速推理版本与MiMo Code V0.1.0开源编程助手。旗舰MiMo-V2.5-Pro为1T参数MoE架构，UltraSpeed模式输出速度首破1000 tokens/s，依托1个标准8卡通用GPU节点实现，发布后12小时内收到逾3000家企业试用申请。 MiMo Code以MIT协议完全开源，个人与企业均可自由使用及二次开发。推理端核心技术：UltraSpeed模式以标准版约3倍定价换取约10倍输出速度，底层依赖MXFP4量化、DFlash投机解码及TileRT系统优化协同实现。 Coding场景token接受率达6-7/8，支持Best-of-N与Tree Search等高并发推理策略。对于需要在固定延迟预算内大批量调用模型推理的应用场景（如在线内容审核、实时风控评分、Agent任务拆解），推理吞吐量的数量级提升直接降低单位调用成本，有助于加速相关场景的商业落地。编程助手端：MiMo Code在同等MiMo-V2.5底模加持下，Agent系统层面SWE-Bench Pro得分62%，超出ClaudeCode的57%，Terminal Bench 2同样领先5个百分点，差异来源于Agent编排机制而非底模本身。产品引入三重持久记忆机制（项目记忆+会话检查点+任务进度）与/dream自动记忆压缩命令，解决长程编码任务中上下文丢失问题。完全开源策略有利于扩大开发者生态，并形成对小米云服务及MiMo API调用的正向导流。

点击免费查看完整报告

中信科技小米MiMoV25ProUltraSpeed极速推理模式

你可能感兴趣

小米春季发布会SU7改款及AI生态升级中信科技小米春季发布

当犯罪手段极速演进，金融犯罪（FinCrime）合规运营模式亟需变革

当犯罪手段极速演进，金融犯罪（FinCrime）合规运营模式亟需变革：金融犯罪合规运营服务（FinCrime Compliance Managed Service）的必要性

【风口研报·洞察】小米推出MiMo推理大模型，仅用7B参数超越OpenAIo1-mini，其轻量化设计或驱动AI端侧需求爆发，模型端侧化趋势下端侧算力-提升成为共识..

大推理时代下看好小米AI产业链投资机会20241226

电子行业周报：美光业绩指引超预期，小米大模型展现推理性价比

SPX申请100万颗计算星座极速解读东北空间科技事件

国金计算机科技3C订单超预期3D打印景气度极速抬升

中小盘IPO专题：CDR系列十：小米“H股+CDR”发行模式研究

纺织品和服装行业小米&网易严选&南极电商模式与数据对比：白牌电商，星辰大海