小米大模型团队近日推出MiMo-V2.5-Pro-UltraSpeed极速推理版本与MiMo Code V0.1.0开源编程助手。
核心观点与关键数据
- MiMo-V2.5-Pro-UltraSpeed:采用1T参数MoE架构,UltraSpeed模式输出速度首破1000 tokens/s,依托1个标准8卡通用GPU节点实现,发布后12小时内收到逾3000家企业试用申请。
- UltraSpeed模式技术实现:通过MXFP4量化、DFlash投机解码及TileRT系统优化协同,以约3倍标准版定价换取约10倍输出速度。
- 应用场景价值:在固定延迟预算内大批量调用模型推理场景(如在线内容审核、实时风控评分)中,吞吐量提升直接降低单位调用成本,加速商业落地。
- MiMo Code开源编程助手:以MIT协议完全开源,个人与企业可自由使用及二次开发。
- 性能表现:同等MiMo-V2.5底模加持下,Agent系统层面SWE-Bench Pro得分62%(超出ClaudeCode的57%),Terminal Bench 2领先5个百分点(差异源于Agent编排机制)。
- 长程编码任务优化:引入三重持久记忆机制(项目记忆+会话检查点+任务进度)与/dream自动记忆压缩命令,解决上下文丢失问题。
- 生态与导流:完全开源策略有利于扩大开发者生态,并形成对小米云服务及MiMo API调用的正向导流。