行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国盛计算机千问登顶非推理国产模型冠军大模型良性竞争加速

2025-02-06 未知机构 Bach🐮

核心观点：通义千问Qwen2.5-Max在大模型盲测中表现突出，成为非推理类中国大模型的冠军，推动了大模型领域的良性竞争和应用加速。
关键数据：
- Qwen2.5-Max在Chatbot Arena榜单中位列全球第七，得分为1332分。
- 在数学和编程等单项能力上排名第一，硬提示（Hard prompts）方面排名第二。
技术进展：
- Qwen2.5-Max是超大规模的MoE模型，使用超过20万亿token的预训练数据，并采用精心设计的后训练方案。
- Qwen团队将持续提升数据规模和模型参数规模，并投入强化学习的scaling以实现超越人类的智能。
研究结论：
- 国内一流非推理模型的进展有助于推理模型能力的进一步强化。
- 大模型厂商之间的良性竞争加速了应用落地，尤其国内公司进展迅速，有望打开以互联网大厂为核心的AI生态投资机遇。

# Qwen登顶非推理国产模型冠军。 Qwen2.5-Max于1月29日发布，2月4日凌晨，Chatbot Arena公布了最新的大模型盲测榜单，通义千问Qwen2.5-Max凭借1332分的成绩，位列全球第七，并成为非推理类中国大模型的冠军。同时，Qwen2.5-Max在数学和编程等单项能力上排名第一，在硬提示（H 【国盛计算机】千问登顶非推理国产模型冠军，大模型良性竞争加速 # Qwen登顶非推理国产模型冠军。 Qwen2.5-Max于1月29日发布，2月4日凌晨，Chatbot Arena公布了最新的大模型盲测榜单，通义千问Qwen2.5-Max凭借1332分的成绩，位列全球第七，并成为非推理类中国大模型的冠军。同时，Qwen2.5-Max在数学和编程等单项能力上排名第一，在硬提示（Hard prompts）方面排名第二。 # ScalingLaw仍在验证。据Qwen团队Qwen2.5-Max是超大规模的MoE模型，使用超过20万亿token的预训练数据及精心设计的后训练方案进行训练。持续提升数据规模和模型参数规模能够有效提升模型的智能水平。接下来Qwen团队除了在预训练的scaling继续探索外，将大力投入强化学习的scaling，希望能实现超越人类的智能。我们认为国内一流非推理模型的进展有助于推理模型的能力进一步强化。 #大模型进展加速应用百花齐放。近期字节、deepseek，阿里、openai等国内外厂商竞相发布模型新进展。我们认为，大模型厂商之间的良性竞争，有利于应用加速落地。尤其目前国内公司进展迅速，有望打开以互联网大厂为核心的AI生态投资机遇。

点击免费查看完整报告

国盛计算机千问登顶非推理国产模型冠军大模型良性竞争加速

你可能感兴趣

计算机行业点评报告：阿里巴巴（BABA.N）：开源千问Qwen3.5-Plus模型，以“效率革命”重塑AI竞争格局

国盛计算机阿里千问APP发布会速递AI开启办事时代2026115早

Qwen35Max预览版首度亮相阿里千问登顶中国最强模型全球知

传媒行业动态跟踪：阿里视频生成模型登顶技术榜单，看好后续推理增强和Agent带动token用量加速

大厂B30A和国产卡的评测和采购判断，国内头部大模型差距判断，海内外云服务市场对比，千问Agent等

传媒行业周报：字节发布Seed 2.0系列模型，千问位居中国企业级大模型市场第一

国盛计算机刘高畅很多领导问我们本周一群里讲的各个智算中心需求真正加速是什么

计算机行业事件快评：Yi-34B性能登顶，国产开源大模型进阶迅速

快手可灵进展积极千问模型下载量稳居开源第一坚定看好2026年国产模型及应用投

计算机行业2025年1月投资策略：国产deepseek+豆包发力，海内外大模型刺激推理算力