AI智能总结
# Qwen登顶非推理国产模型冠军。 Qwen2.5-Max于1月29日发布,2月4日凌晨,Chatbot Arena公布了最新的大模型盲测榜单,通义千问Qwen2.5-Max凭借1332分的成绩,位列全球第七,并成为非推理类中国大模型的冠军。 同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(H 【国盛计算机】千问登顶非推理国产模型冠军,大模型良性竞争加速 # Qwen登顶非推理国产模型冠军。 Qwen2.5-Max于1月29日发布,2月4日凌晨,Chatbot Arena公布了最新的大模型盲测榜单,通义千问Qwen2.5-Max凭借1332分的成绩,位列全球第七,并成为非推理类中国大模型的冠军。 同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。 # ScalingLaw仍在验证。 据Qwen团队Qwen2.5-Max是超大规模的MoE模型,使用超过20万亿token的预训练数据及精心设计的后训练方案进行训练。 持续提升数据规模和模型参数规模能够有效提升模型的智能水平。 接下来Qwen团队除了在预训练的scaling继续探索外,将大力投入强化学习的scaling,希望能实现超越人类的智能。 我们认为国内一流非推理模型的进展有助于推理模型的能力进一步强化。 #大模型进展加速应用百花齐放。 近期字节、deepseek,阿里、openai等国内外厂商竞相发布模型新进展。 我们认为,大模型厂商之间的良性竞争,有利于应用加速落地。 尤其目前国内公司进展迅速,有望打开以互联网大厂为核心的AI生态投资机遇。