您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:国联民生海外千问发布最新旗舰推理模型性能可媲美GPT52Thinki - 发现报告

国联民生海外千问发布最新旗舰推理模型性能可媲美GPT52Thinki

2026-01-28 未知机构 还是郁闷闷啊
报告封面

阿里千问发布旗舰推理模型Qwen3-Max-Thinking。 该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。#相较于此前Instruct版本、Thinking版本在Agent 【国联民生海外】千问发布最新旗舰推理模型,性能可媲美GPT-5.2-Thinking、Gemini-3 Pro等闭源模型,持续建议关注阿里巴巴! 阿里千问发布旗舰推理模型Qwen3-Max-Thinking。 该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。 #相较于此前Instruct版本、Thinking版本在Agent工具调用、复杂逻辑和深度推理任务中表现出更优的能力。 在多项权威基准测试中可与GPT-5.2-Thinking、Claude-Opus-4.5、Gemini-3 Pro等闭源顶级模型竞争甚至超越。 推理技术创新: 1模型采用全新#测试时扩展(Test-timeScaling)机制、避免重复推导已知结论、实现了更高的上下文利用效率。 不同于简单增加并行推理路径数量;测试时扩展机制可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算和更智能的推理结果。 在启用工具的“人类最后的测试”HLE中,千问录得当前所有模型的最高分。 2模型大幅增强自主调用工具的原生Agent能力。 #与早期需要用户手动选择工具的方法不同、该模型能在对话中自主选择并调用其内置的搜索、记忆和代码解释器等Agent工具功能,从而有效解决真实复杂任务并缓解幻觉。 我们预计Qwen3.5即将推出、有望实现工程上更新迭代&千问App在阿里体系内的打通式布局有望提速&叠加平头哥在芯片领域的前瞻布局,我们认为阿里巴巴是现有上市公司中为数不多的硬件+软件+生态全方位布局的公司。 建议持续关注【阿里巴巴】。