行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国联民生海外千问发布最新旗舰推理模型性能可媲美GPT52Thinki

2026-01-28 未知机构还是郁闷闷啊

阿里千问发布旗舰推理模型Qwen3-Max-Thinking，该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。相较于此前Instruct版本、Thinking版本，Qwen3-Max-Thinking在Agent工具调用、复杂逻辑和深度推理任务中表现出更优的能力，多项权威基准测试中可与GPT-5.2-Thinking、Claude-Opus-4.5、Gemini-3 Pro等闭源顶级模型竞争甚至超越。

推理技术创新：

模型采用全新测试时扩展（Test-timeScaling）机制，避免重复推导已知结论，实现更高的上下文利用效率。不同于简单增加并行推理路径数量，该机制可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算和更智能的推理结果。在启用工具的“人类最后的测试”HLE中，千问录得当前所有模型的最高分。
模型大幅增强自主调用工具的原生Agent能力。与早期需要用户手动选择工具的方法不同，该模型能在对话中自主选择并调用其内置的搜索、记忆和代码解释器等Agent工具功能，从而有效解决真实复杂任务并缓解幻觉。

研究结论：我们预计Qwen3.5即将推出，有望实现工程上更新迭代。千问App在阿里体系内的打通式布局有望提速，叠加平头哥在芯片领域的前瞻布局，我们认为阿里巴巴是现有上市公司中为数不多的硬件+软件+生态全方位布局的公司。建议持续关注【阿里巴巴】。

阿里千问发布旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。#相较于此前Instruct版本、Thinking版本在Agent 【国联民生海外】千问发布最新旗舰推理模型，性能可媲美GPT-5.2-Thinking、Gemini-3 Pro等闭源模型，持续建议关注阿里巴巴！阿里千问发布旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。 #相较于此前Instruct版本、Thinking版本在Agent工具调用、复杂逻辑和深度推理任务中表现出更优的能力。在多项权威基准测试中可与GPT-5.2-Thinking、Claude-Opus-4.5、Gemini-3 Pro等闭源顶级模型竞争甚至超越。推理技术创新： 1模型采用全新#测试时扩展（Test-timeScaling）机制、避免重复推导已知结论、实现了更高的上下文利用效率。不同于简单增加并行推理路径数量；测试时扩展机制可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算和更智能的推理结果。在启用工具的“人类最后的测试”HLE中，千问录得当前所有模型的最高分。 2模型大幅增强自主调用工具的原生Agent能力。 #与早期需要用户手动选择工具的方法不同、该模型能在对话中自主选择并调用其内置的搜索、记忆和代码解释器等Agent工具功能，从而有效解决真实复杂任务并缓解幻觉。我们预计Qwen3.5即将推出、有望实现工程上更新迭代&千问App在阿里体系内的打通式布局有望提速&叠加平头哥在芯片领域的前瞻布局，我们认为阿里巴巴是现有上市公司中为数不多的硬件+软件+生态全方位布局的公司。建议持续关注【阿里巴巴】。

点击免费查看完整报告

国联民生海外千问发布最新旗舰推理模型性能可媲美GPT52Thinki

你可能感兴趣

宏景科技千问最强推理模型maxthinking发布应用板块

【民生传媒】最新发布【芒果超媒深度|核心三问】，当前芒果核心问题详细解读

华福大科技海外千问AI眼镜即将发布端侧AI拐点将至阿里

华福大科技海外千问AI眼镜即将发布端侧AI拐点将至据报

华宝国际历尽千帆涅槃重生国联民生轻工中小盘连续20年蝉

传媒行业周报：12月国产及进口游戏版号发放，谷歌发布最新AI推理模型

快手可灵进展积极千问模型下载量稳居开源第一坚定看好2026年国产模型及应用投

科技产业研究周报：台积电超预期，千问、可灵等AI应用进展喜人

计算机行业周报：谷歌发布图像模型Gemini元石科技发布旗舰模型问小白5

国联民生计算机托普云农一号文件发布全面利好A股稀缺农业AI标的