事项: 2025年4月29日,阿里巴巴开源新一代通义千问模型Qwen3。Qwen3模型是国内首个混合推理模型,支持思考和非思考两种模式,大幅节省算力消耗。 Qwen3系列模型参数量为DeepSeek-R1的1/3,部署成本显著降低的同时性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球第一开源模型。 评论: 支持两种思考模式,大幅节省算力消耗。Qwen3开创性地支持两种差异化认知模式:其一是“深度思考模式”,该模式通过层层递进的逻辑推理路径,对复杂问题进行精细化拆解与多维度分析,最终输出经过严谨验证的精准结论,特别适用于需要深度知识融合与复杂推理的场景需求;其二是“极速响应模式”,能够在毫秒级时间内直接调用高频知识节点,为用户提供超低延迟的即时性回答,满足瞬时决策类任务的高效交互需求。这种双模态智能的深度融合,实现了对算力资源的动态分配优化,在保障高精度推理质量的同时,通过智能切换机制显著提升了整体能耗效率,为复杂认知任务提供了兼具深度与速度的创新性解决方案,从而在大规模应用中实现推理性能与算力成本的双重突破。 多语言和Agent能力提升,应用场景扩展。Qwen3模型支持119种语言和方言,为国际应用开辟了新的可能性,可以让更广泛的全球用户体验到模型的强大能力。并且模型的Agent和代码能力得到增强,包括加强了对MCP的支持,使Agent的适用度和灵活性得到提升,拓宽了模型的应用场景。 Qwen3刷新SOTA,性能表现卓越。在性能测试方面,Qwen3的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等多领域基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶尖模型相比毫不逊色。特别是在奥数水平的AIME25测评中,Qwen3-235B-A22B以81.5分的优异成绩刷新了开源纪录;在代码能力LiveCodeBench测评中,该模型成功突破70分大关 , 力压Grok3; 在用于评估模型人类偏好对齐的ArenaHard测评里,Qwen3-235B-A22B凭借95.6分的高分,超越了OpenAI-o1以及DeepSeek-R1。 登顶全球第一开源模型,加速AI应用商业化进程。阿里通义已开源了200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越Llama,成为全球最大的开源模型族群。Qwen3的开源进一步巩固阿里在全球AI开源生态的领先地位,且其高性能和低成本的特性不断加速AI应用商业化进程,展现了中国科技企业在全球开源AI生态中的强大影响力。 投资建议:模型不断迭代,有望利好应用侧蓬勃发展,建议关注以下标的:1)办公:金山办公、合合信息、福昕软件、迈富时;2)金融:同花顺、恒生电子、京北方、中科金财、新致软件;3)大模型:科大讯飞、三六零、第四范式;4)工业:华大九天、中控技术、中望软件、索辰科技、鼎捷数智;5)端侧/穿戴/玩具:萤石网络、云天励飞、中科创达、汉王科技;6)医疗:润达医疗、卫宁健康、晶泰控股;7)法律:华宇软件、金桥信息、通达海;8)邮箱:彩讯股份; 9)创意:万兴科技、美图公司、虹软科技;10)教育:视源股份、佳发教育、欧玛软件、新开普;11)电商:焦点科技;12)ERP:金蝶国际、用友网络;13)OA:泛微网络、致远互联;14)安全:深信服、盛邦安全、永信至诚;15)部署:优刻得、星环科技、网宿科技、汉得信息;16)算力:海光信息、寒武纪、景嘉微等。 风险提示:商业化后表现不及预期,行业技术迭代速度较快,行业竞争加剧。 一、Qwen3大幅节省算力消耗,应用场景更加丰富 (一)支持两种思考模式,大幅节省算力消耗 Qwen3作为国内首个混合推理架构模型,开创性地支持两种差异化认知模式:其一是“深度思考模式”,该模式通过层层递进的逻辑推理路径,对复杂问题进行精细化拆解与多维度分析,最终输出经过严谨验证的精准结论,特别适用于需要深度知识融合与复杂推理的场景需求;其二是“极速响应模式”,能够在毫秒级时间内直接调用高频知识节点,为用户提供超低延迟的即时性回答,满足瞬时决策类任务的高效交互需求。这种双模态智能的深度融合,实现了对算力资源的动态分配优化,在保障高精度推理质量的同时,通过智能切换机制显著提升了整体能耗效率,为复杂认知任务提供了兼具深度与速度的创新性解决方案,从而在大规模应用中实现推理性能与算力成本的双重突破。 图表1不同基准测试集中非思考模式与思考模式的思考预算变化趋势 (二)多语言和Agent能力提升,应用场景扩展 Qwen3模型支持119种语言和方言。增强的多语言能力为国际应用开辟了新的可能性,可以让更广泛的全球用户体验到模型的强大能力。 图表2 Qwen3支持的语言及方言 Qwen3模型的Agent和代码能力得到增强,包括加强了对MCP的支持,使Agent的适用度和灵活性得到提升,拓宽了模型的应用场景。 图表3 Qwen3思考并与环境交互 二、Qwen3刷新SOTA,性能表现卓越 在性能测试方面,Qwen3的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等多领域基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶尖模型相比毫不逊色。特别是在奥数水平的AIME25测评中,Qwen3-235B-A22B以81.5分的优异成绩刷新了开源纪录;在代码能力LiveCodeBench测评中,该模型成功突破70分大关,力压Grok3;在用于评估模型人类偏好对齐的ArenaHard测评里,Qwen3-235B-A22B凭借95.6分的高分,超越了OpenAI-o1以及DeepSeek-R1。 图表4 Qwen3系列8款模型详细参数 图表5 Qwen3旗舰模型Qwen3-235B-A22B基准测试表现 小型MoE模型表现中,Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,表现却更胜一筹。甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能,在AIME25、LiveCodeBench等基准测试中超越OpenAI-o1及DeepSeek-R1。 图表6 Qwen3小型MoE模型基准测试表现 Qwen3部署成本显著下降。仅需4张H20即可部署满血版模型,是满血版671BDeepSeek-R1的25%~35%,部署成本大降75%~65%,显存占用仅为性能相近模型的三分之一。 三、登顶全球第一开源模型,加速AI应用商业化进程 Qwen系列成为全球第一开源模型。阿里通义已开源了200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越Llama,成为全球最大的开源模型族群。 图表7 Qwen、Llama、Mistral系列开源模型的衍生模型数量随时间的增加情况 Qwen3的开源进一步巩固阿里在全球AI开源生态的领先地位,且其高性能和低成本的特性不断加速AI应用商业化进程,展现了中国科技企业在全球开源AI生态中的强大影响力。 四、投资建议 模型不断迭代,有望利好应用侧蓬勃发展,建议关注以下标的:1)办公:金山办公、合合信息、福昕软件、迈富时;2)金融:同花顺、恒生电子、京北方、中科金财、新致软件; 3)大模型:科大讯飞、三六零、第四范式;4)工业:华大九天、中控技术、中望软件、索辰科技、鼎捷数智;5)端侧/穿戴/玩具:萤石网络、云天励飞、中科创达、汉王科技;6)医疗:润达医疗、卫宁健康、晶泰控股;7)法律:华宇软件、金桥信息、通达海;8)邮箱:彩讯股份;9)创意:万兴科技、美图公司、虹软科技;10)教育:视源股份、佳发教育、欧玛软件、新开普;11)电商:焦点科技;12)ERP:金蝶国际、用友网络;13)OA:泛微网络、致远互联;14)安全:深信服、盛邦安全、永信至诚;15)部署:优刻得、星环科技、网宿科技、汉得信息;16)算力:海光信息、寒武纪、景嘉微等。海外侧,建议关注:1)办公:MSFT;2)金融:AFRM、UPST、SOFI、LMND;3)工业:CDNS、SNPS;4)医疗:TEM、RXRX、DOCS、HIMS、VEEV;5)创意:ADOBE;6)教育:DUOL;7)电商:SHOP、SEA;8)企业服务软件:SAP、CRM、NOW、TEAM、ORCL、WDAY、HUBS、FRSH、CXM;9)安全:PANW、CRWD、NET、FTNT;10)数据基建:ESTC、SNOW、MDB; 11)云服务提供商:AMZN、META、MSFT、GOOG、ORCL;12)广告:APP、U、ZETA等。 五、风险提示 商业化后表现不及预期,行业技术迭代速度较快,行业竞争加剧。