AI泡沫? 算法还在革新,DeepSeekMath-V2发布。1)11月27日DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。为了实现可自验证的数学推理,DeepSeek研究了如何训练一个准确且忠实的基于大型语言模型的定理证明验证器。然后DeepSeek以验证器为奖励模型训练一个证明生成器,并激励生成器在最终定稿前尽可能多地识别和解决自身证明中的问题。2)谷歌发布的Gemini 3 Pro则证明了高质量训练数据对提高模型能力的重要作用,预训练数据集是一个大规模、多样化的数据集合,涵盖了广泛的领域和模态,后训练数据集包括不同类型的指令微调数据、强化学习数据和人类偏好数据。Gemini 3 Pro使用强化学习技术进行训练,这些技术可以利用多步推理、问题解决和定理证明数据,我们认为这是ScalingLaw依旧生效的重要体现。大模型的潜能远未释放完毕,发展动力不仅有基于Scaling Law的规模竞赛,还有不断创新的算法,持续打破AI泡沫论的质疑。-10% 增持(维持) 作者 分析师刘高畅执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 阿里:AI不是泡沫,此前资本开支投入规划偏保守。11月25日阿里发布2026财年第二财季财报,本季度阿里云在收入强劲增长34%的同时,外部商业化收入也加速增长29%,AI相关产品收入连续9个季度实现三位数同比增长。在混合云市场,阿里云增速超20%,超过市场平均增速,市场份额持续提升;金融云增速也领先市场,份额持续提升;在中国AI云市场份额超过第二到第四名总和。 分析师李可夫执业证书编号:S0680525060001邮箱:likefu@gszq.com 相关研究 千问App公测版上线一周,新下载量已超过1000万。一方面,Qwen3-Max的模型智能水平、工具调用能力都已达到全球领先,另一方面,AI和阿里电商、地图、本地生活等业务生态的协同是更大的想象力。基于AI模型和阿里生态优势,千问App有望率先打造未来的AI生活入口。因此在AI to B加速增长的同时,做出了全力入局AI to C的战略决定。 1、《计算机:AI投资继续加码》2025-11-082、《计算机:软件筹码与景气双见底》2025-11-013、《计算机:国产化景气继续加速》2025-10-26 阿里CEO吴泳铭表示未来三年内并不存在所谓的“AI泡沫”,行业相关投资具备扎实的需求支撑与合理的回报潜力。从需求侧和供给侧两个维度来看:从需求侧,有两大核心驱动力支撑ROIC的提升。一是模型能力持续进阶,规模化法则发展尚未触顶。二是AI任务在各行业的渗透率不断提高,两大动能叠加,未来三年内AI需求的增长具有高度确定性。从供给侧来看,当前全球AI服务器产业链各环节——从半导体制造厂、存储器厂商到CPU供应商——自今年下半年起普遍缺货,扩产周期至少需要两三年。 阿里CFO徐宏表示对于从当前客户需求的旺盛程度来看,大方向上此前阿里提及的三年3800亿元CAPEX投资规划可能偏保守。同时在AI资本开支方面我们分析北美科技巨头最新季度财务数据,认为对于几家主要公司而言,即使在假设AI的贡献尚未完全显现的情况下,明年北美巨头的资本支出仍有较大提升空间。 建议关注 算力:寒武纪、海光信息、东阳光、神州数码、新易盛、中芯国际、华虹半导体、胜宏科技、普天科技、品高股份、鸿腾精密、有方科技、协创数据、中际旭创、沪电股份、兴森科技、中科曙光、浪潮信息、东山精密、云天励飞、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华 数据、禾盛新材、潍柴重机、金山云、浙数文化、青云、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深桑达、优刻得、云从科技、太极股份、数据港、首都在线。 Agent:谷歌、阿里巴巴、腾讯控股、阜博集团、广立微、第四范式、360、金蝶国际、拓尔思、合合信息、税友股份、新致软件、金桥信息、快手、美图公司、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、朗新集团、润达医疗、壹网壹创、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 内容目录 算法还在革新,DeepSeekMath-V2发布.............................................................................................................4阿里:AI不是泡沫,此前资本开支投入规划偏保守............................................................................................6建议关注...........................................................................................................................................................8风险提示...........................................................................................................................................................8 图表目录 图表1:IMO-ProofBench(由DeepMind团队开发的DeepThink IMO-Gold)的评估结果。..............................4图表2:北美科技巨头最新季度财务状况,注:亚马逊OCF和FCF为披露的12个月数据,其他未特别标注TTM的为单季度数据.................................................................................................................................................7 算法还在革新,DeepSeekMath-V2发布 11月27日,DeepSeek在推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。 资料来源:huggingface,国盛证券研究所 通过强化学习(奖励正确的最终答案)来扩展推理能力,大语言模型在短短一年内就从表现不佳跃升至在AIME和HMMT等定量推理竞赛中占据主导地位。然而,这种方法面临着根本性的局限性。追求更高的最终答案准确率并不能解决一个关键问题:正确的答案并不能保证推理过程的正确性。此外,许多数学任务(例如定理证明)需要严谨的逐步推导,而非数值答案,这使得最终答案奖励不再适用。为了突破深度推理的极限,DeepSeek认为有必要验证数学推理的全面性和严谨性。自验证对于扩展测试时计算能力尤为重要,特别是对于那些尚无已知解决方案的开放性问题。为了实现可自验证的数学推理,DeepSeek研究了如何训练一个准确且忠实的基于大型语言模型的定理证明验证器。然后,DeepSeek以验证器为奖励模型训练一个证明生成器,并激励生成器在最终定稿前尽可能多地识别和解决自身证明中的问题。为了在生成器能力不断增强的同时保持生成与验证之间的差距,DeepSeek提出扩展验证计算能力,以自动标记新的难以验证的证明,从而创建训练数据以进一步改进验证器。最终得到的模型DeepSeekMath-V2展现了强大的定理证明能力。 谷歌发布的Gemini 3 Pro则证明了高质量训练数据对提高模型能力的重要作用,我们认为这是Scaling Law依旧生效的重要体现。据谷歌公布的训练数据相关细节,预训练数据集是一个大规模、多样化的数据集合,涵盖了广泛的领域和模态,包括公开可用的网络文档、文本、代码、图像、音频(包括语音和其他音频类型)以及视频。后训练数据集包括不同类型的指令微调数据、强化学习数据和人类偏好数据。Gemini 3 Pro使用强化学习技术进行训练,这些技术可以利用多步推理、问题解决和定理证明数据。训练数据集还包括:易于下载的公开数据集;爬虫获取的数据;通过商业许可协议获得的许可数据;根据Google相关的服务条款、隐私政策、特定服务政策,并适当遵循用户控制收集的用户数据(即用于训练AI模型的Google产品和服务用户数据,以及用户与模型的交互);Google在其业务运营过程中获得或生成的其他数据集;以及直接从其员工处获得的人工智能生成合成数据。 我们认为Gemini 3 Pro和DeepSeekMath-V2的进展说明大模型的潜能远未释放完毕。大模型的发展动力不仅有基于Scaling Law的规模竞赛,还有不断创新的算法,这些创新转化为解决数学推理等复杂问题的实际能力,AI的进化从未停歇,每一次创新都在不断打破“AI泡沫论”的质疑,大模型的能力边界还将持续拓宽,未来必将在更多专业领域释放更大价值。 阿里:AI不是泡沫,此前资本开支投入规划偏保守 11月25日阿里发布了截至2025年9月30日的2026财年第二财季财报:营收为2477.95亿元,同比增长5%。若不考虑高鑫零售和银泰的已处置业务的收入,则同口径收入同比增长将为15%。净利润为206.12亿元,同比下滑53%,主要由于运营利润的下滑。不按美国通用会计准则,净利润为103.52亿元,同比下滑72%。归属于普通股股东的净利润为209.90亿元。 据上海证券报,阿里CEO吴泳铭分享了阿里巴巴集团AI战略进展。阿里正在AI to B和AI to C两大方向齐发力——在AI to B领域,做世界领先的全栈AI服务商,服务千行百业不断增长的AI需求;在AI to C领域,基于性能领先的AI模型和阿里生态优势,打造面向C端用户的AI超级原生应用,推动AI从千行百业到人人可用。 本季度,阿里持续投入全栈AI能力提升。在旺盛的AI需求驱动下,阿里云在收入强劲增长34%的同时,外部商业化收入也加速增长29%,AI相关产品收入连续9个季度实现三位数同比增长。吴泳铭表示,全栈AI技术能力已成为阿里云的关键竞争优势,在多个细分领域的市场份额全面提升。在混合云市场,阿里云已成为核心参与者,增速超20%,超过市场平均增速,市场份额持续提升;金融云增速也领先市场,份额持续提升;在中国AI云市场份额同样保持领先,超过第二到第四名的总和。 千问App公测版正式发布,标志着阿里巴巴开始在A