行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

DeepSeek-V3.2 发布：推理性价比的长足突破

2025-12-06 高智威,胡正阳国金证券小酒窝大门牙

DeepSeek-V3.2发布：推理性价比的长足突破

2025年12月1日，DeepSeek官方发布了两个正式版模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale，并更新了官方网页端、App和API。V3.2模型在V3.1-Terminus基础上引入了DeepSeek Sparse Attention（DSA）稀疏注意力机制，显著提升长文本训练与推理效率，降低单位token成本。此外，V3.2还大幅提升了后训练算力投入，并引入可扩展的强化学习框架和“thinking in tool-use”等设计，使其在数学、编程和代理任务上的综合推理能力接近甚至部分场景对标GPT-5、Gemini-3.0-Pro。

在金融场景评测中，基于CFLUE数据集的测试结果显示，DeepSeek-V3.2-reasoner尤其是Speciale长思考增强版，在中文语境的金融知识问答、文本分类、文本生成及中英互译等任务中整体表现领先。

国证2000指数增强策略方面，包括技术、反转、特异波动率等在内的因子在国证2000指数成分股上均有出色表现。基于增强因子构建的国证2000指数增强策略相较于基准有明显的优势，超额净值稳步向上。策略年化超额收益率达到13.39%，信息比率为1.74。样本外策略表现良好，11月策略的超额收益为1.84%。

基于多目标、多模型的机器学习指数增强策略方面，针对原有策略失效问题，创新性地引入TimeMixer时序预测框架，构建了改进的机器学习选股模型，在沪深300、中证500和中证1000指数增强策略中均表现出色。沪深300指数增强策略年化超额收益率为6.12%，中证500指数增强策略年化超额收益率为9.87%，中证1000指数增强策略年化超额收益率为13.35%。

基于红利风格择时+红利股优选构建的固收+策略方面，使用经济增长和货币流动性共10个指标构建的红利指数择时策略表现优异，相较于中证红利指数全收益有显著的稳定性提升。选股策略获取-0.07%的绝对收益率，择时策略收益率为-1.33%。固收+策略收益率为-0.03%，整体表现平稳。

DeepSeek-V3.2发布：推理性价比的长足突破 2025年12月1日，DeepSeek官方同时发布两个正式版模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale，官方网页端、App和API均已更新为正式版DeepSeek-V3.2，并在Huggingface与魔搭开源。DeepSeek-V3.2在V3.1-Terminus基础上引入DeepSeek Sparse Attention（DSA）稀疏注意力机制，在几乎不牺牲效果的前提下显著提升长文本训练与推理效率，128K上下文场景下的单位token成本明显低于前代模型。配合大幅提升的后训练算力投入、可扩展的强化学习框架以及“thinking in tool-use”等设计，V3.2在数学、编程和代理任务上的综合推理能力已接近甚至部分场景对标GPT-5、Gemini-3.0-Pro，而API定价仅为每百万输入token0.2–2元、输出3元，性价比优势突出。在金融场景评测中，我们基于CFLUE数据集对DeepSeek系列与GPT-5.1、Gemini-3-Pro等模型进行了系统对比。结果显示，DeepSeek-V3.2-reasoner尤其是Speciale长思考增强版，在中文语境的金融知识问答、文本分类、文本生成及中英互译等任务中整体表现领先。国证2000指数增强策略经过因子测试与筛选，包括技术、反转、特异波动率等在内的因子在国证2000指数成分股上均有出色表现，我们所合成的各个大类因子也基本都起到了很好的提升效果。11月该因子表现恢复出色，IC值12.54%。样本外整体策略表现出色，11月策略的超额收益为1.84%。基于多目标、多模型的机器学习指数增强策略根据国金金融工程团队发布的《基于多目标、多模型的机器学习指数增强策略》，原策略中我们选取了GBDT和NN两大类结构具有一定差异的模型，选取不同的特征数据集进行分别训练，并使用多种预测标签进行对比并融合，最终构建出的GBDT+NN机器学习选股因子在A股各类宽基指数上历史表现优异。但在今年以来，尤其是近期市场风格出现调整后有失效表现。对此，我们根据《Alpha掘金系列之十八：基于TimeMixer改进的选股因子到ETF轮动策略》，创新性地将其多尺度混合与季节/趋势分解机制引入GRU模型，通过LightGBM集成TSGRU隐向量与传统量化因子，构建了改进的机器学习选股模型，该模型能更好地捕捉近期的市场信息，表现出色。为贴合交易实际，我们构建了基于TSGRU+LGBM因子的机器学习模型的指数增强策略，通过对投资组合的跟踪误差进行控制，最大化因子暴露。回测区间自2018年2月1日开始，假定手续费率单边千二，每月月初调仓。沪深300指数增强策略、中证500指数增强策略和中证1000指数增强策略上月超额收益率分别为3.49%、1.60%和0.99%。后续随着市场恢复正常，超额收益有望进一步提升。基于红利风格择时+红利股优选的固收+策略我们使用经济增长和货币流动性共10个指标，通过动态事件因子的体系构建的红利指数择时策略表现优异，相较于中证红利指数全收益有显著的稳定性提升。在选股方面，我们利用AI模型在中证红利指数成分股内进行测试，得到因子表现相对较好，能够长期获得较稳定的超额收益。上月选股策略获取-0.07%的绝对收益率，择时策略收益率为-1.33%。固收+策略收益率为-0.03%，整体表现平稳。风险提示以上结果通过历史数据统计、建模和测算完成，在政策、市场环境发生变化时模型存在失效的风险。内容目录一、DeepSeek-V3.2发布：从架构优化到推理性价比跃升.............................................41 DSA为长文本做减法：架构效率提升与推理成本下探...........................................42可扩展强化学习（RL）框架：在工具场景内思考...............................................53金融任务系列评测：多维度考察表现亮眼.....................................................6二、国证2000指数增强策略......................................................................71策略构建.................................................................................72国证2000指数选股因子跟踪................................................................73国证2000指数增强策略跟踪................................................................84最新策略信号.............................................................................9三、基于多目标、多模型的机器学习指数增强策略..................................................101策略构建................................................................................102基于TimeMixer改进的GRU+LGBM沪深300指数增强策略跟踪...................................103基于TimeMixer改进的GRU+LGBM中证500指数增强策略跟踪...................................114基于TimeMixer改进的GRU+LGBM中证1000指数增强策略跟踪..................................12四、基于红利风格择时+红利股优选构建的固收+策略................................................13风险提示......................................................................................15 图表目录图表1：DeepSeek-V3.2的注意力架构.............................................................4图表2：DeepSeek-V3.2和DeepSeek-V3.1-Terminus模型推理成本线..................................4图表3：DeepSeek最新模型详细参数..............................................................5图表4：DeepSeek-V3.2与主流海外大模型的推理及代理能力测评.....................................5图表5：金融文本任务提示词及标答示例..........................................................6图表6：金融知识评估结果......................................................................7图表7：金融应用评估结果......................................................................7图表8：大类合成因子与国证2000增强因子IC指标................................................8图表9：增强因子IC............................................................................8图表10：增强因子多空组合净值.................................................................8图表11：国证2000指数增强策略表现............................................................8图表12：国证2000指数增强策略指标............................................................9图表13：国证2000增强策略本月持仓列表........................................................9图表14：TSGRU+LGBM机器学习选股因子在沪深300成分股的组合指标跟踪............................10图表15：TSGRU+LGBM沪深300指数增强策略净值..................................................11图表16：TSGRU+LGBM沪深300指数增强策略指标..................................................11图表17：TSGRU+LGBM机器学习选股因子在中证500成分股的组合指标跟踪............................11图表18：TSGRU+LGBM中证500指数增强策略净值..................................................12图表19：TSGRU+LGBM中证500指数增强策略指标..................................................12图表20：TSGRU+LGBM机器学习选股因子在中证1000成分股的组合指标跟踪...........................12 图表21：TSGRU+LGBM中证1000指数增强策略净值.................................................13图表22：TSGRU+LGBM中证1000指数增强策略指标.................................................13图表23：基于红利风格择时+红利股优选构建的固收+策略主要指标..................................13图表24：中证红利选股策略净值走势............................................................14图表25：基于红利风格择时+红利股优选构建的固收+策略净值走势..................................14图表26：动态宏观事件因子近期给出择时信号....................................................14图表27：中证红利选股策略12月份持仓.........................................................15 一、DeepSeek-V3.2发布：从架构优化到推理性价比跃升 2025年12月1日，距离上一个DeepSeek-V3.2-Exp实验性模型发布两个月后，DeepSeek官方同时发布两个正式版模型：DeepSeek-V3.2和DeepSeek-V3.2-

点击免费查看完整报告

DeepSeek-V3.2 发布：推理性价比的长足突破

DeepSeek-V3.2发布：推理性价比的长足突破

你可能感兴趣

OpenAI发布o3与o4-mini，视觉推理与工具使用突破

公司点评：正式发布星火X1与一体机：多行业AI革新与深度推理能力跨越式突破

通信行业周报：Marvell收购Celestial AI布局CPO，DeepSeek-V3.2发布

人工智能周报（25年第49周）：DeepSeek-V3.2正式版发布，腾讯自研AI大模型混元2.0上线

传媒行业周报系列2025 年第 48 周：奈飞与华纳达成收购协议，DeepSeek-V3.2正式发布

电子行业深度报告：HBM，训练侧/推理侧需求的共同焦点-突破存算协同范式下的“存储墙”困境

字节Seedance20发布印证今年多模态催生的推理需求将爆发式增长

电子板块推荐更新：强调推理的OpenAI o1模型发布，AI算力基建提速

【电报解读】腾讯发布QClaw V2大版本！机构称Agent AI的应用推动Token消耗激增，推理算力需求或将呈“指数级”增长，这家公司拥有超7000个机柜资源-20260410

通信周跟踪：DeepSeek发布推理系统概览，再论算力的上限和下限