您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:DeepSeek-V3.2 发布:推理性价比的长足突破 - 发现报告

DeepSeek-V3.2 发布:推理性价比的长足突破

2025-12-06 高智威,胡正阳 国金证券 小酒窝大门牙
报告封面

DeepSeek-V3.2发布:推理性价比的长足突破 2025年12月1日,DeepSeek官方同时发布两个正式版模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新为正式版DeepSeek-V3.2,并在Huggingface与魔搭开源。DeepSeek-V3.2在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,在几乎不牺牲效果的前提下显著提升长文本训练与推理效率,128K上下文场景下的单位token成本明显低于前代模型。配合大幅提升的后训练算力投入、可扩展的强化学习框架以及“thinking in tool-use”等设计,V3.2在数学、编程和代理任务上的综合推理能力已接近甚至部分场景对标GPT-5、Gemini-3.0-Pro,而API定价仅为每百万输入token0.2–2元、输出3元,性价比优势突出。在金融场景评测中,我们基于CFLUE数据集对DeepSeek系列与GPT-5.1、Gemini-3-Pro等模型进行了系统对比。结果显示,DeepSeek-V3.2-reasoner尤其是Speciale长思考增强版,在中文语境的金融知识问答、文本分类、文本生成及中英互译等任务中整体表现领先。 国证2000指数增强策略 经过因子测试与筛选,包括技术、反转、特异波动率等在内的因子在国证2000指数成分股上均有出色表现,我们所合成的各个大类因子也基本都起到了很好的提升效果。11月该因子表现恢复出色,IC值12.54%。样本外整体策略表现出色,11月策略的超额收益为1.84%。 基于多目标、多模型的机器学习指数增强策略 根据国金金融工程团队发布的《基于多目标、多模型的机器学习指数增强策略》,原策略中我们选取了GBDT和NN两大类结构具有一定差异的模型,选取不同的特征数据集进行分别训练,并使用多种预测标签进行对比并融合,最终构建出的GBDT+NN机器学习选股因子在A股各类宽基指数上历史表现优异。但在今年以来,尤其是近期市场风格出现调整后有失效表现。 对此,我们根据《Alpha掘金系列之十八:基于TimeMixer改进的选股因子到ETF轮动策略》,创新性地将其多尺度混合与季节/趋势分解机制引入GRU模型,通过LightGBM集成TSGRU隐向量与传统量化因子,构建了改进的机器学习选股模型,该模型能更好地捕捉近期的市场信息,表现出色。 为贴合交易实际,我们构建了基于TSGRU+LGBM因子的机器学习模型的指数增强策略,通过对投资组合的跟踪误差进行控制,最大化因子暴露。回测区间自2018年2月1日开始,假定手续费率单边千二,每月月初调仓。沪深300指数增强策略、中证500指数增强策略和中证1000指数增强策略上月超额收益率分别为3.49%、1.60%和0.99%。后续随着市场恢复正常,超额收益有望进一步提升。 基于红利风格择时+红利股优选的固收+策略 我们使用经济增长和货币流动性共10个指标,通过动态事件因子的体系构建的红利指数择时策略表现优异,相较于中证红利指数全收益有显著的稳定性提升。在选股方面,我们利用AI模型在中证红利指数成分股内进行测试,得到因子表现相对较好,能够长期获得较稳定的超额收益。上月选股策略获取-0.07%的绝对收益率,择时策略收益率为-1.33%。固收+策略收益率为-0.03%,整体表现平稳。风险提示 以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。 内容目录 一、DeepSeek-V3.2发布:从架构优化到推理性价比跃升.............................................41 DSA为长文本做减法:架构效率提升与推理成本下探...........................................42可扩展强化学习(RL)框架:在工具场景内思考...............................................53金融任务系列评测:多维度考察表现亮眼.....................................................6二、国证2000指数增强策略......................................................................71策略构建.................................................................................72国证2000指数选股因子跟踪................................................................73国证2000指数增强策略跟踪................................................................84最新策略信号.............................................................................9三、基于多目标、多模型的机器学习指数增强策略..................................................101策略构建................................................................................102基于TimeMixer改进的GRU+LGBM沪深300指数增强策略跟踪...................................103基于TimeMixer改进的GRU+LGBM中证500指数增强策略跟踪...................................114基于TimeMixer改进的GRU+LGBM中证1000指数增强策略跟踪..................................12四、基于红利风格择时+红利股优选构建的固收+策略................................................13风险提示......................................................................................15 图表目录 图表1:DeepSeek-V3.2的注意力架构.............................................................4图表2:DeepSeek-V3.2和DeepSeek-V3.1-Terminus模型推理成本线..................................4图表3:DeepSeek最新模型详细参数..............................................................5图表4:DeepSeek-V3.2与主流海外大模型的推理及代理能力测评.....................................5图表5:金融文本任务提示词及标答示例..........................................................6图表6:金融知识评估结果......................................................................7图表7:金融应用评估结果......................................................................7图表8:大类合成因子与国证2000增强因子IC指标................................................8图表9:增强因子IC............................................................................8图表10:增强因子多空组合净值.................................................................8图表11:国证2000指数增强策略表现............................................................8图表12:国证2000指数增强策略指标............................................................9图表13:国证2000增强策略本月持仓列表........................................................9图表14:TSGRU+LGBM机器学习选股因子在沪深300成分股的组合指标跟踪............................10图表15:TSGRU+LGBM沪深300指数增强策略净值..................................................11图表16:TSGRU+LGBM沪深300指数增强策略指标..................................................11图表17:TSGRU+LGBM机器学习选股因子在中证500成分股的组合指标跟踪............................11图表18:TSGRU+LGBM中证500指数增强策略净值..................................................12图表19:TSGRU+LGBM中证500指数增强策略指标..................................................12图表20:TSGRU+LGBM机器学习选股因子在中证1000成分股的组合指标跟踪...........................12 图表21:TSGRU+LGBM中证1000指数增强策略净值.................................................13图表22:TSGRU+LGBM中证1000指数增强策略指标.................................................13图表23:基于红利风格择时+红利股优选构建的固收+策略主要指标..................................13图表24:中证红利选股策略净值走势............................................................14图表25:基于红利风格择时+红利股优选构建的固收+策略净值走势..................................14图表26:动态宏观事件因子近期给出择时信号....................................................14图表27:中证红利选股策略12月份持仓.........................................................15 一、DeepSeek-V3.2发布:从架构优化到推理性价比跃升 2025年12月1日,距离上一个DeepSeek-V3.2-Exp实验性模型发布两个月后,DeepSeek官方同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-