您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:量化专题报告:“机器学习”选股模型系列研究(一)-量价指纹模型的构建与应用初探 - 发现报告

量化专题报告:“机器学习”选股模型系列研究(一)-量价指纹模型的构建与应用初探

2026-01-16沈芷琦、刘富兵、诸格慧明国盛证券善***
AI智能总结
查看更多
量化专题报告:“机器学习”选股模型系列研究(一)-量价指纹模型的构建与应用初探

“机器学习”选股模型系列研究(一) 量价指纹模型的构建与应用初探 前言:本篇报告借鉴大语言模型的语义理解思想,提出““量价指纹”的概念,将市场交易数据视为一种特殊““语言”,通过自监督学习,理解、提取日内量价行为中蕴含的特征,并在端到端深度学习模型中做了初步应用。 作者 分析师沈芷琦执业证书编号:S0680521120005邮箱:shenzhiqi@gszq.com 量价指纹模型的构建:“量价指纹”模型的构建流程遵循了从原始数据处理到深度语义表征的路径,具体而言,我们围绕分钟特征处理、双任务自监督学习、防坍缩正则化这3个关键环节展开指纹的具体构建: 分析师刘富兵执业证书编号:S0680518030007邮箱:liufubing@gszq.com (1)分钟特征预处理:选取32维分钟级特征,包括价格特征“(如高、低、收、价格位置等)与交易特征“(如成交额、挂撤单、资金流等),并分别进行标准化处理,以消除量纲与历史波动的影响; 研究助理诸格慧明执业证书编号:S0680125100009邮箱:zhugehuiming@gszq.com (2)双任务学习框架:通过前向因果预测任务“(价格特征预测)与后向特征重建任务(交易特征重建),迫使模型学习市场量价关系的动态语义与因果结构,生成128维日度指纹向量; 相关研究 1、《量化点评报告:行业ETF配置模型2025年超额21.4%》2026-01-122、《量化周报:科创50迎来日线级别上涨》2026-01-113、《量化分析报告:择时雷达六面图:本周市场较为拥挤》2026-01-104、《“量价淘金”选股因子系列研究(十):订单簿资金流因子簇的构建与生产加速》2025-02-115、《“量价淘金”选股因子系列研究“(九):Memory Map在因子生产加速上的应用——以构建羊群效应因子簇为例》2024-11-20 (3)防坍缩设计:引入多样性、正交性与均匀性正则项,确保指纹向量具备高区分度、低冗余与信息丰富的特性,避免表征坍塌。 量价指纹模型的端到端应用初探:我们将““量价指纹”作为输入特征,结合GRU模型,对股票的未来收益进行预测。测试结果表明: (1)仅使用量价指纹进行模型训练得到的因子,具备一定的预测能力,2017/01/01-2025/12/31,因子的周度RankIC均值为0.106,全市场10分组多空对冲的年化收益为83.88%,信息比率为5.41,最大回撤为11.65%; (2)量价指纹可在用常规量价因子构建模型的基础上,提供增量信息;将量价指纹与量价因子融合训练的双流GRU模型,进一步提升了预测能力,融合因子的周度RankIC均值为0.109,全市场10分组多空对冲的年化收益为90.89%,信息比率5.95,最大回撤为11.54%; (3)基于融合因子构建的指数增强组合,在较为严格的风险约束条件下,仍能取得稳定、可观的超额收益,如沪深300指数增强组合的超额年化收益为7.12%,跟踪误差为1.74%,信息比率为4.10,月度胜率为86.11%,最大回撤为1.85%。 未来研究展望:量价指纹模型提供了从“特征工程”到“语义理解”的新思路,本篇报告初步验证了其在市场预测中的有效性。未来将尝试如何深化指纹语义解析、探索α/β分离建模、推动指纹与传统因子的协同应用,进一步挖掘指纹中蕴含的丰富信息。 风险提示:以上结论均基于历史数据和模型的测算,如果市场环境和结构发生剧烈改变,不排除模型失效的可能性;单模型的收益可能存在较大波动,实际应用需结合资金管理、风险控制等方法;模型测算可能存在相对误差,不构成实际投资建议。 内容目录 一、前言...................................................................................................................................................4二、量价指纹概念简介...............................................................................................................................5三、量价指纹的构建..................................................................................................................................73.1分钟特征预处理............................................................................................................................73.1.1价格特征标准化...................................................................................................................73.1.2交易特征标准化...................................................................................................................73.2量价指纹的生成原理......................................................................................................................73.2.1前向因果预测任务...............................................................................................................83.2.2后向特征重建任务...............................................................................................................83.3量价指纹生成模型的架构...............................................................................................................93.3.1固定正交投影层...................................................................................................................93.3.2因果Transformer编码器......................................................................................................93.3.3双分支输出结构.................................................................................................................103.4损失函数设计.............................................................................................................................113.4.1双任务损失.......................................................................................................................113.4.2防坍缩正则化....................................................................................................................113.4.3总损失函数.......................................................................................................................123.5模型训练细节.............................................................................................................................13四、量价指纹的端到端应用初探................................................................................................................144.1单一数据集测试..........................................................................................................................144.2量价因子和量价指纹融合测试......................................................................................................174.3指数增强组合的表现....................................................................................................................18五、总结.................................................................................................................................................21风险提示.................................................................................................................................................23 图表目录 图表1:从特征工程到表示学习.................................................................................................................5图表2:2025年12月29日某股票的量价指纹示例....................................................................................6图表3:量价指纹生成的前向和后向任务...................