西 南证券研究院[Table_Author]分析师:郑琳琳执业证号:S1250522110001邮箱:zhengll@swsc.com.cn联系人:祝晨宇邮箱:zhcy@swsc.com.cn相 关研究1.可转债K线看跌信号与交易增强策略——量化方法在债券研究中的应用四(2025-06-09)2.基于历史K线形态的因子选股研究(2025-05-26)3.科技成长产业变革趋势下基金产品投资策略评价与优选(2025-05-26)4.PINN信息约束与时序截面双流网络选股模型(2025-04-09)5.基于产业链和交易结构的豆粕期货择时框架(2025-03-19)6.可转债K线技术分析与K线形态因子——量化方法在债券研究中的应用三(2025-03-14)7.识时通变:宏微同频成长价值风格轮动策略(2025-01-10)8.超额收益如何回归?——2025年金融工程策略报告(2025-01-06)9.ESG投资概述及其在多因子策略中的应用(2024-12-11)10.价格形成路径与趋势清晰度因子(2024-11-08) 目录1前言..................................................................................................................................................................................................................12 GAN_GRU模型简介.......................................................................................................................................................................................12.1 GRU模型基本假设................................................................................................................................................................................12.2 GAN模型简介.........................................................................................................................................................................................22.3 GAN特征生成模型构建.......................................................................................................................................................................43 GAN_GRU因子表现.......................................................................................................................................................................................64 GAN_GRU因子多头组合..............................................................................................................................................................................75风险提示.........................................................................................................................................................................................................8 请务必阅读正文后的重要声明部分 图目录图1:深度学习选股模型结构.......................................................................................................................................................................2图2:生成对抗网络(GAN)模型示意......................................................................................................................................................4图3:卷积神经网络(CNN)模型示意............................................................................................................................................................5图4:GAN_GRU模型示意..............................................................................................................................................................................5图5:GAN_GRU因子各行业近期IC表现..................................................................................................................................................6图6:GAN_GRU因子各行业近期多头组合表..........................................................................................................................................7表目录表1:深度学习选股量价特征表..................................................................................................................................................................1表2:GAN_GRU因子历史表现.....................................................................................................................................................................6表3:2025年5月末模型输出各行业排名第一个股..............................................................................................................................7表4:因子得分排名前十的个股..................................................................................................................................................................8 请务必阅读正文后的重要声明部分 请务必阅读正文后的重要声明部分1前言本篇,我们基于西南金工前期发布报告《量价时序特征挖掘模型在深度学习因子中的应用》(2024年7月11日)中提到的GAN_GRU模型,定期更新GAN_GRU因子自2024年以来表现情况。其中GAN_GRU因子为利用生成式对抗神经网络GAN模型进行量价时序特征处理后再利用GRU模型进行时序特征编码得到的选股因子。2GAN_GRU模型简介2.1GRU模 型基本假设前期报告《量价时序特征挖掘模型在深度学习因子中的应用》中,主要构建了GRU+MLP的神经网络股票收益预测基本模型,其中模型细节如下:量 价特征:包括收盘价、开盘价、成交量、换手率等在内的18个量价特征。调 仓频率:以月频调仓方式进行预测和回测。训 练与预测方式:(1)训练数据及输入特征设定:所有个股过去400天内的18个量价特征,每5个交易日做一次特征采样。特征采样形状为40*18,即利用过去40天的量价特征来预测未来20个交易日的累计收益。(2)训 练集验证集比例:80%:20%。(3)数据处理:每次采样的40天内,每个特征在时序上去极值+标准化、每个特征在个股层面上截面标准化。(4)模型训练方式:半年滚动训练,即每半年做一次模型训练,并用以未来半年收益的预测,训练时间点为每年的6月30日及12月31日。(5)股 票筛选方式:选取截面所有股票,剔除ST及上市不足半年的股票。(6)训 练样本筛选方式:剔除label为空值的样本。(7)超参数:batch_size为截面股票数量、优化器Adam、学习速率1e-4、损失函数IC、早停轮数10、最大训练轮数50。表1:深度学习选股量价特征表特 征 名 称前收盘价开盘价收盘价最高价最低价成交量(万股)成交金额(万元) 特 征 助 记 符特 征 说 明频 次PrevClosePrice当日前一天收盘价日频特征OpenPrice当日开盘价ClosePrice当日收盘价HighPrice当日最高价Low Price当日最低价TurnoverVolume当日成交量TurnoverValue当日成交金额 请务必阅读正文后的重要声明部分数据来源:西南证券本文通过构建两层GRU层,即GRU(128,128),并在后面加入MLP(256,64,64),并将模型最后输出的预测收益pRet作为选股因子。对因子的测试均建立在对因子已做行业市 值中性化+标准化处理,后文将不再赘述。2.2GAN模 型简介GAN生 成 式 对 抗 网 络 (Generative Adversarial Networks,GANs),是 由IanGoodfellow等人于2014年提出的一种深度学习模型。该模型主要包括生成器(Generat or)和判别器(Discriminator)两个部分。生成器的目标是生成看起来真实的数据,判别器目标是