深度学习赋能技术分析魏建榕(分析师)盛少成(分析师)weijianrong@kysec.cn证书编号:S0790519120001shengshaocheng@kysec.cn证书编号:S0790523060003基于技术指标的因子挖掘在本文第一部分,我们主要利用股价数据(开、高、低、收、成交量),以及衍生出的相关技术指标进行因子挖掘。在挖掘方式上,我们对比了如下两种:(1)直接使用LSTM;(2)先用遗传算法挖掘出有效因子,再将其和原始数据一起作为初始变量,使用LSTM。其中,第二种方式下得到的因子𝐿𝑆𝑇𝑀RankIC从2019年至今为9.27%,高于第一种方式下𝐿𝑆𝑇𝑀外,𝐿𝑆𝑇𝑀𝑑𝑒𝑎𝑝_𝑡𝑒𝑐ℎ基本包含了𝐿𝑆𝑇𝑀𝐿𝑆𝑇𝑀𝑑𝑒𝑎𝑝_𝑡𝑒𝑐ℎ之后,残差基本不具备选股效果。基于图形识别的因子挖掘在本文第二部分,我们尝试从图形出发,构建形态选股因子。对于图形的识别,在深度学习领域,一种可行的方法即:使用CNN网络学习股票状态,生成状态隐藏层,接着通过全连接层输出涨跌判断。但是经过尝试我们发现:此方法训练耗时较长且对算力、内存要求较高;除此之外,图形识别无法涵盖一些更为细致的影响因素(如涨跌停等),且可以涵盖的技术指标数量存在一定的限制。针对此情况,我们进行了方案的转变,即人为定义图形的状态。基于状态的划分,我们尝试了两种思路构建因子:(1)人工维度:构建历史形态相似度因子𝑇𝑒𝑐ℎ_𝑠𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦和𝐾_𝑠𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦,二者合成后𝑇𝑒𝑐ℎ_𝐾_𝑠𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦从2019年至今其RankIC为4.87%;(2)深度学习维度:将状态变量放入LSTM中进行训练,得到因子𝐿𝑆𝑇𝑀𝑔𝑟𝑎𝑝ℎ,2019年至今RankIC为9.01%。除此之外,𝐿𝑆𝑇𝑀含𝑇𝑒𝑐ℎ_𝐾_𝑠𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦的alpha信息。综合的深度学习技术因子在以上两个部分的讨论中,我们深度论证了在使用深度学习挖掘技术因子时,输入端对于最后结果的影响。本文给出两种尝试:(1)结合遗传算法有效因子,得到𝐿𝑆𝑇𝑀𝑑𝑒𝑎𝑝_𝑡𝑒𝑐ℎ;(2)将技术指标转化为状态变量,得到𝐿𝑆𝑇𝑀二者是从不同维度出发构建的因子,因此相互都不能被对方完全解释,最终我们将二者等权合成,绩效进一步提升。合成因子𝑳𝑺𝑻𝑴今RankIC为10.89%,RankICIR为4.99,10分组多空对冲的年化收益为37.28%,整体表现较为优异。其他重要补充:与𝑳𝑺𝑻𝑴𝒑𝒓𝒐结合在 《 深 度 学 习 赋 能 交 易 行 为 因 子 》 中 , 我 们构 建 了因 子𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉_𝒈𝒓𝒂𝒑𝒉只使用到了基础量价指标而言,些,二者因子相关性仅达到38.61%。进一步地,我们将二者等权合成,因子绩效更好,从2019年至今RankIC为11.93%,10分组多空对冲的年化收益为39.85%。值得一提的是,相较于𝐿𝑆𝑇𝑀明显,多头超额年化收益从9.40%提升至11.34%,收益波动比从2.01提升至2.80。风险提示:本报告模型基于历史数据测算,市场未来可能发生重大改变。 1/13——开源量化评论(109)𝑑𝑒𝑎𝑝_𝑡𝑒𝑐ℎ的𝑡𝑒𝑐ℎ的7.42%。除此之的alpha信息,在使用𝐿𝑆𝑇𝑀𝑡𝑒𝑐ℎ回归𝑔𝑟𝑎𝑝ℎ基本包𝑔𝑟𝑎𝑝ℎ。由于𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉_𝒈𝒓𝒂𝒑𝒉从2019年至𝐿𝑆𝑇𝑀𝑝𝑟𝑜。相 较于𝑳𝑺𝑻𝑴𝒑𝒓𝒐指标元素更加丰富一𝑑𝑒𝑎𝑝_𝑡𝑒𝑐ℎ_𝑔𝑟𝑎𝑝ℎ,合成后因子多头分组更加 𝑡𝑒𝑐ℎ 目录1、基于技术指标的因子挖掘........................................................................................................................................................31.1、直接进行LSTM挖掘:𝑳𝑺𝑻𝑴𝒕𝒆𝒄𝒉..............................................................................................................................31.2、遗传算法挖掘:有效技术因子.....................................................................................................................................41.3、结合遗传算法有效因子,使用LSTM挖掘:𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉...............................................................................52、基于图形识别的因子挖掘........................................................................................................................................................62.1、图形的识别:人为状态划分.........................................................................................................................................62.2、基于状态划分,人工构建历史相似度因子..................................................................................................................72.3、基于状态划分,构建深度学习因子𝑳𝑺𝑻𝑴𝒈𝒓𝒂𝒑𝒉.......................................................................................................82.4、𝑳𝑺𝑻𝑴𝒈𝒓𝒂𝒑𝒉与𝑻𝒆𝒄𝒉_𝑲_𝒔𝒎𝒊𝒍𝒂𝒓𝒊𝒕𝒚相关性分析.........................................................................................................93、综合的深度学习技术因子:𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉_𝒈𝒓𝒂𝒑𝒉.........................................................................................................94、其他重要补充:与𝑳𝑺𝑻𝑴𝒑𝒓𝒐结合.........................................................................................................................................115、风险提示..................................................................................................................................................................................11图表目录图1:开源金工特色LSTM因子挖掘整体流程...........................................................................................................................4图2:𝑳𝑺𝑻𝑴𝒕𝒆𝒄𝒉的10分组多空对冲年化收益达24%..............................................................................................................4图3:𝑳𝑺𝑻𝑴𝒕𝒆𝒄𝒉的10分组多空对冲净值较为优异..................................................................................................................4图4:开源金工特色遗传算法因子挖掘框架................................................................................................................................4图5:对于以2010-2016年数据挖掘出的因子而言,样本外也保持了较好的选股效果.........................................................5图6:𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉的10分组多空对冲年化收益达32%...................................................................................................6图7:𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉的10分组多空对冲净值较为优异.......................................................................................................6图8:相较于𝑳𝑺𝑻𝑴𝒕𝒆𝒄𝒉,𝑳𝑺𝑻𝑴𝒅𝒆𝒂𝒑_𝒕𝒆𝒄𝒉的绩效更加优异..................................................................................................6图9:示例:上证指数在20250624的行情界面..........................................................................................................................7图10:𝑻𝒆𝒄𝒉_𝒔𝒎𝒊𝒍𝒂𝒓𝒊𝒕𝒚的10分组多空对冲年化收益达20.22%.............................................................................................7图11:𝑲_𝒔𝒎𝒊𝒍𝒂𝒓𝒊𝒕𝒚的10分组多空对冲年化收益达19.25%....