您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:因子选股系列之七十四:神经网络日频alpha模型初步实践 - 发现报告
当前位置:首页/其他报告/报告详情/

因子选股系列之七十四:神经网络日频alpha模型初步实践

2021-03-11朱剑涛、王星星东方证券上***
因子选股系列之七十四:神经网络日频alpha模型初步实践

东方证券股份有限公司经相关主管机关核准具备证券投资咨询业务资格,据此开展发布证券研究报告业务。 东方证券股份有限公司及其关联机构在法律许可的范围内正在或将要与本研究报告所分析的企业发展业务关系。因此,投资者应当考虑到本公司可能存在对报告的客观性产生影响的利益冲突,不应视本证券研究报告为作出投资决策的唯一因素。 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 专题报告 【金融工程·证券研究报告】 金融工程 神经网络日频alpha模型初步实践 ——因子选股系列之七十四 研究结论  多因子体系主要包括alpha模型、风险模型、交易成本模型和组合优化,广义的alpha模型分为alpha因子构建和因子加权,是量化从业人员的研究重心,但传统的alpha模型当期面临较大的挑战。  后发优势的逐渐丧失导致人工挖掘alpha因子的周期变长,国内外估值因子的长时间回撤,近年量价因子的批量拥挤等都是当前选股alpha因子层面的困境,量价因子拥挤等原因导致因子IC和组合绩效产生较大偏差,给以IC和回归为基础的动态因子加权带来挑战。  除了人工合成alpha因子外,我们可以通过设计因子单元批量产生有效的alpha因子,以扩充因子库,考虑到因子IC和组合收益的不一致性,我们通过正交弱因子转换器将原始因子集合转换为相互正交的弱因子,以因子多头组合的表现加权。  遗传算法等方法也可以批量产生alpha因子,但由于变异的无方向性,计算效率较低,通过合理的输出层设计,可以让有监督学习的神经网络高效的批量产生大量alpha因子。  一个强alpha因子背后可能有很多驱动因素,可能有部分成分已经拥挤但部分成分依然能够对组合产生贡献,为了解决这个问题,我们将原始因子集合转换为相互正交的弱因子,直接从弱因子层面考察因子多头表现并指导加权。  本文生成的300个弱因子两两相关性几乎都在20%以内,单因子次日RankIC平均只有1.8%,5日累计RankIC仅2.5%,但是大批量低相关的弱因子合成的ZSCORE次日RankIC却高达12.5%,5日累计RankIC平均16.8%。由于单因子较弱,单因子权重较低(绝大多因子权重低于1%,均值仅0.38%)所以单因子的回撤对加总ZSCORE影响不大,模型稳定性较高。  经测算,在次日VWAP成交,双边千三费率下,500增强模型2017年之后组合业绩大幅弱于之前,但在换手较低的情况下(日单边换手5%以内),近几年费后也可以获取20%左右的超额收益,另外随着组合换手的放大,虽然早期费后收益有明显增长,但近几年费后收益反而回落,说明每日高频调仓的策略近年来衰减较快,反而相对低频的策略更加稳健。  日频交易信号产生后,一般越早交易alpha越丰厚,对于开盘半小时VWAP和全天VWAP这两种比较现实的成交价格,近三年组合业绩的差异明显小于早期,组合换手较低时几乎没有差异,说明通过抢单攫取alpha越来越困难,对于公募等没有交易优势的机构来讲如何提升T+2日及之后的alpha更有现实意义。  日频调仓的沪深300增强策略明显弱于中证500,中证500弱于中证1000,日频调仓增强策略在中小市值中相对更有优势。 风险提示  量化模型失效风险  市场极端环境的冲击 Table_ Base Info 报告发布日期 2021年03月11日 证券分析师 朱剑涛 021-63325888*6077 zhujiantao@orientsec.com.cn 执业证书编号:S0860515060001 证券分析师 王星星 021-63325888*6108 wangxingxing@orientsec.com.cn 执业证书编号:S0860517100001 相关报告 因子加权过程中的大类权重控制:——因子选股系列报告之六十八 2020-08-04 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 2 目 录 一、传统的Alpha模型................................................................................... 3 1.1 多因子选股体系 ........................................................................................................... 3 1.2 传统Alpha模型的困境 ................................................................................................ 4 二、基于神经网络的Alpha模型框架 ............................................................. 5 2.1 兼容传统Alpha模型的框架设计 .................................................................................. 5 2.2 因子单元——Alpha因子的生成模块 ........................................................................... 6 2.3 因子加权方法——正交与弱因子加权 ........................................................................... 7 三、策略实践与组合分析 ............................................................................... 9 3.1 数据和训练说明 ........................................................................................................... 9 3.2 相互正交的弱因子 ..................................................................................................... 10 3.3 不同换手约束下的500增强表现 ............................................................................... 12 3.4 成交价格对500增强业绩的影响 ............................................................................... 13 3.5 策略在300和1000增强中的绩效 ............................................................................. 15 四、总结 ...................................................................................................... 17 风险提示 ...................................................................................................... 17 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 3 一、传统的Alpha模型 1.1 多因子选股体系 多因子选股体系可以简单的用图1概况,主要包括alpha模型、风险模型、交易成本模型和组合优化四个模块。Alpha模型负责预测股票的收益率或者alpha,风险模型(结构化风险模型或者统计风险模型)负责估计股票的协方差矩阵,交易成本模型对个股的交易成本进行建模,组合优化器在满足投资者不能做空、反向交易等投资者实际面临的客观约束下权衡组合的预期收益率和风险、交易成本,最终得出目标组合,量化基金经理根据目标组合执行交易,最后一般都会对组合的实际执行效果做绩效分析,找出体系的短板,不断的完善体系。 多因子体系的各个组成部分都不可获缺,alpha模型负责对股票收益或alpha的预测,对组合收益的影响相对更大,也是量化机构研究的重中之重。狭义上讲,多因子体系中的alpha模型仅指由因子库生成预测收益的过程,即因子加权,广义上,我们认为产生预测收益率或者alpha的整个过程都属于Alpha模型的范畴。 图1:传统的多因子选股体系 数据来源:东方证券研究所 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 4 1.2 传统Alpha模型的困境 传统的因子生成过程更多依赖人工,量化研究员根据自己对市场行为的理解,构建能够捕捉市场错误定价或者风险溢价的指标,反复测试修正后加入因子库。一个逻辑明确、实证有效、且和现有因子库低相关的alpha因子凝结的是从业人员长期的知识积累,过去十余年由于“后发优势”的存在,国内因子研究快速发展,然而和国内其他行业类似,这种后发优势已经越来越不明显,后发优势的丧失导致因子挖掘的周期越来越长。 近年来因子层面出现的另外两个问题是估值因子的风险化和量价因子的拥挤。美股价值因子(BP)从2007年高点持续回撤至今,A股从2018年底开始低PB的股票持续跑输高PB的股票,关于“价值因子是否已死“的讨论学术界和业界都有很多、目前尚无定论,我们也无意讨论这个话题,但是毫无疑问作为多因子中一类重要alpha的价值因子在国内外的普遍回撤给多因子尤其是低频选股领域的多因子带来很大的挑战。 由于最近几年做高频量价策略的私募规模快速扩张,以反转、特异度为代表的量价指标交易逐渐拥挤,因子拥挤有别于市场结构变化等因子底层逻辑变化导致的失效,由于市场交易限制,因子的收益仅部分能够通过交易获取,当然也只有这部分才会拥挤,具体体现在因子在多头无效、空头有效,因子在成分股内无效、成分股外有效。因子拥挤不仅仅是某个因子失效的问题,还会给因子评价和因子加权带来很大的障碍,比如行业市值中性的特异度因子2019年以来全市场月度RankIC均值依然高达7.19%,中证800中也还有2.82%,但是因子在中证800成分股内的多头对冲组合持续回撤。 传统的因子加权方法多以IC或者回归为基础,而各种回归背后大都是最小化均方误差,我们在前期报告《因子加权过程中的大类权重控制》中讲过,在一定条件下最小化均方误差等价于最大化IC,因此IC和实际组合业绩的一致性假设在传统的因子加权中尤其重要,自然状态下我们可以近似接受这一假设,但是在量价因子大批量拥挤的情况下,越来越多的因子IC看上去可以,但组合多头收益变差,因此给因子的动态加权带来了很大障碍。为了应对IC和组合多头收益的不一致,业界常见的做法是在估计因子加权模型前就剔除部分多头收益差的因子,或者根据各种经验性方法调整因子权重,总体来说当前并没有业界公认的比较好的解决方案。 无论是后发优势的丧失导致新alpha因子的挖掘周期变长,还是估值因子的回撤、量价拥挤导致的多头收益回落,都指向了一个