您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:“量价淘金”选股因子系列研究(九):Memory+Map在因子生产加速上的应用:以构建羊群效应因子簇为例 - 发现报告

“量价淘金”选股因子系列研究(九):Memory+Map在因子生产加速上的应用:以构建羊群效应因子簇为例

2024-11-20-国盛证券徐***
AI智能总结
查看更多
“量价淘金”选股因子系列研究(九):Memory+Map在因子生产加速上的应用:以构建羊群效应因子簇为例

“量价淘金”选股因子系列研究(九) Memory Map在因子生产加速上的应用 ——以构建羊群效应因子簇为例 前言:本文为国盛金工《“量价淘金”选股因子系列研究》的第九篇报告,也是“因子生产加速”相关研究的首次尝试,从数据存储技术、体系化的因子构建框架这两个角度出发,探索如何系统性、快速、批量挖掘Alpha因子。 作者 分析师沈芷琦执业证书编号:S0680521120005邮箱:shenzhiqi@gszq.com 分析师刘富兵执业证书编号:S0680518030007邮箱:liufubing@gszq.com MemoryMap数据存储技术:相比于传统的CSV、Parquet等存储形式,MemoryMap减少了显式的文件I/O操作,将数据直接映射到内存中,可大幅提升访问速度。以读取宽表存储形式下、某一交易日所有股票的分钟收盘价数据为例,MemoryMap的读取耗时不到800μs,读取速度约为Parquet的260倍、CSV的330倍。 研究助理阮俊烨执业证书编号:S0680124070019邮箱:ruanjunye@gszq.com 相关研究 体系化的因子构建框架——羊群效应因子簇:我们将事件研究的想法,融入到选股因子的构建中。提炼因子构建流程中的3个关键因素,事件识别、因子定义、数据频率,分别展开详细讨论。在MemoryMap数据存储技术的助力下,基于经济学逻辑,最终构建了约50万个羊群效应因子,并通过进一步筛选,保留其中效果最优且相关性较低的50个因子,称之为“羊群效应因子簇”。 1、《“量价淘金”选股因子系列研究(一):如何将隔夜涨跌变为有效的选股因子?——基于对知情交易者信息优势的刻画》2022-04-26 2、《“量价淘金”选股因子系列研究(二):不同交易者结构下的动量与反转》2022-10-24 3、《“量价淘金”选股因子系列研究(三):如何基于RSI技术指标构建有效的选股因子》2023-03-06 羊群效应综合因子:在“羊群效应因子簇”中选取信息比率最高的10个因子、等权合成,得到羊群效应综合因子。回测期2016/01/01-2024/09/30内,在全体A股中,该因子的月度RankIC均值为0.116,年化RankICIR为4.23;10分组多空对冲的年化收益为43.21%,信息比率为3.79,月度胜率为84.62%,最大回撤为6.31%。在剔除了市场常用风格和行业的影响后,纯净因子仍然有效,年化RankICIR达到3.67,全市场10分组多空对冲的信息比率为3.81。 4、《“量价淘金”选股因子系列研究(四):高/低位放量:从事件驱动到选股因子》2023-12-18 5、《“量价淘金”选股因子系列研究(五):基于趋势资金日内交易行为的选股因子》2024-05-28 6、《“量价淘金”选股因子系列研究(六):创新高股票中的Alpha》2024-06-26 7、《“量价淘金”选股因子系列研究(七):盲目追随趋势资金的极端交易行为分析——羊群效应的识别与因子构建》2024-08-06 指数增强组合的表现:基于羊群效应综合因子,构建月频调仓的指数增强组合:(1)沪深300指数增强组合的超额年化收益为9.06%,跟踪误差为4.47%,信息比率为2.03,月度胜率为73.08%,最大回撤为4.42%;(2)中证500指数增强组合的超额年化收益为12.20%,跟踪误差为5.44%,信息比率为2.24,月度胜率为72.12%,最大回撤为4.36%;(3)中证1000指数增强组合的超额年化收益为17.78%,跟踪误差为6.57%,信息比率为2.71,月度胜率为82.69%,最大回撤为6.24%。 8、《“量价淘金”选股因子系列研究(八):逐笔买卖差异中的选股信息——条件成交不平衡因子》2024-10-09 9、《量化分析报告:择时雷达六面图:本期打分无变化》2024-11-16 10、《量化周报:市场短期有可能进入震荡整固期》2024-11-17 风险提示:以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。 内容目录 一、前言...........................................................................................................................................................4二、Memory Map数据存储技术.........................................................................................................................52.1概念简介..............................................................................................................................................52.2数据存储实例.......................................................................................................................................52.3数据读取与因子计算速度对比..............................................................................................................7三、羊群效应因子簇的构建...............................................................................................................................83.1因子构建的体系化思路.........................................................................................................................83.2事件识别:趋势资金是否行动..............................................................................................................93.2.1各种不同维度的成交量...............................................................................................................93.2.2价格涨跌幅..............................................................................................................................113.2.3价格波动率..............................................................................................................................113.2.4量价相关性..............................................................................................................................113.2.5小结.........................................................................................................................................123.3因子定义:羊群效应如何衡量............................................................................................................133.3.1各种不同维度的成交量.............................................................................................................133.3.2价格涨跌幅..............................................................................................................................143.3.3价格波动率..............................................................................................................................143.3.4量价相关性..............................................................................................................................143.3.5小结.........................................................................................................................................153.4数据频率:不同数据集的构建............................................................................................................153.5因子的生产、筛选与表现...................................................................................................................163.5.1因子的批量生产与筛选:羊群效应因子簇.................................................................................163.5.2羊群效应综合因子示例.............................................................................................................173.5.3指数增强组合的表现................................................................................................................19四、国盛金工量价因子库简介.........