您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [西部证券]:概念数量因子:文本数据的另类应用 - 发现报告

概念数量因子:文本数据的另类应用

2026-06-12 冯佳睿,李子敬 西部证券 故人
报告封面

金工量化专题报告 证券研究报告2026年06月12日 概念数量因子:文本数据的另类应用 因子手工作坊系列(7) 核心结论 本文从高概念数量的股票可能提供长期溢价的思路出发,构建了概念数量因子,并在此基础上对该因子进行优化与拓展分析。 冯佳睿S080052404000813564917688fengjiarui@research.xbmail.com.cn 【报告亮点】 1、亮点一:基于e互动、互动易、公告等文本数据,构建概念数量因子。2、亮点二:市值调整概念数量因子的多头与指增表现较为优异。3、亮点三:市值调整概念数量因子偏好高弹性、高换手、高估值个股。 联系人 李子凯13736967185lizikai@xbmail.com.cn 【主要结论】 相关研究 主要结论一、基于e互动、互动易、公告等文本数据,构建概念数量因子。 因子手工作坊系列(6)—日度量价因子的统一线性框架2026-05-08因子手工作坊系列(4)—当大单不再可靠:基于撤单行为的机构交易识别2026-02-24因子手工作坊系列(3)—动量因子改进之“方向动量”2025-09-15因子手工作坊系列(2)—订单流不平衡性(OFI)的应用初探2024-11-29因子手工作坊系列(1)—隔夜上涨和日内反转中的隐藏alpha 2024-11-08 基于同花顺数据源,利用上证e互动、深证互动易等问答文本及定期报告与公告,追溯实际披露日,以确定个股的概念归属期限。定义概念数量因子为,t日个股k所归属的概念数量之和。由于概念数量因子与总市值显著正相关,借鉴DGTW调整法进行市值中性化处理,得到市值调整概念数量因子。 主要结论二、市值中性化后的概念数量因子的多头与指增表现较为优异。 (1)因子双周RankIC均值为0.019,胜率57.18%。十分组收益率基本单调,多头组(组10)月均收益率2.42%。 (2)因子多头组偏好高弹性、高换手和高估值个股,具备明显的“预期驱动”特征。(3)基于该因子构建的沪深300、中证500和中证1000指数增强策略,在2018.01.02-2026.04.30间能实现较为稳健的超额收益。 主要结论三、概念数量因子的拓展分析与稳健性检验。 (1)考虑到现存概念中,有部分市场关注度已较低。尝试引入概念稀缺度和信息衰减加权,但并没有带来因子绩效的提升。 (2)从注意力机制的角度出发,构建指数数量因子。其RankIC均值和胜率均显著高于概念数量因子,但多头组收益率及十分组单调性却明显不及。(3)用“开盘啦”题材库替换同花顺概念指数,重新计算概念数量因子,有效性依然保持。我们认为,概念数量因子具备一定的数据源稳健性。 风险提示:概念炒作监管环境可能变化,影响模型与因子的有效性;概念等数据收集过程中的误差、数据更新的频率和及时性,都会影响因子计算的准确性和可靠性;结论基于历史回测结果,相关表现不代表未来收益。 内容目录 一、引言................................................................................................................................4二、概念数量因子..................................................................................................................42.1因子定义......................................................................................................................42.1.1概念纳入/剔出模式总结.......................................................................................42.1.2基于同花顺概念指数的概念数量因子..................................................................52.2因子有效性检验...........................................................................................................72.3指数增强中的应用.....................................................................................................102.3.1沪深300指数增强策略.....................................................................................102.3.2中证500指数增强策略.....................................................................................112.3.3中证1000指数增强策略...................................................................................12三、概念数量因子的拓展分析..............................................................................................143.1动态更新的概念数量因子...........................................................................................143.2指数数量因子.............................................................................................................153.3概念数量因子数据源稳健性检验................................................................................18四、总结..............................................................................................................................19五、风险提示.......................................................................................................................19六、参考文献.......................................................................................................................19 图表目录 图1:同花顺概念指数词云图(2026.04.30).........................................................................5图2:分年度概念总数与个股平均概念数量(2012.12.31-2026.04.30)................................6图3:按总市值分组的概念数量因子时序特征(2013.01.04-2026.04.30)............................7图4:概念数量因子RankIC(2013.01.04-2026.04.30).......................................................7图5:市值调整概念数量因子RankIC(2013.01.04-2026.04.30).........................................7图6:市值调整概念数量因子十分组月均收益率.....................................................................8图7:市值调整概念数量因子十分组多空组合累计净值..........................................................8图8:市值调整概念数量因子Top100组合累计净值(2013.01.18-2026.04.30)..................8图9:“抱团”效应和市值调整概念数量因子Top100组合超额动态回撤(2013.01.18-2026.04.30)....................................................................................................9图10:沪深300指数增强策略累计净值与超额净值(2018.01.02-2026.04.30)................10图11:中证500指数增强策略累计净值与超额净值(2018.01.02-2026.04.30).................11图12:中证1000指数增强策略累计净值与超额净值(2018.01.02-2026.04.30)..............12图13:分年度指数总数与个股平均指数数量(2012.12.31-2026.04.30)............................16 图14:按总市值分组的指数数量因子时序特征(2013.01.04-2026.04.30)........................16图15:指数数量因子RankIC(2013.01.04-2026.04.30)...................................................17图16:市值调整指数数量因子RankIC(2013.01.04-2026.04.30).....................................17图17:缓解(次)新股影响前后的指数数量因子十分组月均收益率(市值调整后,2013.01.04-2026.04.30)......................................................................................................17图18:指数数量因子与概念数量因子十分组月均收益率(市值调整后,2018.01.01-2026.04.30)...............................................................................................................................................17图19:指数数量因子与概念数量因子十分组多空净值(市值调整后,2018.01.12-2026.04.30)...............................................................