您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安期货]:基于大模型的多信源舆情指数:提前一步洞察市场风向 - 发现报告

基于大模型的多信源舆情指数:提前一步洞察市场风向

2025-12-23虞堪国泰君安期货梅***
AI智能总结
查看更多
基于大模型的多信源舆情指数:提前一步洞察市场风向

目录CONTENTS 03 01 盘后情绪监控:视频 02 市场情绪分析方法一:基于盘中交易数据的情绪 选取于若干个可以表征投资者情绪的代理,使用降维技术提取共同信息,从某种程度上获得提纯的投资者情绪。 提纯后情绪的价值:经过降维技术提纯后的投资者情绪,去除了无关因素的干扰,更能反映投资者情绪的核心特征,因此具有更强的预测性能。它可以用于预测市场走势、资产价格波动等。 单个代理的局限性:单个情绪代理可能因为包含过多无关信息或噪音,而与价格走势没有明显的相关性。 市场情绪分析方法二:从形态挖掘 欧氏距离可以用于计算具有多个特征的两个样本之间的距离。在多维空间中,每个样本可以表示为一个特征向量,而欧氏距离则衡量这些特征向量之间的直线距离。 动态时间规整 相关性 欧氏距离 提取特定的规则 使用相关系数来衡量两段K线之间的线性关系。相关系数接近1表示高度正相关,接近-1表示高度负相关,接近0表示无明显线性相关性。 计算K线之间的欧氏距离,距离越小表示相似度越高。对K线的收盘价、开盘价、最高价和最低价进行归一化,以消除量纲的影响。 通过引入额外的时间维度,衡量两个时间序列之间相似度的方法,可以处理时间序列的伸缩和变形。 通过定义特定的K线形态规则,如头肩顶、头肩底、双顶、双底等,来寻找历史中相似的K线形态。 市场情绪分析:情绪的强度和延续性 市场情绪分析:盘后信息的缺失 ◆根据日内信息构建形态识别因子,回测时间从2021年起。 ◆次日开盘交易的效果显著下降,累计收益从94%下降至71%,有23%的收益在随机的隔夜信息中损失。 ◆隔日之后,市场情绪可能是有些变化的。 盘后情绪监控:视频02 市场情绪分析 盘后与非交易时段舆情变化显著,情绪因子填补价量因子的“空窗”。 市场情绪分析:公众视频媒体的信息 1.人脸检测:通过OpenCV检测图像中的人脸2.面部关键点检测3.动作单元(AU)识别:提取AU特征4.情绪分类:微调预训练模型,情绪分类 1.提取音频:FFmpeg等工具2.音频转文本:whisper模型3.情绪分类:微调BERT预训练模型 1.爬取文本:BeautifulSoup等工具2.对文本进行标签处理3.情绪分类:微调BERT预训练模型 市场情绪分析 用“视频里人脸表情”来量化市场情绪,效果不行。 模型结构与创新 模型基本结构 采集层(新闻、社媒处理模块)→智能处理层(LLM语义去噪)→模型层(DDFM/状态空间)→服务层(市场情绪分析模块) 模型结构与创新 新闻侧:主题与强度 ◆关键词获取: 改进TF-IDF进行粗筛,LLM二次语义判定与权重微调,保留“与金融决策强相关”的主题词库。 ◆强度量化: 采用频次指数,并以基准词相对化消除样本期内全网活跃度变动带来的结构性偏差。 模型结构与创新 社媒侧:微博情感 ◆标注体系: 基于大模型实现“相关性→文本类型→极性”三级判别,测试集准确率>85%且极性分类>99%。可采用“BERT轻量语义判别+核心因子聚合”精简模式。 ◆去噪与筛选: 广告词典与模式学习联合过滤噪声,降低营销噪声对指数的结构性污染。 模型结构与创新 社媒侧:社媒权重与日度聚合 ◆交互权重: 采用点赞与评论的温和加权,在给予关注量更高的博文更大权重的同时,抑制极端热度失真。 ◆日度指数: 将情感极性赋值于{1,0,−1}并以权重加权求和:σ𝑖∈𝐷𝑡𝑤𝑖𝑠𝑖σ𝑖∈𝐷𝑡𝑤𝑖 DDFM:深度动态因子合成 ◆模型结构: 非线性编码+线性解码,编码器𝑓𝑡、解码器෠𝑋𝑡,观测与因子关系为 ◆可解释聚合: Frobenius范数实现因子权重的自动计算,因子线性组合得到综合指数𝑆𝑡=σ𝑘𝑤𝑘f𝑡,𝑘保留“因子→变量”的线性载荷可解释性。 ◆训练策略: 去噪自编码器注入高斯噪声、tanh激活与L2正则、批归一化与交叉验证选择因子维度与滞后结构。 舆情指数可应用性分析 归因与解释 ◆透明化: 载荷矩阵揭示指数变化的主题贡献度,可追溯至“股市/A股/大盘”等关键词与资讯强度的边际影响。 ◆动态权重: 不同阶段主题权重可随时间迁移,辅助事件复盘与策略调参。 舆情指数可应用性分析 归因与解释 “新闻情绪因子在6个主因子上的载荷矩阵(Loading Matrix)”。相关系数(载荷),绝对值越大,说明这类新闻对这根因子的“话语权”越大。 券商与基金类新闻当前是情绪放大器,回购消息则是天然对冲;且2025年以来基金线持续上行,已取代宏观新闻成为情绪β第一驱动。 舆情指数可应用性分析 指数行为与共振 ◆时间特征: 2023-08至2025-12,指数在重要节点呈现敏感响应与周期性波动,且对极端行情更为敏感。 ◆共振关系: 与沪深300在中短期呈协同波动,舆情指数波动幅度对转折更敏感,体现“情绪先动、价格后行”。 舆情指数可应用性分析 先行性:交叉相关检验 ◆结论要点: 在滞后期𝐿=+1处相关系数达峰并跨越95%置信区间,验证“当日舆情→次日收益”的正向先行性。 ◆持续性: 𝐿=+2仍为正相关但衰减,提示情绪冲击具有1–2日的有效传导窗口可用于交易执行。 ◆应用性: 情绪指数对权益市场存在1-2日的显著领先性,可用于日常主观、量化投资交易的领先指标,创造另类Alpha价值。 舆情指数与沪深300指数交叉相关分析 舆情指数可应用性分析 拐点命中:方法与结果 ◆结果要点: 最优组合下,多空平均兑现率约70.3%,谷底提前1–5日的命中优势更显著。 ◆应用性: 在市场情绪过热时,指数能够提前反应,及时触发风险预警机制,辅助投资者和公司提前采取防御性措施。 免责申明 国泰君安期货有限公司(以下简称“本公司”)具有中国证监会核准的期货投资咨询业务资格(证监许可[2011]1449号)。 本报告的观点和信息仅供本公司的专业投资者参考,无意针对或打算违反任何地区、国家、城市或其它法律管辖区域内的法律法规。本报告难以设置访问权限,若给您造成不便,敬请谅解。若您并非国泰君安期货客户中的专业投资者,请勿阅读、订阅或接收任何相关信息。本报告不构成具体业务的推介,亦不应被视为任何投资、法律、会计或税务建议,且本公司不会因接收人收到本报告而视其为本公司的当然客户。请您根据自身的风险承受能力自行作出投资决定并自主承担投资风险,不应凭借本内容进行具体操作。 分析师声明 作者具有中国期货业协会授予的期货投资咨询执业资格或相当的专业胜任能力,力求报告内容独立、客观、公正。本报告仅反映作者的不同设想、见解及分析方法。本报告所载的观点并不代表本公司或任何其附属或联营公司的立场,特此声明。 免责声明 本报告的信息来源于已公开的资料,但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的期货标的的价格可升可跌,过往表现不应作为日后的表现依据。在不同时期,或因使用不同假设和标准,采用不同观点和分析方法,本公司可发出与本报告所载资料、意见及推测不一致的报告,对此本公司可不发出特别通知。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告中所指的研究服务可能不适合个别客户,不构成客户私人咨询建议,客户应考虑本报告中的任何意见或建议是否符合其特定状况。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何直接或间接损失或与此有关的其他损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 版权声明 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰君安期货研究”,提示使用本报告的风险,且不得对本报告进行任何有悖原意的引用、删节和修改。若本公司以外的其他个人或机构(以下简称“该个人或机构”)发送本报告,则由该个人或机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该个人或机构以要求获悉更详细信息或进而交易本报告中提及的期货品种。本报告不构成本公司向该个人或机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该个人或机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。 除非另有说明,本报告中使用的所有商标、服务标记及标记均为国君期货所有或经合法授权被许可使用的商标、服务标记及标记,未经国君期货或商标所有权人的书面许可,任何单位或个人不得使用该商标、服务标记及标记。