您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰期货]:策略探索:形态识别结合多模态舆情分析 - 发现报告

策略探索:形态识别结合多模态舆情分析

2025-06-25 虞堪 国泰期货 肖峰
报告封面

虞 堪国 泰 君 安 期 货 01形 态 识 别目录CONTENTS03多 模 态 舆 情 分 析 /提取特定的规则通过定义特定的K线形态规则,如头肩顶、头肩底、双顶、双底等,来寻找历史中相似的K线形态。第4页相似形态的传统思路欧氏距离可以用于计算具有多个特征的两个样本之间的距离。在多维空间中,每个样本可以表示为一个特征向量,而欧氏距离则衡量这些特征向量之间的直线距离。 相关性使用相关系数来衡量两段K线之间的线性关系。相关系数接近1表示高度正相关,接近-1表示高度负相关,接近0表示无明显线性相关性。欧氏距离计算K线之间的欧氏距离,距离越小表示相似度越高。对K线的收盘价、开盘价、最高价和最低价进行归一化,以消除量纲的影响。 /第6页相似形态的传统思路:存在的问题规则单一不灵活,需要手动定义和识别形态,品种间差异降低效果。对形态的定义可能存在主观性,不同分析师可能有不同的理解。经验为主,不能很好地适应行情演变。无法捕捉复杂的形态特征。1234 /第7页相关性&欧氏距离相关性:0.83欧氏距离:111.1:米 筐,资料来源:米筐,国泰君安期货研究 /第8页动态时间规整动态时间规整是一种用于衡量两个时间序列之间相似度的方法,可以处理时间序列的伸缩和变形。核心思想是通过引入额外的时间维度,找到两个时间序列之间的最优对齐路径,使得这两个序列在形状上的差异最小。:米 筐,资料来源:米筐,国泰君安期货研究AB 语音信号具有相当大的随机性,即使同一个人在不同时刻发同一个音,也不可能具有完全的时间长度。C /第9页动态时间规整:米 筐,资料来源:米筐,国泰君安期货研究 /第10页动态时间规整Savitzky-Golay滤波器是一种基于多项式拟合的平滑滤波器,能够有效减少数据中的噪声,同时保留数据的主要特征。:米 筐,资料来源:米筐,国泰君安期货研究 SG滤波 /第11页动态时间规整资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究 情绪识别02 /第13页盘后信息的缺失◆根据日内信息构建形态识别因子,回测时间从2021年起。◆次日开盘交易的效果显著下降,累计收益从94%下降至71%,有23%的收益在随机的隔夜信息中损失。◆隔日之后,市场情绪可能是有些变化的-0.200.20.40.60.811.2资 料 来 源:米 筐,国 泰 君 安 期 货 研 究资料来源:米筐,国泰君安期货研究 差额当日收盘 次日开盘 /第14页情绪衡量方式Keynes的“选美比赛”理论1936年,约翰·梅纳德·凯恩斯(John Maynard Keynes)指出,投资者在金融市场中往往不是基于资产的基本面价值进行投资,而是试图预测其他投资者的行为和预期。关键不是你认为谁漂亮,而是猜大家会选谁。✓投资者情绪调查:通过定期对投资者进行问卷调查。✓基于盘中交易行为数据的方法:它利用多个指标的互补性,通过技术手段去除无关信息,从而提取出更纯净的情绪信号。✓利用非传统的数据源来提取投资者情绪:通过分析社交媒体平台上的用户言论。 /第15页基于盘中交易数据的情绪单个代理的局限性:单个情绪代理可能因为包含过多无关信息或噪音,而与价格走势没有明显的相关性。资料来源:Wind,国泰君安期货研究 选取于若干个可以表征投资者情绪的代理,使用降维技术提取共同信息,从某证程度上获得提纯的投资者情绪。提纯后情绪的价值:经过降维技术提纯后的投资者情绪,去除了无关因素的干扰,更能反映投资者情绪的核心特征,因此具有更强的预测性能。它可以用于预测市场走势、资产价格波动等。 /第16页基于盘中交易数据的情绪资 料 来 源:Wind,国 泰 君 安 期 货 研 究资料来源:Wind,国泰君安期货研究-0.200.20.40.60.811.2强动量因子+情绪◆虽然很多是盘中信息,但也包含了一些对盘后的预期,部分信息也传递到了次日的交易中。◆我们将形态识别因子叠加上情绪指标,效果有所提升,甚至达到了当日收盘交易的效果。 强动量因子 多模态舆情分析03 /第18页公众媒体的信息 1.人脸检测:通过OpenCV检测图像中的人脸2.面部关键点检测3.动作单元(AU)识别:提取AU特征4.情绪分类:微调预训练模型,情绪分类1.提取音频:FFmpeg等工具2.音频转文本:whisper模型3.情绪分类:微调BERT预训练模型1.爬取文本:BeautifulSoup等工具2.对文本进行标签处理3.情绪分类:微调BERT预训练模型 /第19页媒体信息的爬取——视频模态重点分析整个视频中人物的主体情绪。从视频信息中识别出人物的表情后,根据整个视频中每帧的表情,构建了两个金融表情指标,即“积极”和“消极"。前者是人物快乐表情的视频帧数与带有悲伤表情的视频帧数之差占视频总帧数的比例,后者是指人物恐惧表情的视频帧数与视频总帧数的比例。对整个视频进行处理,最终会得出一个视频情绪值。资 料 来 源:国 泰 君 安 期 货 研 究资料来源:国泰君安期货研究 /第20页媒体信息的爬取——OpenFace核心流程OpenFaceOpenFace是卡内基梅隆大学开源的人脸识别和人脸验证库,可进行人脸关键点检测(facial landmark detection)、头部姿态估计(head poseestimation)、面部动作单元识别(facial action unit recognition)、视线估计(eye-gaze estimation)和人脸特征提取(Facial FeatureExtraction)任务。通过CNN神经网络,对人脸的特征进行提取,方便最后的情绪分类。开源地址:https://github.com/TadasBaltrusaitis/OpenFace /第21页媒体信息的爬取——面部特征捕捉和归一化人脸特征捕捉方向梯度直方图的方法,分割成一些16×16像素的小方块,在每个小方块中,计算出每个主方向上有多少个梯度(有多少指向上,指向右上,指向右等)。取频次最高的方向作为该单元格的代表方向,用箭头可视化。最终的结果是,把原始图像转换成了一个非常简单的表达形式,这种表达形式可以用一种简单的方式来捕获面部的基本结构。面部位置归一化通过找到脸上的主要特征点,找出脸部的姿势。一旦找到这些特征点,就利用它们把图像扭曲,使眼睛和嘴巴居中。使用68个面部标记用于特征检测,并且测量这些点之间的距离并与在平均人脸图像中找到的点相比较。找出变化,比如眉毛上扬、嘴巴下拉。 /第22页媒体信息的爬取——分解为独立的动作单元AU编号AU1AU2AU4AU5AU6AU7AU9AU10AU12AU14AU15AU17AU20AU23AU25AU26AU28AU45FACS(Facial Action Coding System,面部动作编码系统)是一套用于科学分析面部微表情和情绪的标准化工具,由心理学家Paul Ekman和Wallace V. Friesen于1978年提出,后经过多次修订(最新版为FACS 2017)。广泛应用于心理学、动画制作(如皮克斯)和安防(微表情检测)。FACS将人类面部肌肉运动分解为独立的动作单元(ActionUnits, AUs),每个AU对应一块或多块肌肉的收缩。通过组合不同的AUs,可以精确描述任何面部表情,进而推断情绪。 /第23页媒体信息的爬取——通过AU组合模式推断情绪OpenFace输出的AU数据通常包含强度值(0-5级)和是否存在(0/1)。基于面部动作编码系统FACS手册,判定面部表情。情绪核心AUs辅助AUs快乐AU6 + AU12AU25(张嘴)愤怒AU4 + AU7 + AU23AU5(瞪眼)、AU17(抬下巴)悲伤AU1 + AU4 + AU15AU17(下巴颤抖)惊讶AU1 + AU2 + AU5 + AU25 + AU26-恐惧AU1 + AU2 + AU4 + AU5 + AU20AU25(嘴唇拉伸)厌恶AU9 + AU10AU17(鼻子皱起)轻蔑AU12(单侧)+AU14- 强度特征AU6强度> 2(眼周皱纹)AU4高强度(眉毛紧皱)AU15持续下拉(嘴角下垂)AU25/26快速激活(张嘴)AU5高强度(瞪大眼)AU9不对称(单侧鼻翼动)仅一侧嘴角上扬 /第24页媒体信息的爬取——每帧情绪汇总,得到最终情绪timestampAU05_r AU06_r AU09_r AU12_r AU14_r AU17_r AU20_r AU23_r AU45_r AU05_c AU06_c AU09_c AU12_c AU14_c AU17_c AU20_c AU23_c AU25_c AU45_c000.3502.171.780.5100.240.6401010.03300.320.361.451.170.890.560.560.4901010.06700.240.710.730.571.231.020.810.4810100.100.120.96001.561.581.010.4510100.13300.070.780.060.031.471.380.980.4210100.16700.040.50.080.111.581.130.930.2110100.20.090.040.280.090.141.720.710.980.0110000.2330.3500.110.030.21.940.4810.11000资料来源:国泰君安期货研究 /第25页语音提取和识别Whisper是一个由OpenAI开发的开源语音转文字(Speech-to-Text)模型,采用端到端的神经网络架构,直接从原始音频数据生成文本,省略了传统语音识别系统中,声音转换成频谱图再转换为字符复杂的步骤。Whisper识别结果:仙子,黄金最近不断冲高,看得我贼心动但我之前只买过黄金ETF,感觉比较省心还有哪些投资黄金的方式适合我呢?那今天我们先简单聊聊黄金最常见的三种投资方式好呀先说最实在的,实物黄金比如金店里卖的金手势,银行里可以购买的金条金币这种能拿到手里的都算实物黄金但是呢,买实物黄金也有它的问题这放在家里,揣在兜里吧,总会担心万一保管不利,掉了或者被偷了怎么办而且在想要折现的时候,还需要拿去金店或者银行折旧费用也高实物黄金这种投资呢,就比较适合打算长期持有偏好实物资产,风险厌恶型的投资者嗯,那感觉还是ETF更加灵活对,ETF堪称懒人法宝日内随时买卖,流动性强而且起投金额低至几百元不过呢,做ETF也需要有风险预期它会受股市的波动影响会受交易时间限制也需要通过证券账户交易极端行情之下也有可能出现折溢价有时候也会出现跟踪误差的情况比如说因为管理费等因素价格可能会和实际金价偏离那比较适合熟悉股市的交易者没错,适合熟悉证券市场更想做短期交易追求高流动性的投资者最后还有一个投资黄金的方式就是期货没错期货交易的特点你应该了解啦T加0双向多空交易保证金杠杆机制没错期货交易流动性高可以用少量的保证金交易较大规模的黄金资产不过呢期货的高收益也就代表着高风险更适合风险承受能力强的专业投资者要结合自身的条件理性选择投资方式没错媒体信息的爬取——音频模态 /第26页使用BERT进行语义识别BERT(开源链接:https://github.com/google-research/bert )BERT作为一种预训练语言模型,它具有很好的兼容性,能够运用在各种下游任务中,主要目的是利用数据集来对BERT进行训练,从而实现一个语义分类的模型。预训练数据:BERT经过了大规模语料(如维基百科)上预训练的,这些数据经过掩码语言模型(MaskedLanguage Model, MLM)和下一句预测(Next Sentence Prediction, NSP)任务训练,使得模型能够学习到丰富的语言知识。MLM通过随机掩码词汇让模型学习上下文语义,NSP通过判断句子关系提升篇章理解能力。情感分类:情感分类通常会使用情感匹配词典(Sentiment Lexicon