金融事件分析及应用
金融事件分析的主要任务
金融事件分析的核心任务包括事件检测、要素抽取、事件关系、事件表示、事件预测以及构建金融事件图谱和事件体系。具体而言:
- 事件检测和要素抽取:识别事件类型、触发词和事件要素,如企业行为、高管变动等。
- 事件关系:通过远程监督和无监督学习抽取事件间及实体间的关系。
- 事件表示:结合上下文和关系进行事件表示学习。
- 事件预测:基于事件链模型预测未来可能发生的事件。
- 金融事件图谱:整合事件类型、主体、要素和关系,结合场景化知识进行推理分析。
- 金融事件体系:按公司、行业、宏观等建立不同的事件体系。
金融事件分析技术
事件检测
- 任务定义:从文本中检测事件并分类,通常通过抽取触发词进行分类。
- 挑战:新事件类型层出不穷,标注数据不足。
- 方法:基于提示词和预训练模型的事件检测,如Prompt-based模型,在ACE05数据集上零样本/少样本事件检测结果优异,Micro-F1 (%)达到78.8(5-way 0-shot)。
事件抽取
- 任务定义:识别事件类型、触发词并提取事件要素(如时间、金额等)。
- 挑战:标注数据成本高,难以扩展到新事件类型。
- 方法:
- 基于模板的生成式事件抽取(GTEE):将事件抽取转换为带模板的生成任务,支持少样本/零样本场景。
- 基于触发词检测增强的生成式事件抽取(TDE-GTEE):
- 结合事件检测和生成式抽取,增强触发词抽取效果。
- 使用BERT和BART模型,联合训练避免错误传播。
- 在ACE和ERE数据集上达到SOTA水平,消融实验显示两种提示有效性。
- 基于Prompt的事件类型检测进一步优化,在ACE05上零样本/少样本F1 (%)达到64.0/44.5(5-way 1-shot)。
总结和展望
- 核心观点:完善的事件分析框架为金融信息理解提供强力支持,澜舟科技提出的TDE-GTEE等模型在效果和零样本/少样本学习能力上达到SOTA水平。
- 技术优势:基于预训练模型,支持迁移学习,具备zero-shot/few-shot能力,体系化方法全面支持丰富场景。
- 应用框架:包括事件抽取、事件检测、事件库构建、事件链模型和事件预测,支持多种搜索和预测能力。
- 未来方向:澜舟科技持续推进金融事件分析和相关技术的落地和产品化,如市场搜索研判平台(langboat.com)。