对话情感识别任务介绍
对话情感识别任务旨在识别对话中多个说话者话语的情感,其中主要挑战包括说话者情绪受其他说话者影响、话语情绪受上下文信息影响,以及区分语义相似但细微差别的情感类别(如“沮丧”与“悲伤”)。
方法概述
- 对话建模:使用 BART 对话语进行编码,并在话语前拼接说话者姓名或类别。通过对话级转换器建模上下文依赖关系。
- ERC 的监督对比损失:通过对比学习区分语义上相似的情绪类别,制作隐藏状态的副本以获得对比样本,实现相互排斥的损失函数。
- 辅助响应生成:根据当前话语生成响应,使用 BART 编码器和解码器进行生成任务。
损失函数
总损失是交叉熵损失、对比损失和生成损失的加权和,其中 α 和 β 为权重参数。
实验结果
- 数据集:MELD、EmoryNLP、IEMOCAP 和 DailyDialog。
- 指标:加权平均值 F1(DailyDialog 中忽略“中性”标签)。
- 性能:与基于预训练的模型相比,该方法在四个数据集中取得了非常有竞争力的结果。
- 可视化:α 为 0 和 0.8 时的 t-SNE 可视化显示,监督对比学习澄清了不同情绪类别的界限。
- 定量分析:监督对比损失在实现最优结果中的比例在不同数据集间有所不同,但对任务有很大帮助。
- 消融研究:说话人信息在 IEMOCAP 中起着至关重要的作用。