这篇研报主要研究了面向中文医疗科普知识的内容理解。在报告中,作者们提出了一个基于医疗科普知识内容理解的问题,即如何回答那些问“脸总是起痘是什么原因”这样的问题。为了解决这个问题,作者们提出了一种基于自然语言处理(NLP)和机器学习(ML)的技术,即使用BERT模型来对医疗保健问题进行分析和理解。
为了验证该方法的有效性,作者们在两个数据集上进行了实验,即在A榜测试集和B榜测试集上测试了基线模型、微调模型和对抗学习模型。结果表明,使用对抗学习模型(R-Drop)可以有效提高模型的性能,尤其是在微调阶段。
最后,作者们还提出了一种基于编辑距离和小学习率的数据增广方案,以提高模型对答非所问问题的识别能力。通过使用该方案,模型可以在保证较高准确率的同时,提高对答非所问问题的识别率。
总的来说,该研究提出了一种基于BERT模型和医疗保健知识内容理解的方法,以解决中文医疗保健领域中的答非所问问题。该方法在两个数据集上进行了实验,并证明了其有效性和可靠性。