研究动机
- 因果结构学习目标:发现变量背后的因果关系,揭示事物发生机制,指导干预行为,以及反事实推理。
- 研究背景:人工智能技术需要提高鲁棒性和可解释性。
- 研究动机:
- 因果结构学习分类:基于约束、基于因果结构模型、基于打分;面向单源观测数据、多源观测数据、多源干预数据。
- 观测数据存在马尔科夫等价类问题,干预数据可以缓解该问题。
- 干预数据类型:完美干预/硬干预、不完美干预/软干预。
- 挑战:未知的干预变量和不同数据分布。
研究内容
- 研究问题:如何从多个带有未知干预变量的数据集中学习因果结构?
- 假设:
- 无未测量混杂因素。
- 每个数据集忠实于真实因果结构。
- 干预变量集在多个数据集中是保守的。
- EMIDGS技术路线:
- 学习骨架:使用EMIDPC算法重构因果骨架。
- 获取I-MEC:利用两个引理得到一个包含更多因果信息且理想情况被证明是正确的I-MEC。
- 搜索和打分:基于学习到的I-MEC进一步识别剩余未定向边。
实验分析
- 实验设置:
- 参数:
mD∈{5,10,15,20},mT∈{2,4,6,8,10},alpha∈[0.01,0.1]。
- 方法:
mT个干预数据集作为一个组,随机选择q个变量进行干预,q∈[1,mT]。
- 实验结果:
- EMIDGS vs. 现有算法:在高维数据中,EMIDGS表现出较明显的优势,能有效降低误发现率。
- 不同参数值的影响:
- 对不同变量(如“child”、“alarm”、“insurance”、“link”、“win95pts”、“munin”)在不同参数值下的性能进行比较,验证算法的鲁棒性。
总结
- EMIDGS算法贡献:
- 提出局部因果关系发现算法EMIDPC重构因果骨架。
- 利用两个引理得到包含更多因果信息的I-MEC。
- 搜索打分有效降低搜索空间。
- 实验结论:EMIDGS算法有效降低多个高维干预数据集的误发现率。
- 未来工作:从具有未知目标且是通用干预的多个干预数据集中学习一个给定目标的局部因果结构。