01 征信报告内容简介
征信报告主要包含个人基本信息、信贷交易明细、非信贷信用信息和查询记录等,涵盖学历、婚姻状况、居住信息、职业信息、公积金缴纳情况、贷款和信用卡明细、查询记录汇总等详细信息。
02 报告之间的关系与建模
- 报告内关系:通过聚合同一月份的连续逾期月份数、逾期状态序列、一个月内从银行到小贷的时间窗口等特征,利用0.94至1.12的相似度指标进行分析。
- 报告间关系:通过还款月份聚合不同贷款/贷记卡的还款行为、机构聚合用户在同机构的借贷/查询信息、时间聚合隐藏的时间序列依赖关系,构建跨报告的关联模型。
03 报告之间的关系与建模(具体案例)
- 居住地址/单位地址更新日期:通过编号和更新日期分析用户地址变更,例如用户A从福州市闽侯区到厦门市思明区。
- 工作单位更新日期:通过编号和更新日期分析用户工作单位变更,例如用户从河间市连连红木业到山东顺丰速运有限公司。
- 公司图谱关系计算:利用GNN和预训练的多维嵌入,结合关联结构和外部属性(如注册资本、物业费),计算用户A与用户D通过公司(如焦作市思昊嘉业商贸有限公司)的关联关系。
04 图模型的解释与分析
- 模型解释方法:基于单案例的模型解释分为四类:基于梯度和特征的方法(SA/GuidedBP/CAM/Grad-CAM)、基于扰动的方法(GNNExplainer/PGExplainer/ZORRO/GraphMask/Causal Screening)、基于代理模型的方法(GraphLime/RelEx/PGM-explainer)、基于分解的方法(LRP/ExcitationBP/GNN-LRP)。
- 实践方法:保持图结构下的重要性度量(IG),分别对embedding层和连续特征计算重要性。