行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

7-3 图机器学习与风控的 2.0 时代

机械设备2022-07-18DataFunSummit2022：图机器学习峰会有***

AI智能总结

图机器学习与风控的演进与挑战

1.0时代：基于GNN的多源异构数据整合

风控任务特点：涉及用户资料、行为数据，需评估风险行为发生概率，数据层面存在类别不平衡、概念漂移、数据不可信等问题。
图机器学习解决方案：将多源异构数据转换为图表示，利用GNN评估风险特征，整合多源异构数据，实现半监督学习。

尚未充分考虑的挑战

数据不可信：对抗手段（扰动、错误分类、注入异常边）导致数据噪声和扰动，影响模型准确性。
模型不可靠：同质偏好假设易受攻击，异质偏好连边导致错误分类。

2.0时代：数据与模型的优化

数据可信度提升

结构学习净化：通过无监督结构学习框架，去除干扰边，增强GNN鲁棒性。
- 对比学习框架：获取无监督表征，降低对结构扰动的敏感性，优化图结构。
- 实验结果：在Cora等数据集上，提升GNN在结构扰动下的性能。

模型可靠性提升

UD-GNN模型：针对同异质偏好共存图，通过不确定度估计和去偏训练方法，减少模型偏差。
- 异质偏好与模型不确定性关系：异质偏好比率越高，模型不确定度增加。
- 实验效果：缩小与近似无偏模型的性能差，提升模型鲁棒性。

用户行为预训练模型

动机：利用平台海量无标注用户行为数据进行风控任务。
自监督任务设计：三种粒度任务（动作、意图、序列级别），挖掘用户行为特征。
- 动作级别：基于树的层次掩码，强化意图识别。
- 意图级别：随机掩码，赋予同等重要性。
- 序列级别：二分类任务，捕捉同源序列行为模式。
实验结果：在阿里巴巴平台真实数据上，提升欺诈交易检测、支付欺诈检测和信用风险评估性能。

GNN与风控的演化阶段

1.0阶段：怀疑数据不可信，通过数据去噪和模型纠偏提升性能。
2.0阶段：假设数据可信，发挥GNN从复杂数据中学习特征的能力。
2.0+阶段：进一步探索数据补全和模型泛化，提升模型鲁棒性和泛化能力。

7-3 图机器学习与风控的 2.0 时代

点击免费查看完整报告

你可能感兴趣

hot

7-5 图机器学习在蚂蚁安全风控场景的应用

信息技术

DataFunSummit2022：图机器学习峰会2022-07-18

hot

7-3 多任务学习在风控场景的应用探索

文化传媒

DataFunSummit2022：智能风控技术峰会2022-07-19

hot

机器学习时代的贫困地图

文化传媒

世界银行2023-05-01

hot

机器学习——深度学习时代铝工程的技术战略

机械设备

Machine Learning Yearning2023-11-15

hot

5-4 图机器学习在蚂蚁推荐业务中的应用

文化传媒

DataFunSummit2022：图机器学习峰会2022-07-18