登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
7-3 图机器学习与风控的 2.0 时代
机械设备
2022-07-18
DataFunSummit2022:图机器学习峰会
有***
AI智能总结
查看更多
图机器学习与风控的演进与挑战
1.0时代:基于GNN的多源异构数据整合
风控任务特点
:涉及用户资料、行为数据,需评估风险行为发生概率,数据层面存在类别不平衡、概念漂移、数据不可信等问题。
图机器学习解决方案
:将多源异构数据转换为图表示,利用GNN评估风险特征,整合多源异构数据,实现半监督学习。
尚未充分考虑的挑战
数据不可信
:对抗手段(扰动、错误分类、注入异常边)导致数据噪声和扰动,影响模型准确性。
模型不可靠
:同质偏好假设易受攻击,异质偏好连边导致错误分类。
2.0时代:数据与模型的优化
数据可信度提升
结构学习净化
:通过无监督结构学习框架,去除干扰边,增强GNN鲁棒性。
对比学习框架
:获取无监督表征,降低对结构扰动的敏感性,优化图结构。
实验结果
:在Cora等数据集上,提升GNN在结构扰动下的性能。
模型可靠性提升
UD-GNN模型
:针对同异质偏好共存图,通过不确定度估计和去偏训练方法,减少模型偏差。
异质偏好与模型不确定性关系
:异质偏好比率越高,模型不确定度增加。
实验效果
:缩小与近似无偏模型的性能差,提升模型鲁棒性。
用户行为预训练模型
动机
:利用平台海量无标注用户行为数据进行风控任务。
自监督任务设计
:三种粒度任务(动作、意图、序列级别),挖掘用户行为特征。
动作级别
:基于树的层次掩码,强化意图识别。
意图级别
:随机掩码,赋予同等重要性。
序列级别
:二分类任务,捕捉同源序列行为模式。
实验结果
:在阿里巴巴平台真实数据上,提升欺诈交易检测、支付欺诈检测和信用风险评估性能。
GNN与风控的演化阶段
1.0阶段
:怀疑数据不可信,通过数据去噪和模型纠偏提升性能。
2.0阶段
:假设数据可信,发挥GNN从复杂数据中学习特征的能力。
2.0+阶段
:进一步探索数据补全和模型泛化,提升模型鲁棒性和泛化能力。
你可能感兴趣
7-5 图机器学习在蚂蚁安全风控场景的应用
信息技术
DataFunSummit2022:图机器学习峰会
2022-07-18
7-3 多任务学习在风控场景的应用探索
文化传媒
DataFunSummit2022:智能风控技术峰会
2022-07-19
机器学习时代的贫困地图
文化传媒
世界银行
2023-05-01
机器学习——深度学习时代铝工程的技术战略
机械设备
Machine Learning Yearning
2023-11-15
5-4 图机器学习在蚂蚁推荐业务中的应用
文化传媒
DataFunSummit2022:图机器学习峰会
2022-07-18