登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
7-3 图机器学习与风控的 2.0 时代
机械设备
2022-07-18
DataFunSummit2022:图机器学习峰会
有梦想的人不睡觉
图机器学习与风控的演进与挑战
1.0时代:基于GNN的多源异构数据整合
风控任务特点
:涉及用户资料、行为数据,需评估风险行为发生概率,数据层面存在类别不平衡、概念漂移、数据不可信等问题。
图机器学习解决方案
:将多源异构数据转换为图表示,利用GNN评估风险特征,整合多源异构数据,实现半监督学习。
尚未充分考虑的挑战
数据不可信
:对抗手段(扰动、错误分类、注入异常边)导致数据噪声和扰动,影响模型准确性。
模型不可靠
:同质偏好假设易受攻击,异质偏好连边导致错误分类。
2.0时代:数据与模型的优化
数据可信度提升
结构学习净化
:通过无监督结构学习框架,去除干扰边,增强GNN鲁棒性。
对比学习框架
:获取无监督表征,降低对结构扰动的敏感性,优化图结构。
实验结果
:在Cora等数据集上,提升GNN在结构扰动下的性能。
模型可靠性提升
UD-GNN模型
:针对同异质偏好共存图,通过不确定度估计和去偏训练方法,减少模型偏差。
异质偏好与模型不确定性关系
:异质偏好比率越高,模型不确定度增加。
实验效果
:缩小与近似无偏模型的性能差,提升模型鲁棒性。
用户行为预训练模型
动机
:利用平台海量无标注用户行为数据进行风控任务。
自监督任务设计
:三种粒度任务(动作、意图、序列级别),挖掘用户行为特征。
动作级别
:基于树的层次掩码,强化意图识别。
意图级别
:随机掩码,赋予同等重要性。
序列级别
:二分类任务,捕捉同源序列行为模式。
实验结果
:在阿里巴巴平台真实数据上,提升欺诈交易检测、支付欺诈检测和信用风险评估性能。
GNN与风控的演化阶段
1.0阶段
:怀疑数据不可信,通过数据去噪和模型纠偏提升性能。
2.0阶段
:假设数据可信,发挥GNN从复杂数据中学习特征的能力。
2.0+阶段
:进一步探索数据补全和模型泛化,提升模型鲁棒性和泛化能力。
你可能感兴趣
7-5 图机器学习在蚂蚁安全风控场景的应用
商贸零售
DataFunSummit2022:图机器学习峰会
2022-07-18
7-3 多任务学习在风控场景的应用探索
商贸零售
DataFunSummit2022:智能风控技术峰会
2022-07-19
机器学习时代的贫困地图
商贸零售
世界银行
2023-05-01
机器学习——深度学习时代铝工程的技术战略
商贸零售
Machine Learning Yearning
2023-11-15
5-4 图机器学习在蚂蚁推荐业务中的应用
商贸零售
DataFunSummit2022:图机器学习峰会
2022-07-18