AI智能总结
演讲⼈:Fabarta贾志鹏 目录Contents 第⼀章节:业务背景第⼆章节:分析过程第三章节:案例介绍第四章节:总结 业务背景 背景 反洗钱业务背景 ⾦融技术、⾦融创新快速发展,普及、应用,⾦融交易量迅速增长,洗钱、恐怖融资等犯罪⾏为层出不穷,犯罪⼿段不断翻新,呈现专业化、团伙化、隐蔽化等特点,严重危害⼈民群众的财产安全和合法权益。 洗钱团伙挖掘 洗钱活动往往涉及到团伙犯罪,⽽反洗钱规则只适用于识别单个账户的洗钱⾏为,需要进⼀步对参与反洗钱的可疑交易洗钱团伙进⾏挖掘,从⽽深⼊识别风险较⼤、相互关联的可疑团伙群体,有效提升反洗钱可疑交易报告的情报价值,也为进⼀步探索相关技术在全面风险管理、客户关系挖掘等⽅面的应用奠定基础。 业务流程及痛点 业务痛点 l时间长:单个案例处理时间较长(20-50分钟)l⼿段局限:SQL筛选过滤,⽆法对关联数据进⾏深度分析l⼈⼯处理⼯作量⼤:每年数万多起案例数据l问题数据⽆法得到融通和应用:可疑数据上报后⽆后续利用 分析过程 分析过程 模型分析 数据收集 建立图谱 团伙发现 数据融通 -应用多种数据分析建模⼿段,发掘可疑个体 -融合客户交易数据,客户资料,外部数据等多源数据 -面向反洗钱主题,构建基础图谱,在基础图谱上进⼀步建立特征图谱 建立图谱 1.收集相关数据,建立基础数据图谱;-个⼈账户信息,如账户数量、证件、地址和电话等;-企业账户信息,如注册资⾦、经营范围和股权情况等;-交易数据,如⾦额,交易时间,交易对⼿;-交易⾏为信息,如⽹银交易(IP地址、MAC地址),柜面交易,交易⽹点等; 2.应用基础数据图谱,进⼀步进⾏特征加⼯,并在此基础上进⼀步发现关联关系;-账户资料的特征,如同⼀注册地址、持股关联⽅和⼀致⾏动⼈等;-资⾦交易上的特征,如频度、模式、速度和⽅式等;-交易⾏为的特征,如同⼀IP地址及MAC地址下的关联交易、同⼀区域⽹点内分散交易等; 模型分析 在原有分析维度的基础上融⼊图相关特征进⾏建模分析; 相关性 顶点重要性 eigenvector_centrality:特征向量中⼼性HITSPageRankkatz_centrality attribute_assortativity_coefficient:属性相关degree_assortativity_coefficient:度数相关 顶点度相关统计 社区相关 average_degree_connectivity:顶点度平均degree centrality:度中⼼k-core:k度k-shell:< k度剥离 clustering:社区聚集triangles:三角计数louvain:社区发现lpa:标签传播wcc:连通图 路径和遍历 ©2023Fabartaaverage_shortest_path_length:平均最短路径bfs:⼴度优先sssp:加权最短路径k shell:< k度剥离 案例介绍 案例说明 本案中所有数据及分析过程为应用开源数据集进⾏模拟分析,并⽆任何真实业务数据; •本案例数据来源于开源数据集IBM/AMLSim(https://github.com/IBM/AMLSim);•本场景分析过程中应用⼯具为Fabarta图智能分析平台; 案例流程 数据探查 交易个体特征的发现-筛选交易个体 l统计所有账户的转⼊⾦额/转出⾦额比例l标准差法找出异常值:比平均值⾼出两个标准差的数据 异常点分析 围绕异常点过滤⼦图 l围绕选定account:996账户展开其相关交易链路l通过图探查发现交易为多个账户转⼊汇聚到该账户上 图结构特征探查 围绕⼦图开展团伙发现 l图结构特征的探查-三角计数l发现account:996的三角计数结果明显⾼于其他账户l通过图探索围绕账户account:996存在⼤量聚集关联交易 图结构特征发现 结合聚类结果和结构特征的发现 l针对上述发现的围绕账户“account:996”的聚集关联交易进⾏聚类分析-鲁汶算法l可以发现分组4中交易关系复杂,且交易总量达到148万,平均每笔6.7万,可以确定为可疑团伙 图结构特征发现 针对分组4,进⼀步分析发现团伙分⼯ l统计分组内各账户的转⼊转出笔数l账户“account:996”为转⼊笔数显著⼤于转出笔数,为疑似 接收者l账户“account:876”,“account:466”,“account:305”,均为发起转⼊账户,为疑似发起者l其余账户参与交易,且转⼊转出笔数相似,疑似洗钱参与者 图模式转化为任务 结合以上步骤的发现的图模式,建立对应的图模式任务,进⼀步在全量数据集中应用已发现模式识别可疑团伙⾏为 •可视化构建图模型;•支持结构化/非结构化数据库数据接⼊离线/实时接⼊;