AI智能总结
演讲人:杨俊建行上海大数据智慧中心 外数数据定义 外部数据指为满足业务发展需要从本行外部获取的支持客户营销、风险管控、管理决策、产品创新、运营优化以及监管合规的数据、分析报告及资讯信息等,包括但不限于采购、合作等方式获取的数据,以下为市面上常见的一些外部数据源。 外部数据管理模式据管理模式 外部数据引入和应用模式 实时联机查询 •外部数据管理组件发布外部数据服务,业务组件在取得授权的情况下实时调用服务。基本都是嵌入业务流程或者模型中伴随业务办理调用,是当前外部数据主流模式。 批量数据传输 •根据下游业务组件用数需求,通过数据仓库按照指定频率推送全量或者增量数据表。适用于批量企业公开数据。 平台自助查询 •业务人员登录我行外部数据管理平台或者外数慧查,通过平台查询界面查询数据,全为我行整合后的企业公开数据。 用数方式 外部数据嵌入信用卡业务全流程中 自2018年4月以来,信用卡条线应用多项外部数据,应用范围覆盖信用卡客户生命周期的六个环节:预审批、客户识别、伪冒欺诈、审批、交叉销售、风险预警。 联合建模-数据融合应用数据合作新模式 在隐私计算出现前,联合建模是银行通过机器学习建模方式引入外部数据、探索新产品、新场景应用的重要方式,通过与政府机构、公共事业、运营商、头部电商等可信外部数据源进行联合数据探索和数据挖掘,确保双方数据安全、开展模型研发、创新数据价值变现的一种外部数据应用新模式。 数据隐私保护 2022年,上海大数据智慧中心支持总行普惠部、数字化工厂、乡金部等5个业务部门及浙江、湖北2家分行开展了联合建模项目。 隐私计算技术应用背景 国家战略发展要求 企业自身发展要求 国家倡导在数据安全的基础上,激活数据应用价值 2020年4月,国务院首次将数据与土地、劳动力、资本、技术并列为五大生产要素,同时指出要加快培育数据要素市场,推进数据开放共享、提升数据资源价值、加强数据资源整合和安全保护。 合规安全是数据应用的基石 数据安全属于国家安全、公共安全、经济安全和社会稳定,各国均在加强数据安全立法和标准制定。安全合法合规是挖掘数据价值的底线。 数据融合应用是激活数据价值,实现价值创造的重要能力。由于数据作为金融机构的核心资产,安全性至关重要,明文数据融合愈发不可行,各个机构形成“数据孤岛”。安全地进行数据开放共享,对于银行的产品创新、营销获客、风险管控、集团一体化等均具有重要意义。 银行业金融机构数据治理指引 金融安全分级指南 监 管 机 构 相 关 规 范 和 要 求 早期探索(建行&建信基金)-1 •成立于2005年,建信基金深耕基金投资领域,积累了相对全面的基金相关数据,对建行数据是有益的补充;•然而,母子双方互为独立法人,受限于隐私保护,无法直接进行数据交换和融合;•联邦学习应运而生,实现了在保护参与方各自数据隐私前提下的跨多方模型训练,为母子双方开展数据融合创造了可能。 建信基金截至2020年7月,共 建设银行•累积超8亿个人客户 •大数据平台超5000个客户标签,覆盖存款、信贷、消费、投资等领域 有近500个特征标签,覆盖超过4000万个人客户,其中建行客户近1300万。 早期探索(建行&建信基金)-2 联邦学习思想 打破数据孤岛,在各数据参与方不泄露本方客户数据和不违反国家数据保护法律法规的前提下,进行联合的机器学习模型训练,同时模型效果与将各方数据集中在一起建模保持一致。 联邦学习价值 在保障各方客户隐私和数据安全的前提下,带动跨领域的企业级数据合作,催生联合建模的新业态和新模式。 应用进展 1:使用FATE开源联邦学习框架。2:通过现有网络专线打通双方数据环境。3:与建信基金就业务目标达成一致,针对高净值、临界、长尾、休眠、流失客群分别开展客户提升模型建模 早期探索(建行&建信基金)-3 1.联邦学习采用了集成树SecureBoost算法,集成15~30棵树; 2.在建行单边模型效果已经较好的前提下,联邦学习模型效果全面优于建行单边模型。在基于9月数据、10月表现的评分集上,AUC平均提升10.4%,最高提升41.2%,KS平均提升58.1%,最高提升248%。 3.在评分前5%客群,联邦学习模型普遍优于建行单边模型,随着客户范围扩大,优势有所下降。其中,休眠模型始终大幅领先。 早期探索(建行&建信基金)-4 •整体购买情况:12月14日至21日,共有46807位客户购买速盈,申购金额13.08亿元,营销响应率4.97%; •模型对比:联邦学习客群营销响应率为5.33%,其中模型评分前5%客户的响应率为7.35%,比建行单边模型评分前5%客户的响应率(5.47%)高34%。 •对照组:联邦学习客群营销响应率比对照组高11%。 •分客群:联邦学习高净值客群响应率达10.3%。 u基于隐私计算框架支持大数据分析需求(截止2023年5月): 隐私计算业务场景-2 ★建信信托--信贷、股权和债券主体客户评级分布 ★建信基金--非货长尾客户精准营销 ★建信人寿—代理人存量客户精准营销 p安全求交,安全计算,构建模型,子公司营销。基于建行与建信人寿双方的客户数据,开展基于母子联邦的建信人寿代理存量客户精准营销大数据项目,建立营销模型,产出客户清单,推送至建信人寿相关组件或app,进行营销。 p安全求交,构建模型,行内营销。基于建行与建信基金双方的客户数据,开展基于母子联邦的非货长尾客户的精准营销大数据项目,建立营销模型,产出客户清单,在行内推送至对私组件,进行营销。 p安全求交,匿踪查询,分析报告。基于建行与建信信托双方的客户数据,开展三类主体客户的匿踪查询,通过撞库后获取共有客户,针对部分字段开展基于客群分类的匿踪查询。 隐私计算业务场景-3 ★其它2023年正在推进中的外部公司 ★建信养老--个人养老金精准营销 ★美团—美团商户快贷准入及授信模型 p安全求交,匿踪查询,安全计算,构建模型。 p安全求交,构建模型,惠懂你部署。p基于建行与美团双方的客户数据,开展基于联邦的美团商户快贷准入及授信模型开发,建立准入和额度模型,产出模型并部署至惠懂你。 p安全求交,行内营销。p基于建行与建信养老双方的客户数 据,开展基于母子联邦的建信养老个人年金客户和TA客户的个人养老金精准营销大数据项目,产出客户清单,在行内推送至对私组件,进行营销。 p其它建行子公司、多家支付机构、多地运营商、互联网公司等。合作场景包括反赌反诈、精准营销、精准风控等。 建行企业级隐私计算平台建设 按照“平台化、场景化、标准化、生态化”的思路,进行技术研究、平台建设、场景落地。 面向建行业务应用需求,打造企业级数据共享安全计算平台,实现数据的可用不可见,激活数据价值,助力业务数字化发展。 建设原则 平台在保护各方隐私的前提下,实现联合查询、联合运算、联合建模多种核心数据融合功能,支持机构间的数据隐私共享及不同金融场景的应用建模。 营造数据“取之有据、用之有道、护之有术”的良性数据生态,打造“金融无界、数据有界”的护城河。 隐私计算平台设计原则 价值创造为目标 企业级架构为基础 在打造平台的同时,通过积极探索新的业务模式来扩展外部数据连接,解决数据供给侧和需求侧匹配的问题,推动建设机构间数据交易网络与数据共享生态,促进数据有效融通,实现业务价值。 全面整合联邦学习、多方安全计算等技术路线,支持联合查询、联合计算、联合建模、存证审计等丰富功能,支持建行集团内外部各机构快速部署,便捷使用。 实现高等级数据安全 满足监管合规要求 基于隐私计算和密码学底层算法,在确保“数据不出域”的前提下,实现数据“可用不可见”,充分发掘跨机构数据在银行风控、营销、监管等场景的价值。 遵守《数据安全法》、《网络安全法》、《个人信息保护法》等法律法规,遵照上级金融监管单位的监管要求,确保业务合法合规。 建行集团隐私计算创新和荣誉 •《基于隐私保护计算技术的金融领域数据融合应用研究》-北京市金融科技产业联盟发展研究专委会一类重点课题;•《区块链隐私保护机制中的范围证明算法和环签名算法研究》-国家密码管理局-密码标准委研究课题。 星河案例奖 《联邦学习及联合建模在隐私保护中的应用 》 获 得 2 0 2 0 年 中国 信 通 院 隐 私 计 算“星河案例”奖。《建行快贷公积金客群 风 控 》 获 得 2 0 2 1年中国信通院隐私计算“星河案例”奖。 •在隐私计算、可信审计、区块链、隐私数据共享、同态加密等领域已提交28件专利申请,其中6项已获得授权;•《一种金融场景的隐私保护多方联合计算系统》专利已获得授权,是行业内最早获得授权隐私计算方向整体解决方案专利之一。 •2022“金融密码杯”全国密码应用和技术创新大赛-创新赛一等奖 建行集团隐私计算未来发展方向 加速落地更多数据融合应用赋能金融业务场景 加速探索行内外更多数据融合应用场景,赋能风控、营销等常见业务场景,以实现数据与金融业务场景的安全有效融合。 加强生态合作 与生态合作伙伴一起,共同推进如互联互通等行业生态建设。 持续技术投入和创新研究 依托建行量子实验室等前沿技术研究机构,持续在隐私计算领域投入技术研究力量。参与相关课题研究、标准制定、专利研发等,探索具备抗恶意攻击、抗合谋攻击、抗量子攻击的隐私计算算法。 — THANKS —




