AI智能总结
!"#$%&'()*+, !"#$%&'( )*+,-./012 !"#$%&'( )*+,-./012 !"#$%&'()* •加入FATE开发专委会•自主研发的“联邦半监督学习算法”被全球首个工业级联邦学习框架FATE采纳,于FATEv1.10发布•出版《联邦学习原理与应用》书籍,该专著繁体中文版《不再理論化:聯邦學習親自動手工程專案實作》也同步在台湾发行•参与全国金融标准化技术委员会《联邦学习技术金融应用规范》行业标准制定•参与北京金融科技产业联盟《隐私计算互联互通行业标准》、《隐私计算互联互通研究报告》等课题编写 •成为FATE社区技术指导委员会成员 •自主研发的“可验证秘密分享算法”被全球首个工业级联邦学习框架FATE采纳,于FATEv1.5.1发布•发表两篇国际专业会议报告论文üA Federated F-score Based Ensemble Model for Automatic RuleExtraction, (ICML 20, CCF AI方向A类会议),Vienna, Austria.2020.7üA Vertical Federated Learning Method for Interpretable Scorecardand Its Application in Credit Scoring, (CSCR 20,信用评分与信用评级国际会议),Chengdu, China, 2020.10 !"#$%&+,-. •依托集团的联邦学习和区块链平台共建数据要素生态系统,旨在实现数据的安全合规共享; •成员企业通过星型模式连接到集团,并与外部数据源建立连接,进一步提升集团的数据驱动力和创新力; •应用于风控、营销和运营等多个关键业务领域,助力风险识别、优化营销策略,并提升运营效率。 /012345#678 u业务需求 某金控集团部分子公司基于年度考核方案,采用隐私计算技术,在保证数据安全的前提下统计客户总数、共同客户数、客户迁徙数等协同类指标,进一步助力集团协同发展。 /0123459:;< u业务需求 某保险机构基于联邦学习指导营销策略,目的是使购买过团险医疗险的客户二次购买重点营销的重疾险,增加产品的交叉持有;同时提升客户粘性与保障,延续客户的生命力。 /012345=>?@ u业务需求 通过联邦学习和区块链,某证券机构联合外部数据源构建机构客户风险评级模型,依据风险等级来辅助确定客户的授信额度、融资额度等指标,从而降低证券的信用风险。此外,为了保证联合建模的公平性,对参与双方数据的样本数、特征数、贡献度等进行存证,以此作为未来分润的参考。 •相比于仅使用本地数据的机器学习,纵向联邦学习虽然在一定程度上损失了部分数据量,但特征维度的增加最终提升了模型准确率。 •针对证券数据多分类、标签分布不平衡等特点,联邦模型选择效果表现更优的集成模型SecureBoost。 •设置机构名称的模糊匹配规则,使得样本对齐字段不局限于“社会信用号”,进一步增加交集的样本数量。 !"#$%&'( )*+,-./012 ABCD5#$EFG%& u业务需求 随着券商进入存量运营的时代,证券行业普遍面临如何挖掘高质量存量客户的问题。某证券公司意在借助联邦学习深入挖掘高质量客户群体,以促活、盘活存量客户,达成科技赋能业务、数据驱动运营的目标。 以基于概率策略的Positive Unlabeled Learning为例,其训练步骤为: ①Guest方持有两类数据,分别是正样本和无标签样本;②在数据预处理阶段,将无标签样本视作负样本,而后依次进行隐私求交和纵向联邦分类算法;③使用训练后的联邦模型对Guest方的无标签交集数据进行预测;④筛选出预测概率高于预设阈值的无标签交集数据,并为之附上正标签;⑤至此,便完成了一轮Positive Unlabeled Learning的训练,如此循环迭代直至数据集划分的收敛。 ABCD5#$EFG%& ABCD5HIJKLMN u业务需求 金控集团的客户资产通常分布在多家机构中,借助隐私计算技术,可以在不泄露各方数据的要求下,完成对集团客户总资产的统计,以挖掘高净值客户。 (1) (2) (3) (4) (5) ABCD5HIJKLMN !"#$%&'( )*+,-./012 OP8Q+,R#RS 课题背景 传输是隐私计算的核心要素,涉及算法、算子、管理、控制等各个层面。然而在实际应用中,不同厂商的隐私计算平台存在设计不统一的问题,这给数据的安全和应用的推广带来了极大的挑战。 研究思路 拟提出在异构隐私计算平台之间,建立一套指导各平台算法和算子相互协作的传输规范,为隐私计算平台间的传输层互通提供参考模式,并进一步规范传输接口、传输协议、报文格式等内容,继而实现安全可控的跨平台互通协作。 OP8Q+,R#RS OP8QTU*V 可信联邦学习 平台互联互通 不仅保证原始数据的隐私安全和模型的可证安全,还保证学习过程的高效率和模型的可用性,模型决策机制的可解释性、及模型的可溯源和审计监管 隐私计算互联互通技术在一定程度上能够促进“技术孤岛”联通,进而促进数据要素跨平台高效流通,当前跨平台互联互通已逐步成为行业新共识 联邦大模型 构建和使用大模型时如何保护用户隐私;当用于训练的公域数据消耗殆尽时,如何在保护数据隐私的前提下,合规合法地利用私域数据完成训练 !"#$




