行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

端云协同隐私计算系统的设计和落地探索

信息技术 2023-07-13 DataFunSummit：2023年用户隐私与数据安全峰会 Roger谁都不是你的反派大魔王

背景及设计理念

当前，传统纯云智能系统存在用户隐私泄露风险，如厦门银行违规罚款、Telegram信息泄露等事件频发，同时全球范围内数据隐私法规（如欧盟《数据治理法》《数据法案》、中国《数据二十条》等）日益严格，推动端云隐私计算系统需求增大。

端云隐私计算系统设计

系统设计基于以下假设：数据分布在端侧且被保护，云侧仅持有少量数据，端云交互无法反推隐私信息；端计算能力有限，网络不稳定，端数量庞大且分布全球。系统采用“选择-计算-聚合”范式，通过三层功能需求实现隐私保护：端侧选择参与计算的设备，端云协同进行计算，云侧聚合结果。

设计理念与架构

系统以“主动隐私”为核心，强调以用户为中心，主动感知、审计和合规，保障隐私安全。架构面向落地智能业务，覆盖业务全层级（数据采集、转换、分析、建模、评估等），实现端云协同的隐私保护智能服务。通过大规模端采样（随机异步时空均匀选择）和云侧无数据模型评估（模型到数据范式），实现设备间协作和业务落地。

安全挑战与防御

联邦学习并非绝对安全，面临数据安全和过程安全双重挑战：

数据安全：用户隐私数据和模型数据均易受攻击，如投毒攻击（FedPerturb可打破防御造成模型发散）、后门攻击（FedBA可隐蔽植入后门）。
过程安全：需通过差分隐私（FedIPR框架防止梯度泄露、FedExactUnlearning实现数据遗忘）、模型水印（FedIPR防止模型非法复制）等技术进行防御。

结论

端云隐私计算系统通过选择-计算-聚合架构和主动隐私技术，实现大规模设备协作和业务落地，但仍需关注投毒、后门等攻击威胁，并采用差分隐私、模型水印等防御措施，确保数据安全和过程安全。

演讲人：Luca-OPPO-高级隐私计算研究员背景及设计理念术语说明传统纯云智能系统础润而雨 •1月30日，厦门银行违反个人金融信息保护规定、违反信息披露管理规定等23项违法行为罚款764万元•2月12日，Telegram查询机器人爆出国内45亿个人信息泄露，数据主要来自各快递平台•公安部公布黑产“断号”行动十大典型案例，个人信息占7成•特斯拉、TikTok、拼多多身陷数据安全、隐私问题的风口浪尖 e.g.输入法下一词预测 •2020/11，欧盟颁布《数据治理法》（Data GovernanceAct）草案；2022/02颁布《数据法案》（Data Act）草案•2022/12，启动“欧盟-美国数据隐私框架充分性决定”进程并发布草案，旨在促进安全的跨大西洋数据传输•2022/12，《数据二十条》出台，提出探索数据产权运行机制，形成“数据三权”分置的特色制度，促进数据合规高效流通使用•2022/12，欧盟委员会发布2023-2024年数字欧洲计划工作方案•2023/03，美国OSTP发布Privacy-Preserving Data Sharingand Analytics (PPDSA)战略端云隐私计算系统设计假设数据假设•数据分布在端侧，内容被保护 •云侧可能持有少量数据•端云间交互无法反推隐私的中间数据计算基础•端具有极有限计算能力 •端云网络不稳定，带宽低•端数量千万级•端分布在全球不同区域任务定义•端云计算任务可分解为子任务迭代执行•端参与运算，每子任务需要部分端运行•可能需要云聚合端运行结果端云隐私计算系统的三层功能需求端云隐私计算系统设计理念全球千万级设备协作面向落地智能业务主动隐私主动隐私意为以用户为中心，主动感知、主动审计、主动合规，以用户隐私安全为第一优先级，从提升用户智能服务体验出发，主动构建数据合法合规使用和流通策略，通过系统实现隐私技术透明公开、可证可信地承载全生命周期用户隐私安全保护能力系统面向落地智能业务，包含智能业务全层级，从业务定义、数据采集、数据转换、数据分析、端云建模、效果评估等全链路多方面实现端云协同且双方隐私保护的智能服务面向分布在全球的千万级异构计算设备，通过安全高效的端云协同实现隐私保护的设备间协作整体架构：选择-计算-聚合范式大规模端采样：端选择三象限问题定义：从可用端全集中选择一个子集参与一个子任务大规模端采样：随机异步时空均匀的端选择问题定义：从可用端全集中选择一个子集参与一个子任务落地智能业务：云侧无数据的模型评估 •模型评估范式转变，传统为数据到模型，在端云隐私保护场景下，为模型到数据•隐私保护模型评估可以分为验证数据集构建、模型下发、端侧本地评估及云侧聚合3个步骤•验证数据集基于用户选择（即端选择）和端内数据划分两个维度构建•模型下发除标准下发外，可以随训练基础模型下发以节省通信量，还可以多模型一起下发以实现A-B模型测试•本地评估和聚合分为端侧计算评估指标并加密，云侧聚合两步骤落地智能业务：联邦学习≠安全，过程安全端云协同挑战——安全攻击的研究工作 •投毒攻击（Poisoning）：问题：端云范式的脆弱性 •FedPerturb[1]提出了一种新型联邦学习无目标投毒方案，能够打破多种先进防御方案，并造成全局模型发散。-Step1.根据相应的策略选择具体的攻击扰动目标（如全连接层的bias，BN层前一个卷积层的weight）-Step2.确定扰动的范围与训练更新L2范数的缩放倍率（实验结果显示仅需将这两个超参数设定在一个范围内即可获得良好的攻击效果）-Step3.根据设定好的超参数对指定范围的训练更新进行自适应缩放-Step4.最后将该训练更新上传即可实现一次攻击 •客户端数据操作：参与客户端数量众多，可利用模型参数和训练数据实施攻击•被损害的中央服务器：中央服务器负责聚合和分发数据，存在被攻击者利用的可能性•聚合算法的不足：一般聚合算法无法识别出异常的数据并抛弃那些可疑的数据 •后门攻击（Backdoorattacks）: •FedBA[2]工作利用精心设计的GSC和PFAgg算法有效且隐蔽地攻击speaker验证模型，且表明了FL后门攻击能够取得与集中式方法相当的性能 [1]Jin,Tongsai, et al. “FedPerturb: Covert Poisoning Attack on Federated Learning via PartialPerturbation." (ECAI, 2023). (Our Work, under review)[2]Dan Meng*,XueWang, Jun Wang."Backdoor Attack Against Automatic Speaker VerificationModels in Federated Learning" ICASSP 2023-2023 IEEE International Conference on Acoustics, Speechand Signal Processing (ICASSP). IEEE, 2023.[PDF] . (Our Work) 主动隐私技术层：联邦学习≠安全，数据安全端云协同挑战——安全 •FedExU[3]:让模型有效遗忘指定训练数据，是一种保护用户数据隐私的方式,能降低训练的计算和时间开销，也保障遗忘指定数据前后模型的表现相同遗忘学习安全防御的研究工作差分隐私 •防止梯度泄露并保护参与方的隐私[1]：通过在本地梯度中添加噪声来保护隐私,使攻击者无法推断出任何关于单个客户端的敏感信息•作为主要参与方制定差分隐私行业团队标准 •FedIPR[4]框架提出了联邦深度神经网络所有权验证方案•允许嵌入和验证所有权签名，以声明FedDNN模型的合法知识产权(IPR)，从而防止模型被非法复制、重新分发或滥用模型水印 [1] Ye,Dayong, et al. "One Parameter Defense—Defending Against Data Inference Attacks via DifferentialPrivacy." IEEE Transactions on Information Forensics and Security 17 (2022): 1466-1480.[PDF][2]基于差分隐私的用户个人信息保护技术要求(Our work) [3] Cai,Yichen, et al. “ Federated Exact Unlearning."2023. (Our work, under review)[4]Li, Bowen, et al."FedIPR: Ownership verification for federated deep neural network models." IEEETransactions on Pattern Analysis and Machine Intelligence (2022).[PDF] 小结 •传统纯云智能系统存在用户隐私泄露风险，端云隐私计算系统需求逐渐增大•端云隐私计算系统针对大规模设备的选择-计算-聚合架构•端选择三象限及随机异步选择中的按不同业务需求的三种策略•随机异步选择中基于时空两维度的均匀端选择机制•端云隐私计算系统中模型评估范式转变和新流程•联邦学习不等于安全，所谓安全包含数据安全、过程安全两个方面，数据安全包含用户隐私数据安全和模型数据安全两部分，联邦学习更易受到投毒、后门攻击感谢观看

点击免费查看完整报告

端云协同隐私计算系统的设计和落地探索

背景及设计理念

端云隐私计算系统设计

设计理念与架构

安全挑战与防御

结论

你可能感兴趣

纪要为有道云链接：设计总院：较早研究探索低空经济，建成基于AI等协同工作平台_国君建筑韩其成团队

【财联社早知道】华为太空探索有新动作，此前曾提“太空宽带”计划，这家公司是国内少数同时掌握“卫星通信卫星导航”的企业；它的云音箱是首款通过中国银联及开源鸿蒙兼容性测试产品，公司的数字养老系统已试运行

B端能源系统建设和C端能源平台运营协同发展，拥抱能源数字化转型战略机遇

【研选】工信部顶层设计出台，人形机器人软硬件协同发展有望驶入快车道；这家公司三季报业绩大超市场预期，深度参与并受益A客户在MR端的创新，新增合同负债近5亿元表明在手订单充足

2-4 隐私计算在医疗大数据共享中的探索实践 - 包仁义

InfoQ：云原生的技术探索与落地实践 | 研究报告

通信行业2016年中期投资策略：嵌入式+流量，扛起通信行业云管端协同发展的大旗

面向典型行业的云网边端智能协同与剪裁

从端芯片到云系统的一站式AI龙头

通过综合对冲和风险管理探索RILA和VA的协同作用