端侧隐私计算需求
数字经济在全球范围内占据主导地位,数据成为关键生产力要素,但数据垄断趋势引发问题。各国出台法律法规规范数据使用,如欧盟GDPR、美国加州消费者隐私法案等,并完善相关标准,如ISO/IEC系列标准和国内GB/T系列标准。应用场景包括终端侧、边缘侧和云端,端侧隐私计算需求日益增长。
端侧隐私计算关键技术
- 同态加密:通过数学格支持加法和乘法运算,但存在噪音累积问题,需bootstrapping技术降低噪音。
- 安全多方计算:允许多个参与方在不泄露各自数据的情况下进行计算,如百万富翁问题。
- 可信执行环境(TEE):在CPU中构建安全区域,保护程序和数据机密性与完整性,如Apple Face ID方案。
- 差分隐私:通过引入不确定性隐藏单一数据点对输出结果的贡献,如LDP(差分隐私)频数统计。
- 联邦学习:将计算放在本地进行,保护个人隐私,但需解决数据非独立同分布、通信、运行时掉线和恶意参与方等问题。
端侧隐私计算应用案例
- 端侧数据采集:如LDP频数统计,通过GRR算法加噪和置换数据,实现无偏聚合分析。
- 端云协同计算:如谷歌Gboard联邦学习,实现隐私保护的词汇推荐。
- TEE方案:如Apple Face ID,利用Secure Enclave处理人脸数据,保障用户隐私。
- 谷歌Android隐私沙盒:通过进程隔离、API控制、Topics划分、FLEDGE归因分析等技术,减少第三方SDK访问和共享用户数据,提升隐私保护。
端侧隐私计算风险与挑战
- 数据风险:包括数据采集、传输和存储风险。
- 网络风险:如DDoS攻击、注入欺诈分组攻击等。
- 模型风险:如投毒风险、隐私泄露风险、模型窃取风险等。
- 计算风险:如窃听攻击、未授权对话攻击等。
挑战包括模型精度、学习效率、激励机制、数据安全、网络安全、模型安全和计算安全等方面。