您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [阿里巴巴]:Confidential MaaS:构建可验证的推理链路数据密态流转 - 发现报告

Confidential MaaS:构建可验证的推理链路数据密态流转

信息技术 2025-08-27 阿里巴巴 Joken Hu
报告封面

Confidential MaaS:构建可验证的推理链路数据密态流转 01 背景介绍 1.MaaS(Model as a Service)服务的发展现状1.1MaaS服务模式的演进与市场格局1.2 大规模AI推理服务的技术架构特征2. 大模型推理服务中的数据隐私保护需求日益凸显2.1推理数据的多维度敏感性分析2.2 监管合规与技术标准演进2.3 现有安全方案的局限性P4P51.MaaS(Model as a Service)服务的发1.1MaaS服务模式的演进与市场格局1.2 大规模AI推理服务的技术架构特征2. 大模型推理服务中的数据隐私保护需求日2.1推理数据的多维度敏感性分析2.2 监管合规与技术标准演进2.3 现有安全方案的局限性P4P5 02 客户需求:在信任缺失的环境中寻求数据控制权02 客户需求:在信任缺失的寻求数据控制权 1.直接用户(模型调用方)的核心安全与控制诉求2. 间接用户(终端设备用户)的隐私保护要求P8P81.直接用户(模型调用方)的核心安全与控2. 间接用户(终端设备用户)的隐私保护要P8P8 03 技术需求分析 2.1运行时环境的可信验证难题:如何远程“看清”服务器内部?2.2 静态审计机制的局限性:信任的“快照”无法保障实时的安全2.1运行时环境的可信验证难题:如何远2.2 静态审计机制的局限性:信任的“快 3. 推理服务数据全生命周期端到端加密保护3. 推理服务数据全生命周期端到端加密保护P11 解决方案04 可验证安全解决方案 1.1intel TDX可信执行环境1.2 可信度量(Trusted Measurement)1.3 远程认证(Remote Attestation) 据全生命周期端到端加密保护05 推理服务数据全生命周期端到端加密保护 算场景下的端到端加密原理(验证、密钥、加密流程的原理性介绍)下的端到端加密需求1.私有数据资产加密1.1私有数据资产加密链路2. 持久化数据加密2.1存储层加密架构3. 推理数据端到端加密3.1可验证计算场景下的端到端加密原理(验证、密钥、加密流程的原理性介绍)3.2不同场景下的端到端加密需求3.3端到端加密技术方案P27P28P30 据保护06 端侧隐私数据保护 数据保护实现2.2数据安全上云2.3云与MaaS互通1.背景2. 端云协同隐私数据保护实现2.1构建用户信任2.2数据安全上云2.3云与MaaS互通P37P37 tial MaaS (CMaaS):的AI推理安全架构07 Confidential MaaS (CMaaS):构建可验证的AI推理安全架构 背景介绍背景介绍 MaaS(Model as a Service)服务的发展现状aS(Model as a Service)的发展现状 1.1 MaaS服务模式的演进与市场格局aaS服务模式的演进与市场格局 随着大型语言模型(LLM)和生成式AI技术的突破性进展,人工智能正从专门化的研究领域迅速转变为普惠性的基础能力。在这一浪潮中,模型即服务(Model as a Service, MaaS)已成为AI能力输出的主流模式,它将复杂的AI模型封装为简单易用的API接口,极大地降低了企业和开发者使用尖端技术的门槛。大型语言模型(LLM)和生成式AI技术的突破性进展,人工智能正从专门化的研究领域迅速转变为基础能力。在这一浪潮中,模型即服务(Model as a Service, MaaS)已成为AI能力输出的主流模复杂的AI模型封装为简单易用的API接口,极大地降低了企业和开发者使用尖端技术的门槛。 当前市场由几类主要参与者构成:市场由几类主要参与者构成: •模型巨头:如OpenAI、Anthropic,专注于前沿模型的研发和API服务。•云服务商:如阿里云、AWS、Azure、Google Cloud,它们凭借强大的基础设施优势,不仅提供自研模型,更构建了庞大的MaaS平台(如阿里云百炼、Amazon Bedrock),这些平台不仅是“模型超市”,集成了多家顶尖模型供用户选择,还提供了一站式的配套工具链、向量数据库、以及弹性的计算资源,成为MaaS生态的核心枢纽。•开源生态:以Hugging Face、ModelScope为代表的社区,通过开放共享模型、数据集和工具,为MaaS提供了极其丰富的选择和强大的创新活力。开源模型降低了用户进行私有化部署和微调的成本,推动了技术的快速普及和迭代。型巨头:如OpenAI、Anthropic,专注于前沿模型的研发和API服务。服务商:如阿里云、AWS、Azure、Google Cloud,它们凭借强大的基础设施优势,不仅提供自研型,更构建了庞大的MaaS平台(如阿里云百炼、Amazon Bedrock),这些平台不仅是“模型超市”,成了多家顶尖模型供用户选择,还提供了一站式的配套工具链、向量数据库、以及弹性的计算资源,为MaaS生态的核心枢纽。源生态:以Hugging Face、ModelScope为代表的社区,通过开放共享模型、数据集和工具,为aaS提供了极其丰富的选择和强大的创新活力。开源模型降低了用户进行私有化部署和微调的成本,动了技术的快速普及和迭代。 这种“模型超市”式的商业模式虽然极大地繁荣了AI应用生态,但也带来了严峻的挑战:用户的数据流向变得前所未有的复杂,隐私保护的责任边界也随之变得模糊和分散。“模型超市”式的商业模式虽然极大地繁荣了AI应用生态,但也带来了严峻的挑战:用户的数据流所未有的复杂,隐私保护的责任边界也随之变得模糊和分散。 1.2 大规模AI推理服务的技术架构特征规模AI推理服务的技术架构特征 为了应对高并发、低延迟和高可用的需求,MaaS推理服务架构往往包含大量的分布式组件。一个简化的架构通常包含以下核心组件:应对高并发、低延迟和高可用的需求,MaaS推理服务架构往往包含大量的分布式组件。一个简化常包含以下核心组件: •负载均衡器:作为流量入口,将海量用户请求分发至下游服务,确保系统的可扩展性和高可用性。•API网关:负责处理所有API请求的通用功能,如身份认证、访问鉴权、流量控制和请求路由。•推理引擎集群:这是MaaS服务的“大脑”,由大量运行在GPU、NPU等专用加速硬件上的计算节点组成,负责执行实际的模型推理任务。•后端服务:支撑推理服务的各种辅助系统,包括用于RAG(检索增强生成)的向量数据库、用于提升性能的KV Cache缓存系统、以及用于运维和审计的日志与监控系统等。载均衡器:作为流量入口,将海量用户请求分发至下游服务,确保系统的可扩展性和高可用性。PI网关:负责处理所有API请求的通用功能,如身份认证、访问鉴权、流量控制和请求路由。理引擎集群:这是MaaS服务的“大脑”,由大量运行在GPU、NPU等专用加速硬件上的计算节点组,负责执行实际的模型推理任务。端服务:支撑推理服务的各种辅助系统,包括用于RAG(检索增强生成)的向量数据库、用于提升能的KV Cache缓存系统、以及用于运维和审计的日志与监控系统等。 这些组件协同工作,在提升服务效率和扩展性的同时,也构成了一条漫长且复杂的数据处理链路。用户数据在多个计算和存储节点间流转,其中许多节点可能运行在未经验证的计算环境中,这显著增加了数据在处理过程中的隐私泄露风险敞口。组件协同工作,在提升服务效率和扩展性的同时,也构成了一条漫长且复杂的数据处理链路。用户个计算和存储节点间流转,其中许多节点可能运行在未经验证的计算环境中,这显著增加了数据在中的隐私泄露风险敞口。 大模型推理服务中的数据隐私保护需求日益凸显大模型推理服务中的数据隐私保护需求日益凸显 2.1 推理数据的多维度敏感性分析2.1 推理数据的多维度敏感性分析 随着MaaS服务渗透到金融、医疗、法律、软件和互联网等行业领域,用户输入的数据不再仅仅是日聊,而是包含了大量高价值的敏感信息。因此,数据隐私保护已从“加分项”转变为MaaS服务提供商必足的“生命线”。随着MaaS服务渗透到金融、医疗、法律、软件和互联网等行业领域,用户输入的数据不再仅仅是日常闲聊,而是包含了大量高价值的敏感信息。因此,数据隐私保护已从“加分项”转变为MaaS服务提供商必须满足的“生命线”。 MaaS服务处理的数据具有前所未有的广度和深度,其敏感性体现在多个维度:MaaS服务处理的数据具有前所未有的广度和深度,其敏感性体现在多个维度: •个人隐私信息(PII/PHI):用户在与AI助手进行心理咨询、健康问诊或财务规划时,会输入大量身份信息(PII)和受保护的健康信息(PHI)。•企业核心机密:企业用户可能利用大模型分析财务报表、起草法律合同、优化商业战略,甚至提公开的产品设计和源代码进行审查或重构。这些数据是企业的核心知识产权和商业秘密。•知识产权与创作内容:作家、研究人员和开发者使用模型进行内容创作、论文撰写和代码生成,输入和输出本身就构成了受保护的知识产权。•模型与数据资产:对于使用模型微调和RAG等服务的用户而言,其私有的标注数据集、知识库文最终生成的微调模型,是极其宝贵的数字资产,同样需要最高级别的保护。•个人隐私信息(PII/PHI):用户在与AI助手进行心理咨询、健康问诊或财务规划时,会输入大量个人身份信息(PII)和受保护的健康信息(PHI)。•企业核心机密:企业用户可能利用大模型分析财务报表、起草法律合同、优化商业战略,甚至提交未公开的产品设计和源代码进行审查或重构。这些数据是企业的核心知识产权和商业秘密。•知识产权与创作内容:作家、研究人员和开发者使用模型进行内容创作、论文撰写和代码生成,这些输入和输出本身就构成了受保护的知识产权。•模型与数据资产:对于使用模型微调和RAG等服务的用户而言,其私有的标注数据集、知识库文档和最终生成的微调模型,是极其宝贵的数字资产,同样需要最高级别的保护。 2.2 监管合规与技术标准演进2.2 监管合规与技术标准演进 全球范围内的监管机构正在以前所未有的速度收紧数据隐私法规,并开始专门针对AI技术制定新的规全球范围内的监管机构正在以前所未有的速度收紧数据隐私法规,并开始专门针对AI技术制定新的规范。 •现有法规的延伸适用:欧盟的《通用数据保护条例》(GDPR)、美国的《加州消费者隐私(CCPA/CPRA)、中国的《个人信息保护法》(PIPL)等法规,都对数据的收集、处理和跨境传出了严格要求,MaaS服务作为新型数据处理平台,必须遵守这些规定。•现有法规的延伸适用:欧盟的《通用数据保护条例》(GDPR)、美国的《加州消费者隐私法》(CCPA/CPRA)、中国的《个人信息保护法》(PIPL)等法规,都对数据的收集、处理和跨境传输提出了严格要求,MaaS服务作为新型数据处理平台,必须遵守这些规定。 •新兴的AI专项法规:欧盟的《人工智能法案》(AI Act)等新兴法规,更是将AI系统的透明度、释性和安全性置于核心位置,要求AI系统提供全方位的风险管理和数据治理措施。•新兴的AI专项法规:欧盟的《人工智能法案》(AI Act)等新兴法规,更是将AI系统的透明度、可解释性和安全性置于核心位置,要求AI系统提供全方位的风险管理和数据治理措施。 合规压力迫使MaaS平台必须提供可审计、可验证的数据安全保障,向监管机构和客户证明其具备护数据全生命周期的能力。合规压力迫使MaaS平台必须提供可审计、可验证的数据安全保障,向监管机构和客户证明其具备了保护数据全生命周期的能力。 2.3 现有安全方案的局限性现有安全方案的局限性 尽管MaaS服务商已经部署了成熟的传统安全方案,但它们在应对大模型推理场景下的新型威胁时,存在明显的“安全盲点”:管MaaS服务商已经部署了成熟的传统安全方案,但它们在应对大模型推理场景下的新型威胁时,存 •传输中加密(Encryption in Transit):通过TLS/SSL协议保护数据在客户端与服务器之间的传输通道,但这无法防止数据在到达服务器后被解密处理时的泄露。传输中加密(Encr