您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[百度]:千帆大模型平台安全白皮书 - 发现报告

千帆大模型平台安全白皮书

信息技术2025-09-10百度邵***
AI智能总结
查看更多
千帆大模型平台安全白皮书

目 录 01概述1 202大模型平台主要安全挑战 403千帆平台安全保障体系 3.1. 安全挑战应对策略3.2. 千帆平台安全保障框架 504千帆平台安全保障能力 4.1. 千帆平台安全4.2. 千帆模型安全4.3. 千帆数据安全4.4. 千帆内容安全4.5. 千帆安全运营4.6. 千帆安全合规 1305千帆平台安全最佳实践 5.1. 基于混合云网络通过客户内网调用千帆大模型 06总结和展望14 01概 述 百度智能云千帆大模型平台(以下简称“千帆平台”)是企业级一站式大模型与AI原生应用开发及服务平台,不仅提供了包括文心一言系列大模型和主流第三方开源大模型,还提供了各种AI原生应用及服务开发工具链,完备的流程助力各行业企业级云原生AI应用需求落地。 面向不同的企业AI能力需求,千帆平台提供不同的功能服务。例如,在线教育、智能营销等应用场景,可在千帆平台一站式体验及构建行业解决方案并在业务端集成,解决大模型应用落地最后一公里问题;细分领域如电销场景的商品介绍、推广文章等需要针对特定领域数据集进行学习,可在千帆平台使用模型精调功能,快速生成行业场景定制模型服务,满足用户特定需求。 随 着 大 模 型 从 实 验 室 走 向 产 业 核 心 场 景 , 平 台 化 部 署 已 成 为 企 业 集 成 A I 能 力 的核心载体。大模型平台整合模型托管、API服务、微调工具、应用组件生态等能力,平台的安全漏洞不仅会导致模型失效,更可能引发系统性数据泄露与业务崩塌。所以,后续内容将以风险为纲、以技术为轴,逐章解构大模型平台面临的安全挑战与应对措施,为信赖百度的用户更加深入了解千帆大模型平台的安全性,与用户一同构建一个安全、稳定且可信赖的大模型生态。 02大模型平台主要安全挑战 平台安全挑战 大模型平台安全稳定运行是上层模型服务的基础,是确保模型应用效果和服务质量的重要保障。大模型平台作为模型应用的核心基础设施,其安全稳定运行直接关系到上层模型服务的性能和可靠性。然而,在大模型平台的设计、开发过程中,为了追求快速部署和便捷使用,可能会忽视基础安全配置。这种忽视可能导致平台存在安全缺陷,给攻击者留下可乘之机。例如,平台可能存在未授权访问的风险,使得攻击者能够轻松获取平台内部数据和模型信息。大模型平台上会承载模型服务、数据管理、模型管理等多种功能。这些功能相互关联、相互依存,共同构成了一个完整的模型应用生态。然而,一旦平台出现安全漏洞,将会导致模型泄露、数据泄露、服务中断等安全事件。这些事件不仅会对平台本身造成严重影响,还会给用户带来难以估量的损失。 大模型安全挑战 基础模型自身的安全性问题。在当下的人工智能领域,大模型数量呈现出爆发式增长,模型厂商分布广泛,覆盖全球多个国家和地区,大模型呈现出百花齐放的态势。大模型平台通常会预置多种开源及闭源大模型,也允许用户上传自己的大模型,为用户提供丰富灵活的模型服务。但大模型平台在给用户带来灵活便利的同时,也可能引入安全风险。由于不同的模型厂商可能采用不同的评估指标和测试方法,缺少统一标准,导致模型性能、安全性难以进行客观、准确的比较,也不可避免地出现良莠不齐的问题,大模型也有可能被恶意植入后门、语料投毒等安全问题。一旦开发者基于该模型进行应用开发,并对公众提供服务时,可能引发数据泄露、生成有害内容等安全隐患。 精调模型的防泄漏问题。用户使用数据集对基础模型精调,生成行业或垂类模型。模型训练中使用了客户大量的私域数据及算力资源,其数据价值和训练成本较高。精调模型在存储和传输过程中,可能存在泄露、被窃取等安全隐患。大模型平台或依赖的公有云其他的存储系统出现安全漏洞,并且模型本身未采用数据加密等安全措施的情况下,精调模型有可能被攻击者窃取、运行,造成模型及数据泄露。同时,精调模型在不同系统、平台间传输时,若安全措施未到位,攻击者可以在数据传输的链路中,通过中间人攻击等手段,截获并篡改传输数据,获取精调模型的完整内容。 数据安全挑战 用户在使用大模型平台的过程中,会将私域知识库、数据集、企业内部文档甚至个人信息等重要及敏感数据上传至大模型平台。这些数据的目的是为了进行模型训练、本地检索增强等操作,从而进一步提升模型效果和使用体验。无论是私域知识库中的专业数据,还是企业内部文档中的敏感信息,对于用户及其组织来说都具有极高的价值。 同时,大模型平台为了提升用户体验和效率,为用户提供了完善的数据飞轮功能。这一功能可以记录模型推理服务的输入、输出结果,为用户提供了一种便捷的方式来实现推理日志回流,支撑进一步做日志分析挖掘并提升数据集质量。用户可以通过这些记录,更加高效地优化模型,提高数据利用率。 然而,这些数据在收集、存储、使用、传输、删除的数据生命周期的各个阶段,都面临着潜在的安全风险。如果没有采取足够的安全保护措施,攻击者可能会截获、篡改这些数据,从而给用户及其组织带来严重的安全问题。 AIGC 的内容合规挑战 大模型在实现高效内容生成的同时,也面临着诸多内容合规风险,若缺乏有效监管和引导,可能对社会秩序和公共安全造成不良影响。基础大模型的训练语料采集中,互联网上的数据通常会作为来源之一,如果模型厂商在语料采集、数据预处理、模型训练等各环节,未进行语料过滤、安全对齐等合规内容引导,将可能导致大模型生成内容存在违反社会主义核心价值观、包含歧视性内容等安全风险。如生成内容可能包含裸露、性暗示、不雅言辞等不适宜公开传播的内容。这种内容可能在社交媒体、聊天应用、新闻评论等领域出现,可能冒犯人们的道德观念和价值观,对社会道德、个人尊严和文化价值产生负面影响,可能引发道德争议、社会不安以及对技术应用的担忧。 03千帆平台安全保障体系 3.1. 安全挑战应对策略 大模型平台面临的主要安全挑战涉及多个层面,包括数据安全、模型安全、应用安全等等,需要逐个拆解、分析并采取针对性的解决措施。为了保障大模型平台的安全性和稳定性,大模型平台厂商需要提供全面的安全能力和安全保障措施,而用户也需要正确的使用安全功能和配置安全策略,才能最有效的防范安全事件的发生。 针对大模型平台的安全挑战,以下将详细阐述百度智能云千帆平台的整体安全保障框架,以及安全最佳实践,帮助用户更加深入地了解千帆平台的安全机制和功能,以便更加合理、安全地使用大模型平台。 3.2. 千帆平台安全保障框架 千帆平台安全保障体系是一个复杂而精细的系统工程。在这个体系中,百度智能云千帆大模型平台的安全体系严格遵从国家相关的法律法规,致力于为用户提供一个安全、可靠的环境。 其安全框架的构建,涵盖了安全运营、安全合规、安全技术及管理措施等多个方面。这些措施从基础设施、网络、应用、数据、模型、内容等多个层面进行综合建设,确保了平台在各个方面的安全性。为了进一步提升用户的安全体验,千帆平台还提供了丰富的最佳实践配置案例。这些案例旨在帮助用户更加合理地配置安全策略,充分利用平台提供的安全功能。通过大模型平台和用户的共同努力,可以共同打造一个坚固的“安全屋”,有效降低大模型平台的安全风险,确保平台的稳定运行和用户数据的安全。然而,安全挑战总是伴随着技术的发展而不断演变。因此,千帆平台的安全防护体系也需要持续演进,以应对未来可能出现的新安全挑战。在未来,随着大模型技术的不断发展,千帆平台将不断提升自身的安全防护能力,为用户提供更加全面、可靠的安全保障。 04千帆平台安全保障能力 4.1. 千帆平台安全 千 帆 平 台 依 托 于 百 度 智 能 云 建 设 , 得 益 于 百 度 智 能 云 在 基 础 设 施 、 网 络 安 全 与 应 用 层 防 护 方 面 构 建的全栈式安全体系,平台在数据保护、访问控制、威胁检测及合规治理等方面具备行业领先的能力。百 度 智 能 云 通 过 虚 拟 化 隔 离 、 访 问 控 制 、 云 原 生 安 全 防 护 、 入 侵 检 测 和 持 续 风 险 管 理 机 制 , 为 千 帆大模型的稳定运行与数据安全提供了坚实保障,有效支撑大模型全生命周期中的安全保障。 基 础 设 施 安 全 在系统安全方面,千帆平台全面落实隔离机制、最小权限原则、漏洞管理和系统基线加固等策略,确保从物理层到虚拟化层的安全。在主机与虚拟化资源层,平台默认集成主机入侵检测系统(HIDS)等安全技术,能够实时感知潜在异常行为和恶意入侵活动,实现对威胁的快速发现、精准定位与高效处置。在容器与云原生层面,平台通过镜像安全扫描、容器运行时防护、KUBERNETES安全策略及准入控制等多重手段,有效防御供应链攻击、容器逃逸和横向渗透等高风险威胁,全面保障云原生环境的运行安全。 网 络 安 全 在网络安全方面,千帆平台结合云平台架构特性与行业最佳实践,构建了科学合理的多层次网络安全防护体系。通过划分虚拟私有云(VPC)、设置子网分区、配置网络访问控制列表(ACL)与安全组,平台实现了用户与公网、用户之间以及用户与平台之间的网络层隔离,最大限度降低横向渗透和未授权访问风险。平台还融合云原生安全能力,采用服务网格、微服务通信加密等技术手段,增强大模型服务之间的边界隔离,全面保障用户数据传输的私密性与完整性。此外,平台默认启用云上DDOS防护能力,所有管理接口均通过 API 安全网关接入,有效构建弹性抗攻击能力,为用户提供稳定、可靠的网络运行环境。 应 用 安 全 在身份与权限认证方面,千帆平台依托云上身份认证与访问管理服务(IAM),遵循最小权限原则,精细化设计平台用户及 API 权限控制策略,从源头防止越权访问和敏感资源泄露。同时,千帆平台还提供了更加细粒度的访问控制策略,通过API-KEY的调用方式,用户可自定义各资源的读写权限,实现各个模型、AGENT应用、知识库的细粒度权限配置。 为确保应用系统的安全性与可靠性,平台严格贯彻安全开发生命周期(SDL),在需求分析、架构设计、开发、测试与部署各阶段系统性引入安全控制措施,将安全能力深度融入 DEVOPS 流程,构建覆盖安 全 编码、静态代码扫描、动态行为测试与渗透验证的全链路安全保障体系。同时,在系统上线后,平台在生产环境部署多层次的安全防御机制,包括 WEB 应用防火墙(WAF)、安全沙箱等关键组件,有效抵御常见 WEB 攻击与未知威胁,全面提升业务的运行安全性与稳定性。 4.2. 千帆模型安全 千帆平台提供了预置模型调用、用户模型上传、模型训练等多种模型服务能力。千帆平台通过大模型测 评 、 安 全 围 栏 、 网 络 隔 离 等 方 式 , 建 立 模 型 安 全 基 线 , 降 低 敏 感 信 息 泄 露 、 恶 意 内 容 生 成 等 安 全隐 患 。 同时,针对用户精调后的模型,千帆平台采用静态模型加密、运行时模型防窃取等安全措施,保障精调模型的安全性。 4 . 2 .1 . 模 型 安 全 基 线 模型安全基线是千帆平台对大模型的基本安全要求,保障用户在大模型平台使用过程中不会出现重大的内容安全、数据安全风险,使用户可以放心的调用平台预置模型。千帆平台提供了百度自有模型、国内外闭源及开源模型供用户选择,模型广场提供的模型,大部分完成了中国网信办的大模型备案,模型已具备内生安全能力。对于未备案的平台预置第三方模型,百度智能云安全合规团队,建立了大模型安全评估基线要求,由百度安全团队参考《生成式人工智能服务安全基本要求》,对模型的安全性展开测评,验证其生成的内容无严重内容安全风险后,方可上线至大模型平台。 对于大模型运行时的基本安全保障,千帆平台通过网络安全策略,将模型推理服务运行在独立的隔离环境。同时,配合安全监测能力,能够防止模型运行时主动连接互联网,进而避免了模型运行时,由于大模型特定恶意指令导致的数据外发、用户数据泄露风险。 4 . 2 . 2 . 模 型 加 密 保 护 千帆平台对于闭源模型及用户训练后的静态模型会采用数据加密保护措施,模型只能在授权环境中解密加载。模型服务初始化时会通过FUSE透明加解