行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

面向人工智能系统的体系化安全检测与风险评估方法研究

信息技术 2026-06-26 中国工业互联网研究院王泰华

1.1 研究背景及意义
人工智能加速落地但安全风险凸显，成为制约产业发展的短板。典型事件包括Anthropic模型因安全隐患被紧急叫停，OpenClaw智能体因提示词注入等漏洞被禁用，以及Skill模块中54.7%存在安全缺陷。全球主要经济体将AI上升为国家战略，强化政策部署，推动AI安全治理。

1.2 主要研究内容
研究体系化安全检测与风险评估方法，实现从检测到评估、修复决策的全链条能力，包括多层级安全检测（7层漏洞分类）、多环节风险评估、跨层级安全量化、全生命周期风险定级和跨层传导防御成本效益分析，旨在打造安全AI系统。

2.1 人工智能安全缺陷及漏洞分类体系
2.1.1 漏洞分类：涵盖权限提升攻击、指令遗忘攻击、上下文长度攻击等7类。
2.1.2 检测工具：提示词注入风险居首，技术门槛低、危害大，头部厂商均重视防御。
2.1.3 工业智能体Skills安全测评：发现供应链风险、权限过度配置、代码漏洞、过度授权、提示词注入隐患和准入审查不足等问题。

2.2 人工智能系统多环节安全风险评估框架
2.2.1 框架设计：拆解技术体系架构和全生命周期，评估宏观安全维度（基础架构、数据、模型算法、应用）下的具体风险。
2.2.2 评估方法：结合国家标准、政策规范、行业标准等多维度标准，实现技术领域和生命周期阶段的风险评估。

2.3 人工智能系统跨层级动态安全量化模型
2.3.1 模型构建：解决风险跨层耦合传播的痛点，缺乏统一量化标准导致资源配置低效。
2.3.2 量化闭环：通过三大模型形成量化闭环，案例验证CVE-2024-0132（英伟达高危漏洞）。
2.3.3 安全左移：威胁在层间快速扩散，需动态量化模型应对。

主要研究成果
构建全链条Skill安全治理体系，提出多层级检测、多环节评估、跨层级量化方法，形成AI系统安全风险闭环管理，为AI安全防护提供全生命周期解决方案。

安全研究所钮艳 1.1研究背景及意义人工智能加速落地，安全风险日益凸显，已成为制约产业健康发展的突出短板 “龙虾”存在安全隐患前沿模型被紧急叫停 Skill安全缺陷突出 2026年6月，Anthropic发布的旗舰模型Fable 5和Mythos 5上线仅三日，就因存在严重安全隐患，被美商务部以国家安全为由实施紧急出口管制，最终被迫全面暂停相关服务。 Skill（技能）是人工智能执行特定任务的模块化单元，在OpenClaw、Hermes等智能体中广泛应用。经测评，54.7%存在安全缺陷，可能引发网络攻击、数据泄露和系统瘫痪。曾爆火的OpenClaw (“龙虾”)智能体，因存在提示词注入、远程代码执行、恶意插件投毒等严重安全隐患，工信部、国家互联网应急中心等部门发布安全提醒，部分企业明令禁用。 1.1研究背景及意义全球主要经济体强化人工智能领域政策部署，纷纷将人工智能上升为国家战略，抢占科技竞争和未来发展制高点人工智能安全已从 1.2主要研究内容研究体系化安全检测与风险评估方法，实现从检测到评估、再到修复量化决策的全链条能力多层级安全检测7层漏洞分类体系多环节风险评估解决跨层级安全量化解决全生命周期·风险量化定级跨层传导·防御成本效益分析打造人工智能系统的 2.1.1人工智能安全缺陷及漏洞分类体系 2.1.2人工智能安全漏洞风险检测工具 2.权限提升攻击任命AI为“无限制助手”并发起提权请求 7.指令遗忘攻击 8.上下文长度攻击利用冗长无关内容稀释和掩盖恶意指令通过新指令覆盖让模型忽略原有安全约束 2.1.2人工智能安全漏洞风险检测工具 n提示词注入居人工智能安全风险首位 n技术门槛低、危害性大：攻击者仅需输入精心设计的自然语言即可绕过安全防护，导致越权访问、敏感信息泄露、恶意内容生成等严重后果。 n产业界高度重视：OpenAI、谷歌、Anthropic等头部厂商均将提示词注入防御列为安全建设的核心。 2.1.2人工智能安全漏洞风险检测工具 2.1.3工业智能体Skills安全测评供应链安全风险权限过度配置内容安全风险安全能力缺陷：大量Skills面临提示词注入、代码安全等安全风险，暴露出当前Skills生态整体安全基线较低的问题。过多权限申请：多数Skills会申请过多权限，使得Skills能够以最高权限实施持久化控制，对用户构成凭证窃取、系统破坏风险。底层代码漏洞：Skills底层代码漏洞频发，高危漏洞突出，易造成后门植入、网络攻击等安全威胁。过度授权和信任模型缺陷：部分Skills框架未遵守最小授权原则，Skills脚本默认拥有当前用户全部系统权限，可进行本地文件读写、系统命令执行及全网访问；同时，该框架“一次授权、持续生效”的信任模型存在安全隐患。提示词注入隐患：伪造系统规则、冒充管理权限等恶意指令大多隐藏在常用文档中不易发现，可造成越权操控AI、窃取系统敏感信息和文件越界访问等问题，威胁用户系统安全。准入审查机制不足：官方Skills市场缺少严格身份核验机制和Skills前置审计，单账号即可批量投递数百个恶意包实施“供应链投毒” 构建全链条Skill安全治理体系，筑牢智能体安全防线 2.1.4人工智能安全漏洞库与验证能力 2.2.1人工智能系统多环节安全风险评估框架国家标准政策规范行业标准团体标准《人工智能风险管理能力评估》《人工智能安全治理系统风险管理能力要求》（在研）《网络安全技术人工智能计算平台安全框架》《网络安全技术人工智能生成合成内容标识方法》《网络安全技术生成式人工智能服务安全基本要求》…… 《生成式人工智能服务管理暂行办法》《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《新一代人工智能伦理规范》《科技伦理审查办法（试行）》…… 《人工智能通用大模型合规管理体系指南》《生成式人工智能数据应用合规指南》《生成式人工智能个人信息保护技术要求》《生成式人工智能模型训练合规技术规范》…… 《电信和互联网人工智能数据安全评估方法》（在研）《信息通信行业人工智能算法安全评估指南》（在研）《电信网和互联网大规模预训练模型安全评测指标和方法》（在研）《电信网和互联网安全大模型测评指标及方法网络安全领域》（在研）《生成式人工智能网络安全产品应用技术要求和评估方法》（在研）…… 2.2.2人工智能系统多环节安全风险评估框架对AI系统技术体系架构进行拆解，评估不同技术领域安全风险。对AI系统从设计到运维全生命周期进行拆分，评估各阶段安全风险。 2.2.3人工智能系统多环节安全风险评估框架 2.2.4人工智能系统多环节安全风险评估框架宏观安全维度，包括基础架构安全、数据安全、模型算法安全、应用安全对一级指标具体化，对应具体的安全风险 2.2.5人工智能系统多环节安全风险评估框架 2.3.1人工智能系统跨层级动态安全量化模型 2.3.1人工智能系统跨层级动态安全量化模型 Ø痛点：风险跨层耦合，传播路径复杂Ø挑战：缺乏统一量化标准，引发资源配置低效 2.3.2三大模型形成量化闭环 2.3.3案例验证：CVE-2024-0132（英伟达高危漏洞）安全左移威胁在层间快速扩散 3.主要研究成果

点击免费查看完整报告

面向人工智能系统的体系化安全检测与风险评估方法研究

你可能感兴趣

人工智能与国际安全研究动态第8期：国际智库及媒体对ChatGPT领域动向的评估

人工智能与国际安全研究动态第8期：国际智库及媒体对ChatGPT领域动向的评估

评估面向政策的研究影响的最佳做法方法讲习班：对国际农业研究磋商小组的总结和建议

2024基于可靠性原理的海上光伏系统规范标准研究与安全风险管控能力研究报告

人工智能风险治理报告（2024年）-构建面向产业的人工智能安全治理实践方案

2026年 Tenable 云与人工智能安全风险评估报告

光伏系统关键设备的老化与快速评估方法

2026年人工智能时代的安全访问：构建面向人类与AI的统一访问策略研究报告

AI2024前沿人工智能安全的最佳实践-面向中国机构的研发实践案例与政策制定指南

用于全球导航卫星系统电子干扰检测与分类的人工智能模型