您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:开箱吧!腾讯云大模型安全发布会材料 - 发现报告

开箱吧!腾讯云大模型安全发布会材料

2025-07-09腾讯淘***
AI智能总结
查看更多
开箱吧!腾讯云大模型安全发布会材料

开箱吧!腾讯云大模型安全发布会材料 LLM-WAF:大模型安全防护 云安全中心-大模型安全态势管理 LLM-WAF:大模型安全防护 分享人:王军 终结AI业务四大致命伤——算力滥用|数据泄露|API失控|合规暴雷 大模型面临的安全风险 全球各国针对大模型加速出台安全管理政策 ⚫欧盟:颁布全球首部全面监管人工智能的法规《人工智能法案》,把AI应用的风险分为4类:不可接受风险、高风险、透明风险和最低风险,其中高风险部分,要求LLM服务商提供安全审计并承担相应法律责任。 ⚫新加坡:颁布相应的安全法规草案,对AI系统的安全提出监管和要求,例如《AI系统安全指南》。⚫美国:美国联邦、美国各州及城市均出台了包含 《AI权利法案蓝图》《AI风险管理框架》等一系列AI监管法律或法案⚫日本:AI治理框架,注重人机协作场景,推动AI 伦理发展。⚫12国:《安全、创新和包容的AI首尔宣言》。 我国针对大模型安全管理政策 科学务实、划定底线、明确责任 “国内首个生成式AI安全指导性文件,《要求》给出了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等,并明确了违反社会主义核心价值观的内容、歧视性内容、商业违法违规、侵犯他人合法权益等在内的5大类31种风险;每一个大模型企业的生成式AI产品若想要“持证上岗”,需逐条核对是否符合这份文件中的要求。” “提供深度合成服务,应当遵守法律法规,尊重社会公德和伦理道德,坚持正确政治方向、舆论导向、价值取向,促进深度合成服务向上向善。具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照前款规定履行备案和变更、注销备案手续。” “坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容。” 《互联网信息服务深度合成管理规定》 《生成式人工智能服务管理暂行办法》 《生成式人工智能服务安全基本要求》 LLM-WAF大模型安全防护 •LLM-WAF为专为大语言模型设计的智能安全防护网关,提供多模型、多场景、高并发环境下的全链路防护能力•支持实时检测并拦截针对大模型的算力滥用、提示词攻击及数据泄露风险,助力企业构建可信、稳定、可持续的大模型服务生态。 算力消耗防护 •提示词注入:针对中英文预料增强训练,识别角色扮演等越狱指令和常见提示注入攻击行为•不当信息:政治、色情内容识别•敏感信息:身份证号、手机号、家庭住址等33类《个保法》明确的敏感信息内容•自定义敏感信息:支持配置自定义关键词,可配置提示词或者企业关键信息•支持自定义拦截提示:针对不同策略、风险等级配置不同提示内容 业务防护-BOT管理 通过大数据及BOT攻防实验室的安全技术运营,形成针对当前域名的AI检出模型,并根据网站流量,自动进化升级BOT检出能力,自动析出AI评估中出现异常指标的访问请求。 威胁情报 6亿IP画像, 99%国内覆盖,每日更新情报库;8亿/天查询能力3亿/天调用能力;50+多维度分类标签精准判别IP是否恶意、风险严重级别、可信度级别。 全链路检测体系 智能异常分析流量动态评估: 业务安全 体系化输出当前网站的流量恶意分布情况,快速研判处置恶意流量异常流量访问路径:快速定位查看恶意流量的目标路径以及异常技术特征点 集成天御业务安全能力,对请求进行风险值评估,通过对账号信息提取、风险评估、对注册保护、登录保护及活动防刷等特征进行精准发现。分析威胁等级和风险类型标签帮助您对账号、用户行为及环境存在的风险进行辅助分析 动态令牌 动态验证 运行环境验证;验证设备指纹和工具特征;验证用户操作行为;验证交互特征;验证是否“自动化”攻击;验证浏览器的真实性;检查浏览器的属性和环境;随机选取检测项目与数量;增加不可预测性和攻击难度。 一次性的页面动态令牌,确保执行正确的业务逻辑;Cookie令牌抵御一般自动化工具,URL令牌进行URL完整性检测。抵御网页后门、重放攻击、应用层DDoS等自动化恶意攻击行为等。 请求恶意度量化 防 访问请求流量通过威胁情报、智能统计、AI评估等开启的BOT行为管理模块进行评估打分(0-100,分数越高BOT恶意程度越大),通过分数智能评估恶意威胁程度,快速自动识别响恶意流量及其变体,实现分级分段分动作进行处置 智能评分体系 智能统计智能实时和离线分析,对当前流量进行分析,得出当前访问流量的相关会话、统计、行为特征数据; 通过对流量的分析透视后,对流量进行标注区分不同类型的Bot;具备多种场景化配置,区分不同类型的Bot; 业务防护-API安全 以大模型业务API生命周期为线索,整合WAF安全能力,实现大模型API安全防护 典型场景 在智能投顾、对话银行及开放银行API等核心业务链路中,大模型既驱动精准服务,也暴露出提示词投毒篡改指令、API套利刷单及KYC/授信数据外泄等高风险场景。LLM-WAF通过对指令语义白名单、敏感数据DLP策略、双重身份校验与速率-指纹联合限流等多维防护,实现对交易完整性、数据合规性与系统可用性的全链路保障,助力金融机构符合监管对生成式AI安全与可追溯的要求。 在智能客服、动态优惠券抢购及个性化推荐模型驱动的“全链路运营”中,黑灰产利用提示词诱导客服输出不当信息或敏感信息,影响品牌声誉,或者通过自动化脚本批量刷券、爬取价格与库存策略,直接侵蚀利润率并危及用户体验。 LLM-WAF通过内容安全校验、并发熔断、敏感字段拦截及日志留存,为零售平台构筑从交互入口到后台逻辑的闭环安全防线,确保促销玩法不被薅羊毛、经营数据不被泄露,实现营销创新与营收安全的双赢。 试用申请提醒 为帮助企业全面了解并体验LLMWAF的安全防护能力,腾讯云现已正式开启LLMWAF公测。在公测期间,符合条件的企业用户可免费体验产品的核心功能,包括模型输入输出保护、敏感数据防泄漏、恶意行为防护等。 通过此次公测,腾讯云希望帮助企业客户深入了解LLMWAF在实际应用中的优势,并通过持续优化和反馈,进一步提升产品的安全性能和易用性。 您可以扫描以下二维码进行试用申请:https://doc.weixin.qq.com/forms/AJEAIQdfAAoAUsACgbMAK8PWuTYc4RRBf 谢谢大家 云安全中心-大模型安全态势管理 大模型蓬勃发展带来新的安全风险 大模型安全管理痛点 国家网络安全通报中心多次通报大模型组件安全漏洞 大模型安全管理痛点 大模型使用泛滥 ➢大模型热度持续上升➢大模型能力在不断提升➢大模型应用场景愈加广泛➢大模型部署使用门槛不断降低➢云厂商帮助降低部署门槛➢大模型API服务发展迅速➢开源体系蓬勃发展➢安全团队可能未及时针对大模型应用体系制定管理方案 ➢如何持续发现大模型相关资产?➢如何快速了解大模型资产的网络开放状态?➢如何及时检测大模型资产的安全风险?➢如何实时监控大模型资产面临的攻击态势? ➢大模型组件存在各式漏洞➢组件配置不当触发未授权访问等风险➢风险被利用,可能导致主机失陷、模型被投毒、模型丢失、数据泄露➢训练与推理使用敏感数据,可能引发数据泄露,面临法律风险。 腾讯云云安全中心解决方案 大模型安全态势管理 大模型安全态势管理——围绕“大模型”提供资产识别、风险检测、攻击监控等能力 大模型组件风险检测 大模型网络攻击示警 组件资产识别 ➢通过网络扫描&主机安全识别组件风险。➢展示组件漏洞与配置不当风险。 ➢通过网络探测&主机安全对大模型组件进行识别。➢页面展示组件及关联资产,展示风险和网络攻击数量。➢提供资产对公网暴露的路径及原生风险。 ➢大模型组件漏洞的攻击利用行为示警。 大模型组件识别——解决“看见”的问题 ⚫网络扫描器从公网探测组件指纹。⚫主机安全agent从内部检查组件特征。⚫关联资产信息、网络攻击数量、风险数量进行展示。 ⚫资产详情可查看大模型资产面向公网暴露的路径。 ⚫网络产品关联⚫资产列表、主机进程通晒⚫资产原生风险展示:主机漏洞、高危基线风险 ⚫可关联查看资产遭受的网络攻击、大模型相关风险。 大模型组件风险检测——依托网络扫描及主机安全风险检测能力,提取大模型风险 大模型组件漏洞攻击利用示警 支持识别的组件与漏洞清单 感谢聆听