您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:大模型场景下生成式AI多模态内容鉴伪实践分享 - 发现报告

大模型场景下生成式AI多模态内容鉴伪实践分享

2025-12-29腾讯杨***
大模型场景下生成式AI多模态内容鉴伪实践分享

大模型场景下生成式AI多模态内容鉴伪实践分享 应对金融安全新挑战,构建智能防御新体系 2025.12.21尚朋帅腾讯金融云 金融“AI原生”新时代,“伴生”新的安全挑战 AI多模态内容伪造成金融安全新挑战 金融行业AI技术实践战略矩阵 利用生成式AI进行多模态伪造的攻击原理分析 从单点突破到协同作战,攻击已从单一模态伪造,演进为高可信度的多模态证据链 高技术性 生成式AI技术使得伪造内容在纹理细节、光影效果上极具逼真感。深度伪造技术不断迭代,使得合成图像和视频难以通过肉眼分辨,技术门槛大幅降低。 高隐蔽性 伪造特征深藏于数据分布之中,导致传统基于规则或简单特征提取的检测方法逐渐失效。攻击者利用对抗样本技术,进一步规避现有安全防御系统的检测。 强危害性 针对金融业务流程的定制化攻击呈现出新型金融欺诈特征。一旦攻击成功,可能导致资金被盗、身份冒用等严重后果,给金融机构和用户造成巨大经济损失。 生成式AI多模态鉴伪的关键难点 02攻击技术的自适应演化 01内容的超高仿真性 扩散模型、多模态协同等技术的应用,使生成式AI已实现从像素级伪造到语义级伪造的跨越 GAN为代表的模型技术,“检测技术发布→攻击技术适配→新伪造技术涌现”的循环,防御长期被动。 03现有检测范的局限性 缺乏跨模态关联分析能力,难以应对协同化伪造攻击。基于单一生物特征检测的方法(如动作指令)理论上可被动态生成技术破解。 04支撑鉴伪模型训练的资源挑战 高质量伪造样本与算力稀缺,检测模型训练所需的算力资源及顶尖AI人才不足。 现有防御能力的系统性困境 事中(In-Event) 事后(Post-Event) 事前(Pre-Event) 进化与溯源困境 检测与响应困境 感知与预见困境 新型威胁情报缺失,缺乏对多模态组合攻击(如深度伪造人脸耦合AI合成语音)的推演能力与攻击路径模拟能力。 由检测覆盖率之困、实时研判与决策之困(多模态、跨渠道)、精准拦截与用户体验之困(难以在“果断拦截”与“审慎放行”间找到平衡) 模型升级的速度难以匹配黑产攻击方法的迭代的速度;攻击溯源与取证困难(匿名性强,技术链条复杂),无法形成有效法律威慑。 生成式AI多模态内容安全防御体系,从静态布防到动态免疫 腾讯AI多模态防御实践:内容安全审核,防护大模型安全应用 基于多模态AI模型+20年样本沉淀+策略调优平台,有效识别违法违规内容以及AI生成内容 腾讯AI多模态防御实践:AI人脸防护 首次将语义大模型LLM融合进人脸模型进行多模态训练,打破传统机械式图片分类,让模型像人类一样思考 从语义层面理解图片,可认知攻击图片与真人的差异,识别更准确 8✓AI人脸防护盾单个模型攻击识出率>传统多个模型叠加✓通过对真人特征的认知,提升AI攻击识出能力✓通过对攻击介质的理解,解决物理攻击badcase 腾讯AI多模态防御实践:多因子AI人脸防护,设备安全前置 构建涵盖“设备风控+活体检测+AI攻击防护+人脸比对”体系化的人脸防护能力 某头部大行最佳实践案例 构建纵深防御、实时响应的安全管控体系,实现从“单一模态”到“多模态关联”体系升级 线上身份认证中的多模态鉴伪 •事前:应用风险动态决策能力(设备、业务、行为),平衡用户体验与安全。•事中:使用多模态交叉鉴伪能力,精准识别深伪攻击。•事后:通过数字运营持续监测攻击风险与自适应进化。(周均2次模型速代) 远程信贷审核中的协同防御 •应 用AIGC鉴 伪 能力,确 保 交互 对 象 真 实(视频换脸、语音合成等)。•应用内容智能质检能力,提升合规与效率(黄、恐、政以及合规要求等)。•应用多模态交叉校验能力,对可疑风险融合视频内容及音频语义进行交叉模态时序及行为一致性综合判断。