腾讯云安全副总经理 解决方案 网络攻防的GPT时刻 Claude Mythos是网络安全攻防的GPT时刻 从只能发现漏洞到发现、利用漏洞闭环 可实现复杂链式漏洞利用,单提示词完成攻击全流程 >99%0day未修复比例 人工与模型评估一致性 AI已从「辅助发现」迈向「自主挖掘+验证+复杂利用链攻击」的新阶段 AI重塑攻防格局-攻防失衡的四个维度 漏洞集中爆发 攻击效率提高 数月→数小时 防守方疲于应付 •漏洞集中爆发,基础软件多年潜藏的漏洞被发现•打补丁的速度低于漏洞发现速度 根据CISA KEV(已知被利用漏洞)数据库最新趋势显示,从漏洞披露到被实际利用时间差已经缩短到小时级 防守成本增加+ $5.3m/年 攻击门槛降低 普通人可以进行复杂攻击 核心组件潜藏多年漏洞被大量发现,安全运营体系存在阶段性强过载风险 通过自然语言交互即可生成复杂攻击脚本,网络攻击不再是高门槛任务 防御方传统SAST发现漏洞的能力,已无法应对AI驱动的漏洞挖掘和利用 传统代码安全分析的挑战与趋势 传统SAST工作流程(扫描速度快,结果稳定) 代码分析语法解析,生成AST流程分析,构建CFG数据追踪,构建DFG 规则匹配 结果输出 结果去重风险定级安全报告 污点追踪规则引擎匹配 发展趋势 主要挑战 LLM语义理解—理解代码意图和上下文,降低误报AI Agent自主推理—多轮推理发现逻辑漏洞知识自动进化—威胁情报驱动,免规则维护发现-验证-修复一体化—自动PoC验证+补丁生成 漏报盲区大—无法发现逻辑漏洞、难以识别复杂跨模块数据流规则维护成本高—依赖专家手写规则,新漏洞模式响应慢止步于发现,缺少闭环—只输出告警,不具备验证可利用性和生成修复方案的能力误报率高—缺乏语义理解,容易误判,开发信任度低 从传统SAST工具到AI Code Security AI驱动的代码安全技术趋势 AnthropicClaude Code Security OpenAICodex Security 长上下文语义词理解+对抗性验证 自我证伪机制:先发现漏洞再主动推翻自己,最创新的误报过滤设计,误报率降低91% 端到端最完整:从威胁建模到自动修复到提交PR,全自动闭环沙箱PoC验证:内置隔离沙箱执行PoC,噪声减少84%自动威胁建模(含信任边界映射+ Criticality Calibration严重性校准)基于Git Commit分析定位漏洞引入点和责任人 真实0 day成果:发现500+真实0 day,Fuzz数百万CPU小时未触发的漏洞在数小时内被发现 CI/CD原生集成(GitHub Actions + /security-review命令) 企业级Dashboard(置信度评分+ approve/reject工作流) CodeBuddySecurity的设计思路 给出的是"可能性"报告 AI不知道重点看什么 结果不稳定 幻觉攻击链 LLM推理有固有的随机性,每次结果集都略有不同。 识别这段代码看起来危险,无法回答能不能被打穿。 LLM的注意力是有限的,扫描越均匀=每个点的判断越浅。 AI会虚构上下文,"编"出根本不存在的漏洞。 从架构层面消除“确认偏差”,对抗性审查用全新Agent +零共享上下文+反向立场prompt(默认假设“这是误报,请证伪”) 先建模:识别语言/安全域/威胁模型,构建项目威胁全景 先生成:基于漏洞自动产出PoC脚本与运行环境。 这不是简单的"扫描+报告",而是构建了一条自我增强飞轮: 再实跑:在Docker沙箱内编译执行,把结果落盘成证据。 再溯源:Git历史提取已知漏洞模块及其攻击面。 AI发现→AI验证→AI把验证规则沉淀成SAST规则 后裁定:结论必须和证据对得上。 证据链对抗幻觉,斩断偏差传递链 下次扫描更多同类型漏洞,SAST保证基线结果 让AI把宝贵的算力精准投入到高风险模块,避免全量盲扫 端到端完整方案,环环验证。不仅提出问题,同时解决问题 CodeBuddySecurity技术方案Xcheck+ AI深度安全扫描的Hybrid Code Security方案 核心特点 🀀覆盖流程全:覆盖从漏洞发现->评估->验证->修复->审核环节。 🀀吸收优秀理念:引入威胁建模、Commit提取、对抗性审查、沙箱验证流程。 ⭐威胁建模:通过分析目录结构、识别关键资产、生成威胁模型、导入安全知识库,指导漏洞发现和定级。 ⭐双引擎并扫:AI+Xcheck保障扫描漏洞更全面。 ⭐对抗性审查:通过低价值发现过滤、验证漏洞证据、攻击路径分析、自我证伪,识别出真实的漏洞。 ⭐动静结合验证:通过验证的规则反哺给Xcheck形成规则积累,提升检出能力。 CodeBuddySecurity扫描流水线Xcheck+ AI深度安全扫描的Hybrid Code Security方案 核心特点 威胁建模驱动 通过项目分析(架构/语言/安全域识别)、威胁情报分析(Commit/GHSA漏洞模式提取、审计绕过角度)、攻击面分析(代码复杂度、高风险决策)三位一体,指导后续漏洞发现与精准定级。 可扩展的引擎并扫 Xcheck静态分析+ AI审计等引擎并行扫描,配合SHA256指纹聚类与DB漏洞两阶段去重,保障检出更全面、结果更干净。 CodeBuddy多模型接入框架 强推理模型负责审计、强代码模型负责PoC与补丁。 已挖掘多个知名开源0day漏洞 CodeBuddySecurity实战案例已在多个知名开源项目中挖掘出0day漏洞 案例1:未授权远程SQL注入 LiteLLM是AI时代最火的开源项目之一,BerriAI团队维护,GitHub 48k+ stars。它是数百万LLM应用的统一API网关——OpenAI / Anthropic / Google / Azure等所有厂商的API Key都在这里集中管理。打穿一个LiteLLMProxy,就拿到了它代理的所有LLM厂商凭证。 定位过程 漏洞成因 🀀为什么这个漏洞难发现: LiteLLMProxy校验API Key时,主路径走Prisma ORM——参数化查询,安全。但PostgreSQL偶尔会抛出一个叫"cached plan must not change result type"的错误,触发一条回退路径。这条回退路径不用ORM,而是手写SQL拼接: ▸漏洞藏在仅占代码量0.01%的异常路径中。▸在主分支上横跨22个版本无人发现(核心团队+社区数千人)。▸所有传统SAST工具只扫主路径,直接放过。 🐀我们工具的差异化能力 不是"更聪明的扫描器",而是"自动构造审计任务"的智能体 更关键的是_hash_token_if_needed的逻辑,不以sk-开头的输入,hash函数根本不处理,原样返回: 🐀关键设计:Attack-Surface节点 专找"暗角"——把人类和工具都忽略的边缘路径,自动转化为可验证的审计任务。 ▪识别不对称路径—发现ORM安全路径与raw query异常路径对同一输入的处理不一致▪生成高质量审计引导—不是直接给结论,而是给出"在哪看、看什么、怎么比较"▪红队对抗验证—自动尝试反驳(上游是否消毒?路径是否可达?),三轮失败才确认 案例2:未授权远程拒绝服务 Suricata是全球部署最广的开源IDS/IPS之一,企业网络边界、电信运营商、政府机构都在用。维护团队OISF是行业顶尖安全开发组织。 漏洞成因 定位过程 DCERPC协议支持把大数据包分片传输——首片标记FIRST_FRAG、末片标记LAST_FRAG、中间分片不带这两个标志。Suricata的DCERPC解析器收到分片时,会创建一个transaction对象,把后续片段持续追加到缓冲区,直到收到LAST_FRAG才标记事务完成、回收内存。问题出在这个"直到"上。代码用req_done字段判断事务是否完成: 🀀为什么这个漏洞难发现 单独看每个设计都没问题—三个独立的设计选择叠加才致命: req_done == false做匹配条件req_done只在收到LAST_FRAG时置true引擎层依赖req_done触发内存回收 🐀我们工具的双源命中机制 协议解析器历史上多次修过buffer/资源类问题 DCERPC是远程网络可达的状态机,且持续扩展缓冲区 两者交叉→生成精准审计引导: "进入DCERPC模块,沿事务对象生命周期检查创建→追加→完成标记→释放之间是否存在攻击者可控的不闭合状态。" 找"致命组合"——用历史信号×结构信号交叉定位,把跨层设计缺陷转化为可验证的审计任务。 案例3:未授权远程拒绝服务 React是全球前端开发的事实标准。React Server Components是Vercel/Next.js主推的架构方向。 定位过程:为什么这个漏洞难发现 ■漏洞就1行代码—BigInt(value.slice(2)),无任何危险函数模式■React团队刚修过同类问题—CVE-2025-55184明确公告"修了反序列化DoS",但BigInt路径被遗漏■传统SAST完全无感—没有模式匹配特征,语法层看完全正常■需要"资源层"视角—不可信输入驱动非线性复杂度的内置原语(BigInt/正则/嵌套JSON等) 漏洞成因 React Server Components在反序列化客户端payload时,遇到形如"$n123456..."的字符串会把它当成BigInt解析: 🐀我们工具的Threat-Intel历史分析能力 核心洞察:安全修复几乎从来不是一次性完成的。 就这一行。但BigInt()是一个CPU密集型同步操作——耗时随输入长度超线性增长,而且跑在Node.js主线程上,会冻结整个事件循环。攻击者只需发一个包含上百万位数字的字符串: 实测效果 200万位数字→CPU阻塞约1.7秒500万位数字→CPU阻塞3秒以上50个并发攻击者持续发送→服务器完全无响应 从修复历史中提取信号——刚打过补丁的地方,恰恰是遗漏的高发区。 CodeBuddySecurity的能力表现 SAST 提高漏洞召回率 内部沉淀规则已知漏洞类型结果稳定速度快 通过结合Agent驱动的AI审计+静态分析多年沉淀,在已知漏洞测试集上召回率提升超80+% 降低漏洞误报率 通过威胁建模避免盲扫,结合对抗性审查和动静结合的验证方案,在真实业务代码上实测漏洞准确率提升超70+% AI 平衡效果与成本 支持高中低多模型搭配,实时查看Token消耗,AI发现转化为分析规则,避免重复消耗平均仓库消耗Token13M(已减去缓存,缓存命中率超70%)有效降低扫描成本 THANKS