您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [腾讯]:腾讯云黑客松智能渗透挑战赛决赛答辩-yhy - 发现报告

腾讯云黑客松智能渗透挑战赛决赛答辩-yhy

2025-12-09 腾讯 心大的小鑫
报告封面

演讲人yhy About me yhy 网络安全爱好者,热衷开发实用、有趣的小工具,梦想打造像Xray、BurpSuite这样被广泛使用的安全产品。 近期专注于AI驱动的安全自动化探索,包括自动化渗透、溯源分析等方向。 相信好工具能让安全更高效,也希望通过开源为安全社区贡献更多力量。 PART 01PART 02Human-AI Teaming的实践版本演变目录CONTENTS PART 03回顾及思考 PART 01 Human-AITeaming的实践 Human-AI Teaming的实践 Human-AI Teaming的实践 双Agent协作架构-顾问与主攻手的分工(核心机制) 顾问-战略层-职责:提供攻击建议、分析漏洞类型、推荐工具和方法 -不执行工具*只负责"想",不负责"做"-介入时机:任务开始、连续失败3次、定期咨询(5/10/15次)主攻手-执行层-职责:综合顾问建议,做出最终决策,执行所有工具-连续攻击模式:正常情况下不需要顾问,快速迭代 三层工具体系-自己选武器,而不是堆MCP工具 Docker真环境-不造轮子,直接用Kali-Day 0的关键决策:看到有项目把Kali挂进来用,我意识到"何必造半残废的小轮子"-避免MCP陷阱:如果每个工具都封装成MCP,工具描述会占用绝大部分token,反而限制了LLM的选择空间 Python执行能力-让LLM自己写PoC-很多漏洞需要多步组合、复杂逻辑,单个工具搞不定-核心能力:LLM可以写任何Python代码(HTTP请求、数据处理、自定义PoC),不受预定义工具限制 机制2——动态角色互换重试(尝试) 价值:-利用不同模型的推理强项 常规重试:失败了重跑一遍→依然失败 -突破特定题目的逻辑死锁-历史失败记录传承,避免重复错误 ChYing重试:失败了→交换主次角色 版本演变PART 02 7天架构演进与解题数据 PART 03 回顾及思考 回顾与反思——做对了什么? 引入第二视角,降低长对话幻觉风险 在关键决策点提供不同思路 加重了主Agent的认知负担 上下文过长,影响推理质量 导致格式错误、工具误用等问题 回顾与反思——未来规划 按需加载知识-参考Claude Skills设计 职责分离:-主Agent:只负责规划与决策,Prompt极简 -子Agent:专注具体执行,Prompt包含详细约束 -主Agent只知道有哪些漏洞类型-顾问按需加载完整的漏洞利用Prompt THANKS 演讲人yhy