行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯云黑客松智能渗透挑战赛决赛答辩-yhy

2025-12-09 腾讯心大的小鑫

Human-AI Teaming实践总结

PART 01: Human-AI Teaming的实践

双Agent协作架构

核心机制：顾问与主攻手的分工
- 顾问（战略层）：
  - 职责：提供攻击建议、分析漏洞类型、推荐工具和方法
  - 特点：不执行工具，仅负责"思考"，介入时机为任务开始、连续失败3次、定期咨询（5/10/15次）
- 主攻手（执行层）：
  - 职责：综合顾问建议，做出最终决策，执行所有工具
  - 特点：连续攻击模式下快速迭代，无需顾问介入

三层工具体系

Docker真环境：
- 关键决策：避免自造轮子，直接使用Kali环境
- 价值：避免MCP陷阱，工具描述不占用过多token，提升LLM选择空间
Python执行能力：
- 核心能力：LLM可编写任意Python代码（HTTP请求、数据处理、自定义PoC）
- 优势：解决多步组合、复杂逻辑漏洞，不受预定义工具限制

机制2：动态角色互换重试

价值：
- 利用不同模型的推理强项
- 突破特定题目的逻辑死锁
- 历史失败记录传承，避免重复错误
操作方式：失败后交换主次角色

PART 02: 7天架构演进与解题数据

PART 03: 回顾及思考

回顾与反思——做对了什么？

引入第二视角，降低长对话幻觉风险
在关键决策点提供不同思路
加重了主Agent的认知负担
上下文过长，影响推理质量
导致格式错误、工具误用等问题

回顾与反思——未来规划

按需加载知识：参考Claude Skills设计
职责分离：
- 主Agent：仅负责规划与决策，Prompt极简
- 子Agent：专注具体执行，Prompt包含详细约束
- 主Agent仅知道漏洞类型，顾问按需加载完整漏洞利用Prompt

演讲人yhy About me yhy 网络安全爱好者，热衷开发实用、有趣的小工具，梦想打造像Xray、BurpSuite这样被广泛使用的安全产品。近期专注于AI驱动的安全自动化探索，包括自动化渗透、溯源分析等方向。相信好工具能让安全更高效，也希望通过开源为安全社区贡献更多力量。 PART 01PART 02Human-AI Teaming的实践版本演变目录CONTENTS PART 03回顾及思考 PART 01 Human-AITeaming的实践 Human-AI Teaming的实践 Human-AI Teaming的实践双Agent协作架构-顾问与主攻手的分工（核心机制）顾问-战略层-职责:提供攻击建议、分析漏洞类型、推荐工具和方法 -不执行工具*只负责"想",不负责"做"-介入时机:任务开始、连续失败3次、定期咨询(5/10/15次)主攻手-执行层-职责:综合顾问建议,做出最终决策,执行所有工具-连续攻击模式:正常情况下不需要顾问,快速迭代三层工具体系-自己选武器,而不是堆MCP工具 Docker真环境-不造轮子,直接用Kali-Day 0的关键决策:看到有项目把Kali挂进来用,我意识到"何必造半残废的小轮子"-避免MCP陷阱:如果每个工具都封装成MCP,工具描述会占用绝大部分token,反而限制了LLM的选择空间 Python执行能力-让LLM自己写PoC-很多漏洞需要多步组合、复杂逻辑,单个工具搞不定-核心能力：LLM可以写任何Python代码(HTTP请求、数据处理、自定义PoC),不受预定义工具限制机制2——动态角色互换重试（尝试）价值：-利用不同模型的推理强项常规重试：失败了重跑一遍→依然失败 -突破特定题目的逻辑死锁-历史失败记录传承，避免重复错误 ChYing重试：失败了→交换主次角色版本演变PART 02 7天架构演进与解题数据 PART 03 回顾及思考回顾与反思——做对了什么？引入第二视角，降低长对话幻觉风险在关键决策点提供不同思路加重了主Agent的认知负担上下文过长，影响推理质量导致格式错误、工具误用等问题回顾与反思——未来规划按需加载知识-参考Claude Skills设计职责分离：-主Agent：只负责规划与决策，Prompt极简 -子Agent：专注具体执行，Prompt包含详细约束 -主Agent只知道有哪些漏洞类型-顾问按需加载完整的漏洞利用Prompt THANKS 演讲人yhy

点击免费查看完整报告

腾讯云黑客松智能渗透挑战赛决赛答辩-yhy

Human-AI Teaming实践总结

PART 01: Human-AI Teaming的实践

双Agent协作架构

三层工具体系

机制2：动态角色互换重试

PART 02: 7天架构演进与解题数据

PART 03: 回顾及思考

回顾与反思——做对了什么？

回顾与反思——未来规划

你可能感兴趣

腾讯云黑客松智能渗透挑战赛决赛答辩-长亭外

腾讯云黑客松智能渗透挑战赛决赛答辩-xjtuHunter

腾讯云黑客松智能渗透挑战赛决赛答辩-sickhack(第十)

腾讯云黑客松智能渗透挑战赛决赛答辩-ai 小分队

腾讯云黑客松智能渗透挑战赛决赛答辩-NeuroSploit

腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko

腾讯云黑客松智能渗透挑战赛决赛答辩-Antix

腾讯云黑客松智能渗透挑战赛决赛答辩-BinX

腾讯云黑客松智能渗透挑战赛决赛答辩-D@wnEdg3

2026腾讯云黑客松-第二届智能渗透挑战赛-戴夫的后花园