您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [腾讯]:腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko - 发现报告

腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko

2025-12-09 腾讯 喵小鱼
报告封面

演讲人仪明 About me 仪明尹超凡 AntGroup PART 01PART 02PART 03ReActPentestMVPHuman-likeAttackAgentModularizationVSEnd2End目录CONTENTS PART 01 ReActPentestMVP ReAct及相关架构 ICLR2023:REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGEMODELS ReAct及相关架构 ACL2023:Plan-and-Solve Prompting: ImprovingZero-Shot Chain-of-Thought Reasoning by LargeLanguage Models ICML2024:An LLM Compiler forParallel Function Calling PentestAgent现状 AutoPT: How Far Are We from the End2EndAutomated Web Penetration Testing? VulnBot: Autonomous Penetration Testing for A Multi-Agent Collaborative Framework OurMinimum Viable Product ReActPatternQueryRewriteDynamicKnowledgeBaseActionListContextCode&CommandUseandCustomized KaliDockerTerminationRules PART 02 Human-likeAttackAgent BashHacker AiPYisFuture? ManusisFuture? Skill ClaudeSkill 允许Claude AI通过加载专业化的"技能包"来提升特定任务的执行能力。Skills本质上是包含指令、脚本和资源的文件夹,Claude可以根据需要动态加载这些内容。 目的 复用已有工具扩展能力边界 Human-likeHacker Code&CommandUseLocalDockerC2SearchUseInstantSearchDeepResearchUIUseMobilePCBrowser SearchUse InstantSearch OpenperplexTavilySerpdev… UIUse PART 03 ModularizationVSEnd2End Modularization End2End 机器学习概念“端到端”(End-to-End)指系统直接从原 始输入到最终输出学习映射关系,中间的特征提取、规则设计等都由模型自动完成。 AutoPT The end-to-end penetration testingtask, defined as the entire process ofcompleting automated penetrationtesting without human involvementand that automatically adapts tovarious environments. ModelNaiveEnd2End不以开发人员的方法论划分渗透任务的Plan过程,通过基模能力提升和大量后训练数据涌现专业的渗透规划能力 No Silver Bullet 事实上,没有完美的架构,只有合适当前技术的架构,萧规曹随的故事在技术中站不住脚。之前的相关研究也确实给我们的探索过程带来了很多启发和帮助。 End2End将是我们团队的一个后续探索方向,同时也不会放弃方法论优化路线的演进。 渗透或者攻击的AGI的实现仍然需要业内人员持续的探索、试错和创新,与君共勉。 THANKS 演讲人仪明