行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko

2025-12-09 腾讯喵小鱼

ReActPentestMVP

ReAct及相关架构：介绍了ReAct的相关研究，包括ICLR2023的"REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS"、ACL2023的"Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models"和ICML2024的"An LLM Compiler for Parallel Function Calling"。
PentestAgent现状：讨论了AutoPT和VulnBot等自动化渗透测试工具的现状，并指出其局限性。
Our Minimum Viable Product：提出了一个最小可行产品（MVP），包括ReAct模式查询重写、动态知识库、动作列表、上下文代码与命令、使用和自定义KaliDocker以及终止规则。

Human-likeAttackAgent

BashHacker：介绍了BashHacker的实现方式。
AiPYisFuture？：探讨了AiPY的未来发展。
ManusisFuture？：讨论了Manus的未来发展。
Skill：介绍了ClaudeSkill，允许Claude AI通过加载专业化的"技能包"来提升特定任务的执行能力。
Human-likeHacker：描述了Human-likeHacker的功能，包括代码与命令使用、本地Docker C2搜索、使用即时搜索进行深度研究、UI使用移动PC浏览器等。

ModularizationVSEnd2End

Modularization：介绍了模块化方法。
End2End：对比了模块化和端到端（End-to-End）方法，指出End-to-End方法直接从原始输入到最终输出学习映射关系，中间过程由模型自动完成。
AutoPT：定义了End-to-End渗透测试任务，即整个自动化渗透测试过程无需人工参与并自动适应各种环境。
ModelNaiveEnd2End：指出ModelNaiveEnd2End不以开发人员的方法论划分渗透任务的Plan过程，通过基模能力提升和大量后训练数据涌现专业的渗透规划能力。
No Silver Bullet：强调没有完美的架构，只有合适当前技术的架构，并指出End2End将是团队后续探索方向，同时不会放弃方法论优化路线的演进。
渗透或者攻击的AGI的实现：认为渗透或攻击的AGI实现仍需业内人员持续的探索、试错和创新。

演讲人仪明 About me 仪明尹超凡 AntGroup PART 01PART 02PART 03ReActPentestMVPHuman-likeAttackAgentModularizationVSEnd2End目录CONTENTS PART 01 ReActPentestMVP ReAct及相关架构 ICLR2023:REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGEMODELS ReAct及相关架构 ACL2023:Plan-and-Solve Prompting: ImprovingZero-Shot Chain-of-Thought Reasoning by LargeLanguage Models ICML2024:An LLM Compiler forParallel Function Calling PentestAgent现状 AutoPT: How Far Are We from the End2EndAutomated Web Penetration Testing? VulnBot: Autonomous Penetration Testing for A Multi-Agent Collaborative Framework OurMinimum Viable Product ReActPatternQueryRewriteDynamicKnowledgeBaseActionListContextCode&CommandUseandCustomized KaliDockerTerminationRules PART 02 Human-likeAttackAgent BashHacker AiPYisFuture？ ManusisFuture？ Skill ClaudeSkill 允许Claude AI通过加载专业化的"技能包"来提升特定任务的执行能力。Skills本质上是包含指令、脚本和资源的文件夹，Claude可以根据需要动态加载这些内容。目的复用已有工具扩展能力边界 Human-likeHacker Code&CommandUseLocalDockerC2SearchUseInstantSearchDeepResearchUIUseMobilePCBrowser SearchUse InstantSearch OpenperplexTavilySerpdev… UIUse PART 03 ModularizationVSEnd2End Modularization End2End 机器学习概念“端到端”（End-to-End）指系统直接从原始输入到最终输出学习映射关系，中间的特征提取、规则设计等都由模型自动完成。 AutoPT The end-to-end penetration testingtask, defined as the entire process ofcompleting automated penetrationtesting without human involvementand that automatically adapts tovarious environments. ModelNaiveEnd2End不以开发人员的方法论划分渗透任务的Plan过程，通过基模能力提升和大量后训练数据涌现专业的渗透规划能力 No Silver Bullet 事实上，没有完美的架构，只有合适当前技术的架构，萧规曹随的故事在技术中站不住脚。之前的相关研究也确实给我们的探索过程带来了很多启发和帮助。 End2End将是我们团队的一个后续探索方向，同时也不会放弃方法论优化路线的演进。渗透或者攻击的AGI的实现仍然需要业内人员持续的探索、试错和创新，与君共勉。 THANKS 演讲人仪明

点击免费查看完整报告

腾讯云黑客松智能渗透挑战赛决赛答辩-Pachinko

ReActPentestMVP

Human-likeAttackAgent

ModularizationVSEnd2End

你可能感兴趣

腾讯云黑客松智能渗透挑战赛决赛答辩-yhy

腾讯云黑客松智能渗透挑战赛决赛答辩-长亭外

腾讯云黑客松智能渗透挑战赛决赛答辩-xjtuHunter

腾讯云黑客松智能渗透挑战赛决赛答辩-sickhack(第十)

腾讯云黑客松智能渗透挑战赛决赛答辩-ai 小分队

腾讯云黑客松智能渗透挑战赛决赛答辩-NeuroSploit

腾讯云黑客松智能渗透挑战赛决赛答辩-Antix

腾讯云黑客松智能渗透挑战赛决赛答辩-BinX

腾讯云黑客松智能渗透挑战赛决赛答辩-D@wnEdg3

2026腾讯云黑客松-第二届智能渗透挑战赛-戴夫的后花园