您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [清新研究团队]:循环工程研究报告:AI编程从“人提示Agent”走向“循环提示Agent” - 发现报告

循环工程研究报告:AI编程从“人提示Agent”走向“循环提示Agent”

公用事业 2026-06-09 清新研究团队 Hallam贾文强
报告封面

开场与核心判断 @清新研究团队简介 沈阳:清华大学新闻学院/人工智能学院双聘教授、博导 领导学术研究团队近30人。指导大数据Al人形机器人等多个产业团队 六大研究方向: 4.新媒体与网络舆论 一句话判断 开场与核心判断 Build the loop,stay the engineer 真正的效率来自更少轮次得到可证明结果 为什么现在出现循环工程 开场与核心判断「模型、工具、长任务界面同时成熟 从提示词到循环 表达问题只是第一步,经营反馈才是关键 研究对象与边界 开场与核心判断:本报告研究的是 Agent 工作流系统,不是普通脚本 本报告的核心结论 开场与核心判断 循环工程是提示词工程的系统化 不再采用日历式路线图 开场与核心判断 落地不应按时间强推而应按能力成熟度推进 全报告结构 从产品事实到创新概念,再到企业治理 行业讨论触发点 Claude Code: /loop 产品能力底座 会话内周期性重复运行任务 Claude Code: /goal 从固定周期走向完成条件驱动 Claude Code: Routines 产品能力底座 云端例行任务让循环脱离本地会话 ClaudeCode: Skills 产品能力底座 SKILL.md 让项目知识外化 Skills用SKILL.md记录可复用流程、约定和支持文件。 只有相关时加载,减少重复粘贴长说明的成本。 没有Skills,循环每轮都在重新猜你的项目。 Claude Code:Worktrees 产品能力底座 Claude Code: MCP 产品能力底座 连接真实工具后,Loop才能进入真实工作流 → MCP 让 Claude Code接入外部工具、数据库和 APl。 > 可用于 issue、监控、数据库、邮件、Slack等场景。 Codex: Agent Loop 产品能力底座 模型、工具、上下文反复交替,直到返回结果 ★ OpenAl 将 Codex的底层机制称为 agent loop★模型可返回工具调用,系统执行工具并把结果追加到上下文★循环直到模型停止调用工具并返回assistant message Codex: Automations 产品能力底座 Codex:Worktrees与Skills 产品能力底座 Codex也在补齐LoopStack @清新研究团队【2026年6月 Automations是心跳 它负责定时、事件或目标驱动地唤醒Agent 好的心跳不只是频率,而是知道何时不必打扰 Triage是收件箱 自动化结果先进入组织决策缓冲区 Worktrees是隔离层 Skills是项目知识 Connectors是外部触手 LoopStack六件套 Sub-agents 是职责分离 写的人和检查的人必须分开 Memory是第六件 六件套如何合成一条Loop 从心跳到记忆,形成可持续作业系统 五件零件不够,还要三条底线 Loop 与 Harness 的关系 Harness 管单个 Agent,Loop 管持续作业系统 创新概念:Loop kernel 创新概念与设计模式 循环像一个微型操作系统 Loopkernel 的八个模块 创新概念与设计模式 把神奇自动化拆成可审计组件 创新概念:Proof-of-Done完成是证据,不是声明 契约模板Proof-of-Done 创新概念与设计模式 每条Loop启动前先写清楚验收 创新概念:RepoMemory RepoMemory工件清单 创新概念与设计模式 让循环跨会话、跨Agent、跨团队延续 创新概念:No-GateEvaluator 创新概念与设计模式 循环必须有能说“不”的角色 No-Gate 的四类证据 创新概念与设计模式 不要只看模型解释,要看外部事实 创新概念:TriageBuffer 创新概念与设计模式 把后台发现变成可管理收件箱 Triage 的三种输出 创新概念与设计模式:归档、修复、交接 创新概念:Loop Ledger 创新概念与设计模式 循环要像服务一样记账 LoopLedger指标 创新概念与设计模式 不要奖励运行时长,要奖励可接受结果。 创新概念:Worktree Fleet 创新概念与设计模式 并行不是开更多窗口,而是管理舰队 创新概念:EntropyJanitor 循环不只生成代码,也要删除复杂度 降滴Loop是规模化的必要配套。 创新概念:EngineerSeat 人必须保留工程师席位 创新概念汇总页 从六件套到九个原创概念 模式一:CI 失败修复 Loop 典型场景与工程模式 ClLoop的完成证据 典型场景与工程模式 不要接受“我修好了”的描述 模式二:PR 评论处理Loop 典型场景与工程模式 把review反馈变成可执行队列 模式三:依赖升级LooP 典型场景与工程模式 类似Dependabot,但加入语义修复 模式四:文档漂移Loop 典型场景与工程模式 让文档跟随代码变化 模式五:上线验证 Loop 典型场景与工程模式 发布后自动观察,但不自动放行高风险动作。 模式六:缺陷回收Loop 典型场景与工程模式 从事故中生成新的规则和测试 模式七:技术债清理Loop 典型场景与工程模式 把代码生成带来的复杂度拉回来 典型场景与工程模式 避免 AI 味 UI 与随意组件膨胀 模式九:安全修复Loop 典型场景与工程模式 高风险场景必须人类门控 模式十:Backlog TriageLoop 让 Agent 先整理,不要先写代码 典型场景与工程模式 模式十一:Agent Improvement Loop 三件事循环不会替你解决 循环越顺,越要保持清醒 风险与治理 风险一:自我确认 模型很容易把半成品当完成 风险二:上下文腐烂 风险三:权限扩散 连接器越强,边界越重要 风险与治理 风险四:成本黑洞 每一轮都是一次推理和工具执行 风险五:理解债 风险与治理 你没读过的代码越多,系统越陌生。 治理原则一:最小权限 Agent不应拥有broadorunrestrictedaccess 敏感/关键层权限 ·默认只给当前任务需要的工具。 任务特定层权限 敏感数据和关键系统先排除。 权限升级必须有理由、记录和审批 基础层权限 治理原则二:工具网关 MCP是能力边界,也是安全边界 治理原则三:SSDF化 风险与治理 Agent生成代码也要遵守安全开发流程 治理原则四:AIRMF化 把 Loop 纳入 AI 风险管理 治理原则五:人类交接 风险与治理 自动化不是无人负责 治理原则六:可关闭 LoopSpec模板 运营模型与成本 每条循环都应像服务一样登记 LoopRegistry 运营模型与成本 循环舰队 运营模型与成本 管理一组循环,而不是单条自动化 模型路由 Token 经济学 运营模型与成本 评估资产库 !失败样本会产生复利 技能库治理 运营模型与成本 Skills 是复用资产,也可能变成供应链。 连接器治理 运营模型与成本 组织角色变化 运营模型与成本:开发团队将管理人、Agent、循环和反馈系统 成熟度模型 运营模型与成本 LoopEngineering不会替代工程师 LoopEngineering不会替代工程师 优秀Loop的价值是少跑几轮 优秀 Loop 的价值是少跑几轮 最危险的是舒服地照单全收 最危险的是舒服地照单全收。 循环越自动,人越容易停止判断。 一旦没有观点,Loop会把技术债包装成效率。 LoopStack六件套总览 Loop Stack = 心跳 + 隔离 + 知识 + 触手 + 审查 + 记忆 一个循环如何完成一项任务 一个循环如何完成一项任务 启动LooP 前的十个问题 启动任何LooP前先问十个问题 最佳试点选择 从低风险、高反馈密度任务开始 不要做什么 Build the Loop, Stay the Engineer 循环工程是 AI 编程的系统化下一层 Loop、Agent、Engineer 三角关系 ·提示词仍然重要,但不再是唯一界面。·Loop让Agent持续工作,治理让LoopG可被信任· Build the loop, stay the engineer。 来源与延伸阅读 关键事实以官方文档和安全框架为准