行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

循环工程研究报告：AI编程从“人提示Agent”走向“循环提示Agent”

公用事业 2026-06-09 清新研究团队 Hallam贾文强

核心观点与结论

开场与核心判断

研究团队：由清华大学新闻学院/人工智能学院双聘教授沈阳领导，拥有近30人的学术研究团队，专注于大数据、AI人形机器人等多个产业方向。
一句话判断：真正的效率来自更少轮次得到可证明结果，即“Build the loop, stay the engineer”。
核心结论：本报告研究的是 Agent 工作流系统，而非普通脚本；循环工程是提示词工程的系统化，落地应按能力成熟度推进。

产品能力底座

会话内周期性重复运行任务：通过 Claude Code 的 /loop 和 /goal 实现固定周期或完成条件驱动的任务。
云端例行任务：Claude Code 的 Routines 和 Skills 使循环可脱离本地会话，SKILL.md 外化项目知识，减少重复说明。
连接真实工具：MCP 使 Claude Code 接入外部工具、数据库和 API，支持 issue、监控、数据库、邮件、Slack 等场景。
Codex 机制：模型、工具、上下文反复交替直至返回结果，即 agent loop，Codex: Automations 负责定时、事件或目标驱动唤醒 Agent。

LoopStack 六件套

Sub-agents：职责分离，如写的人和检查的人分开。
Memory：第六件，支持跨会话、跨 Agent、跨团队延续。
其他组件：心跳（Automations）、收件箱（Triage）、隔离层（Worktrees）、项目知识（Skills）、外部触手（Connectors）。

创新概念与设计模式

Loop kernel：循环像微型操作系统，包含八个模块，将自动化拆成可审计组件。
Proof-of-Done：完成是证据，不是声明，需先写清楚验收标准。
RepoMemory：让循环跨会话、跨 Agent、跨团队延续。
No-GateEvaluator：循环必须有能说“不”的角色，通过四类证据实现。
TriageBuffer：把后台发现变成可管理收件箱，输出归档、修复、交接。
Loop Ledger：循环像服务一样记账，关注可接受结果而非运行时长。
Worktree Fleet：管理并行循环，而非简单开更多窗口。
EntropyJanitor：循环生成代码的同时删除复杂度。
EngineerSeat：人必须保留工程师席位，避免 AI 味 UI 和组件膨胀。

典型场景与工程模式

CI 失败修复 Loop
PR 评论处理 Loop
依赖升级 Loop
文档漂移 Loop
上线验证 Loop
缺陷回收 Loop
技术债清理 Loop
安全修复 Loop
Backlog Triage Loop
Agent Improvement Loop

风险与治理

风险：自我确认、上下文腐烂、权限扩散、成本黑洞、理解债。
治理原则：
- 最小权限：Agent 不应拥有 broad or unrestricted access。
- 工具网关：MCP 是能力边界，也是安全边界。
- SSDF 化：Agent 生成代码也要遵守安全开发流程。
- AIRMF 化：把 Loop 纳入 AI 风险管理。
- 人类交接：自动化不是无人负责。
- 可关闭：Loop 应可随时关闭。
- LoopSpec 模板：每条循环启动前先写清楚验收。

运营模型与成本

LoopRegistry：每条循环像服务一样登记。
循环舰队：管理一组循环，而非单条自动化。
模型路由：Token 经济学评估资产库。
技能库治理：Skills 是复用资产，也可能变成供应链。
连接器治理：管理外部工具接入。
组织角色变化：开发团队将管理人、Agent、循环和反馈系统。
成熟度模型：LoopEngineering 不会替代工程师，优秀 Loop 的价值是少跑几轮。

总结

循环工程是 AI 编程的系统化下一层，通过 Loop、Agent、Engineer 三角关系实现持续作业，治理让 Loop 可被信任。核心是“Build the loop, stay the engineer”，避免 AI 味 UI 和随意组件膨胀，保持人类判断。

开场与核心判断 @清新研究团队简介沈阳：清华大学新闻学院/人工智能学院双聘教授、博导领导学术研究团队近30人。指导大数据Al人形机器人等多个产业团队六大研究方向： 4.新媒体与网络舆论一句话判断开场与核心判断 Build the loop,stay the engineer 真正的效率来自更少轮次得到可证明结果为什么现在出现循环工程开场与核心判断「模型、工具、长任务界面同时成熟从提示词到循环表达问题只是第一步，经营反馈才是关键研究对象与边界开场与核心判断：本报告研究的是 Agent 工作流系统，不是普通脚本本报告的核心结论开场与核心判断循环工程是提示词工程的系统化不再采用日历式路线图开场与核心判断落地不应按时间强推而应按能力成熟度推进全报告结构从产品事实到创新概念，再到企业治理行业讨论触发点 Claude Code: /loop 产品能力底座会话内周期性重复运行任务 Claude Code: /goal 从固定周期走向完成条件驱动 Claude Code: Routines 产品能力底座云端例行任务让循环脱离本地会话 ClaudeCode: Skills 产品能力底座 SKILL.md 让项目知识外化 Skills用SKILL.md记录可复用流程、约定和支持文件。只有相关时加载，减少重复粘贴长说明的成本。没有Skills，循环每轮都在重新猜你的项目。 Claude Code:Worktrees 产品能力底座 Claude Code: MCP 产品能力底座连接真实工具后，Loop才能进入真实工作流 → MCP 让 Claude Code接入外部工具、数据库和 APl。 > 可用于 issue、监控、数据库、邮件、Slack等场景。 Codex: Agent Loop 产品能力底座模型、工具、上下文反复交替，直到返回结果 ★ OpenAl 将 Codex的底层机制称为 agent loop★模型可返回工具调用，系统执行工具并把结果追加到上下文★循环直到模型停止调用工具并返回assistant message Codex: Automations 产品能力底座 Codex:Worktrees与Skills 产品能力底座 Codex也在补齐LoopStack @清新研究团队【2026年6月 Automations是心跳它负责定时、事件或目标驱动地唤醒Agent 好的心跳不只是频率，而是知道何时不必打扰 Triage是收件箱自动化结果先进入组织决策缓冲区 Worktrees是隔离层 Skills是项目知识 Connectors是外部触手 LoopStack六件套 Sub-agents 是职责分离写的人和检查的人必须分开 Memory是第六件六件套如何合成一条Loop 从心跳到记忆，形成可持续作业系统五件零件不够，还要三条底线 Loop 与 Harness 的关系 Harness 管单个 Agent，Loop 管持续作业系统创新概念：Loop kernel 创新概念与设计模式循环像一个微型操作系统 Loopkernel 的八个模块创新概念与设计模式把神奇自动化拆成可审计组件创新概念：Proof-of-Done完成是证据，不是声明契约模板Proof-of-Done 创新概念与设计模式每条Loop启动前先写清楚验收创新概念：RepoMemory RepoMemory工件清单创新概念与设计模式让循环跨会话、跨Agent、跨团队延续创新概念：No-GateEvaluator 创新概念与设计模式循环必须有能说“不”的角色 No-Gate 的四类证据创新概念与设计模式不要只看模型解释，要看外部事实创新概念：TriageBuffer 创新概念与设计模式把后台发现变成可管理收件箱 Triage 的三种输出创新概念与设计模式：归档、修复、交接创新概念：Loop Ledger 创新概念与设计模式循环要像服务一样记账 LoopLedger指标创新概念与设计模式不要奖励运行时长，要奖励可接受结果。创新概念：Worktree Fleet 创新概念与设计模式并行不是开更多窗口，而是管理舰队创新概念：EntropyJanitor 循环不只生成代码，也要删除复杂度降滴Loop是规模化的必要配套。创新概念：EngineerSeat 人必须保留工程师席位创新概念汇总页从六件套到九个原创概念模式一：CI 失败修复 Loop 典型场景与工程模式 ClLoop的完成证据典型场景与工程模式不要接受“我修好了”的描述模式二：PR 评论处理Loop 典型场景与工程模式把review反馈变成可执行队列模式三：依赖升级LooP 典型场景与工程模式类似Dependabot，但加入语义修复模式四：文档漂移Loop 典型场景与工程模式让文档跟随代码变化模式五：上线验证 Loop 典型场景与工程模式发布后自动观察，但不自动放行高风险动作。模式六：缺陷回收Loop 典型场景与工程模式从事故中生成新的规则和测试模式七：技术债清理Loop 典型场景与工程模式把代码生成带来的复杂度拉回来典型场景与工程模式避免 AI 味 UI 与随意组件膨胀模式九：安全修复Loop 典型场景与工程模式高风险场景必须人类门控模式十：Backlog TriageLoop 让 Agent 先整理，不要先写代码典型场景与工程模式模式十一：Agent Improvement Loop 三件事循环不会替你解决循环越顺，越要保持清醒风险与治理风险一：自我确认模型很容易把半成品当完成风险二：上下文腐烂风险三：权限扩散连接器越强，边界越重要风险与治理风险四：成本黑洞每一轮都是一次推理和工具执行风险五：理解债风险与治理你没读过的代码越多，系统越陌生。治理原则一：最小权限 Agent不应拥有broadorunrestrictedaccess 敏感/关键层权限 ·默认只给当前任务需要的工具。任务特定层权限敏感数据和关键系统先排除。权限升级必须有理由、记录和审批基础层权限治理原则二：工具网关 MCP是能力边界，也是安全边界治理原则三：SSDF化风险与治理 Agent生成代码也要遵守安全开发流程治理原则四：AIRMF化把 Loop 纳入 AI 风险管理治理原则五：人类交接风险与治理自动化不是无人负责治理原则六：可关闭 LoopSpec模板运营模型与成本每条循环都应像服务一样登记 LoopRegistry 运营模型与成本循环舰队运营模型与成本管理一组循环，而不是单条自动化模型路由 Token 经济学运营模型与成本评估资产库！失败样本会产生复利技能库治理运营模型与成本 Skills 是复用资产，也可能变成供应链。连接器治理运营模型与成本组织角色变化运营模型与成本：开发团队将管理人、Agent、循环和反馈系统成熟度模型运营模型与成本 LoopEngineering不会替代工程师 LoopEngineering不会替代工程师优秀Loop的价值是少跑几轮优秀 Loop 的价值是少跑几轮最危险的是舒服地照单全收最危险的是舒服地照单全收。循环越自动，人越容易停止判断。一旦没有观点，Loop会把技术债包装成效率。 LoopStack六件套总览 Loop Stack = 心跳 + 隔离 + 知识 + 触手 + 审查 + 记忆一个循环如何完成一项任务一个循环如何完成一项任务启动LooP 前的十个问题启动任何LooP前先问十个问题最佳试点选择从低风险、高反馈密度任务开始不要做什么 Build the Loop, Stay the Engineer 循环工程是 AI 编程的系统化下一层 Loop、Agent、Engineer 三角关系 ·提示词仍然重要，但不再是唯一界面。·Loop让Agent持续工作，治理让LoopG可被信任· Build the loop, stay the engineer。来源与延伸阅读关键事实以官方文档和安全框架为准

点击免费查看完整报告

循环工程研究报告：AI编程从“人提示Agent”走向“循环提示Agent”

核心观点与结论

开场与核心判断

产品能力底座

LoopStack 六件套

创新概念与设计模式

典型场景与工程模式

风险与治理

运营模型与成本

总结

你可能感兴趣

社会服务行业AI系列报告之（三）：AI Agent加速落地，OTA从智能导购走向交易闭环

AI编程行业深度研究报告：从代码补全到智能体时代（2026年4月）

如何使用自然语言编程‘选基’：AI Agent 赋能买方投顾新实践

计算机行业周报：阿里发布AI编程大模型Qwen3-Coder，钛动科技发布全球首个营销Agent

1当前AI编程工具主要分为插件类AI原生IDE类和Agent类三大类别

AI康养深度研究报告：从“辅助诊疗工具”走向“生命全周期照护操作系统”

AI康养深度研究报告：从辅助诊疗工具走向生命全周期照护操作系统

行业研究报告：AI业务与应用场景&商业化洞见-从Token爆发走向场景兑现，AI的商业价值取决于场景价值密度

【风口研报·公司】具备SoC与AI ASIC芯片两大“预期差”，这家公司ASIC定制构筑“连接IP+量产闭环”壁垒，手机AI算力实现性能越级；AI漫剧迎来黄金窗口期，公司提前布局行业Agent卖铲人-20260518

投资策略点评：RCEP落地：市场定价从“内循环”走向“双循环”