核心判断与术语体系
- 核心判断:驾驭工程(Harness Engineering)属于操作系统层,提示词工程和智能体工程分别属于语言层和工作流层。
- 对象:高自治、长时程、可治理的AI系统。
- 术语状态:截至2026年3月26日,当前术语体系基本稳定,关键定义待进一步明确。
四层链条:从语言到操作系统
- 逐层上卷关系:提示词工程、上下文工程、智能体工程、驾驭工程不是互斥关系,而是逐层递进。
- 语言层:关注指令表达。
- 上下文层:关注状态供给。
- 智能体层:关注状态供给和指令表达。
OpenAI Codex 实验场景
- 数据规模:五个月后仓库达到约百万OpenAI证据行,0行人工代码启动OpenAICodex实验场景。
- 开发效率:SHARNESS百万行代码仓库估算开发时间约为手写的1/10。
- 核心变化:工程师的主业不再是手写代码,而是通过数据库反馈环路进行开发。
驾驭工程的真正目标
- 稀缺资源:真正稀缺的是human time and attention,而非AI能力。
- 目标:驾驭工程的真正目标不是把AI变得更像人,而是把人从低价值、可并行、可自动纠错环节中抽离,专注于高价值的创造性工作和战略决策。
- 人类注意力漏斗:通过自动化过滤和AI辅助,优化人类注意力分配。
反模式:过早追求完全自治
- 反模式四:过早追求完全自治的高自治AI系统。
- 关键数据:公开证据最强的仍然是coding agents。
- 建议:可验证性越弱,越不适合贸然追求高自治;高风险场景更适合Agent预处理+人类放行。