您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [清新研究团队]:智能体管理学:从模型能力到组织操作系统 - 发现报告

智能体管理学:从模型能力到组织操作系统

信息技术 2026-03-29 清新研究团队 极度近视
报告封面

从模型能力到组织操作系统 @清新研究团队简介 沈阳:清华大学新闻学院/人工智能学院双聘教授、博导 领导学术研究团队近30人。指导大数据、Al、人形机器人等多个产业团队。、团队坚持:整体主义、实证主义、社会建构、进步主义。 六大研究方向: 1.AI大模型理论与哲学 3. AI应用 4.新媒体与网络舆论 这不是一份“大模型功能说明书 它讨论的是组织如何管理会行动的AI 一研究对象从“模型能力”转向“行动资产”与“流程单元”。 V一核心问题从“能否生成”转向“能否稳定、可控、可审计地执行”。一目标是在效率、责任与治理之间建立新平衡。 报告结构 十个问题读懂智能体管理学 结论一:未来竞争力取决于管理密度 不是谁先接入模型,而是谁先把模型变成制度化生产系统 结论二:智能体管理的目标不是“全自动 而是“高可信的人机协同 高可信的人机协同(Blue) 全自动幻象(Blue) 左侧全自动幻象(Red) 全自动智能体 越是高影响场景越需要明确人工接管点与终止条件。自动化扩张会引发责任折返,问责要求会向少数关键节点集中。可信吞吐比总吞吐更接近真实商业价值 可信吞吐 结论三:组织必须建立六层管理框架 六层管理框架(TheSix-LayerManagementFramework) 战略、组合、流程、协议、控制、基础设施 ·每一层都回答不同问题,缺一层就会在规模化阶段失速。 ·框架的作用,是把模型能力翻译成组织能力。·智能体管理学的价值,在于让零散试点变成长期经营。 第一部分 为什么“智能体管理学”会成为独立命题 从问答式AI到执行式AI 组织面对的对象已经从“回答者”变成“行动者 一智能体开始围绕自标持续感知、调用工具、处理异常和反馈修正。 一只讨论模型回答质量,已经不足以解释组织级价值创造。 一真正的变化,是AI开始嵌入完整流程而不是停留在单步任务。 采用虽未全面普及,但已跨过概念验证门槛 AI已进入真实业务流程,而不只是演示环境 联邦政府usecase激增,说明AI已成为制度对象 政策语言已经从“鼓励探索”变成“明确治理 中国强调落地窗口期 美国强调机构治理和公信力 两类政策都说明:AI现在被视为长期制度对象,而不是短期技术热点。 智能体扩张正在碰到硬边界 算力、能源、网络和数据接口成为系统级约束 数据中心用电占比(EPRI/DOE) 一EIA预计美国用电量2026年增长1%、2027年增长3%,大型计算中心是关键驱动。一DOE页面转述EPRI估计:到2030年数据中心用电可占美国总用电9%。一这意味着智能体规模化不能脱离电力、机房和容量规划独立存在。 从工具管理走向组织操作系统管理 管理对象的重心已经发生迁移 M过去管理软件模块,现在管理会行动会协同、会影响结果的执行单元。 从工具管理走向组织操作系统管理 组织操作系统(权限、责任、回滚和监督) M过去只管IT可用性,现在还要管权限、责任、回滚和监督 流程(执行单元) 这要求管理学、信息系统和治理框架重新组合。 为什么需要一门“智能体管理学 因为组织已经进入“会行动的AI”时代 定义、边界与管理对象 什么叫“智能体” 围绕目标持续感知、调用、协作并产生结果的执行单元 一它不是单次回答,而是带有目标闭环与反馈机制的行动系统。一是否能调用工具、利用记忆并对流程结果负责,是关键分界线。一因此,智能体是组织中的行动资产,,不是聊天附件”。 @清新研究团队12026年3月 智能体不等于聊天机器人 它与传统软件、自动化脚本、RPA 也不相同 聊天机器人(Chatbot) ·包含概率推理和上下文适配 清新研究团队12026年3月 按任务与环境划分智能体类型 单体智能体好用,不代表多智能体可管 复杂度会随协同层数快速上升 多智能体系统引入角色分工、消息传递、任务拆解和冲突协调。个复杂座1一协同层数一增加,日志、责任链和版本治理的重要性陡增一因此,管理难度增长往往快于功能增长。 真正要设计的不是“去人化” “去人化”不是目标 而是人应该在什么节点出现 一高影响场景需要明确人工复核、升级和终止条件。一普通场景也要设计例外升级路径,而不是事后补锅。一人的位置决定系统可信度和问责效率。 一忽视人工作用,导致系统在复杂或意外情况下失控一把人当成需要消除的变量,而非关键的系统组件。一缺乏人的介入,系统容易产生严重错误或无法问责 它与管理学、信息系统、运筹和控制论如何分工 智能体管理学是交又而非替代 管理学 提供组织目标、激励与责任框架。 运筹与控制论(Operations Research& Control Theory) 智能体管理学 提供优化算法、动态调整与反馈机制。 @清新研究团队12026年3月 第三部分六层管理框架与生命周期 智能体管理的六层框架 战略、组合、流程、协议、控制、基础设施 战略层:先回答“为什么部署智能体 不是所有效率问题都值得用智能体重写 一战略层关注增长、成本、体验、质量和风险的权衡。一它要求组织选择真正高价值、可持续、可复制的命题。一没有战略层,智能体会退化为分散的小工具采购 @清新研究团队2026年3月 组合层:管理场景组合,而不是单个明星项目 先后顺序、资源占比与风险分层都在此决定? 高频高规则 流程层:把智能体嵌入把智能体嵌入业务节点 真正产生价值的是端到端流程改写 协议层:数据、API、权限和知识接口的总和 这是未来最重要的组织资产之一 一模型会替换,但接口、权限清单和日志规范会长期留存。7一协议层决定系统的可迁移性、互操作性和反锁定能力。窗一缺乏协议层,智能体扩张会变成一次次孤立集成。 决定系统什么时候该停、该让人接、该回滚控制层: 控制不是束缚,而是规模化前提 控制层缺失 受控系统 缺乏定义:无明确异常阅值、双签条件、终止使用条件和复盘机制。 一明确定义:建立异常闯值、双签条件、终止使用条件和复盘机制。 高影响Al:落实可说明的最低风险管理实践。 一高影响AI:忽视可说明的最低风险管理实践。 一后果:智能体越强,事故放大系数越高。 一优势:确保安全可控,实现规模化应用。 基础设施层:算力、存储诸、网络、日志与能源 智能体规模化离不开底座预算 六层管理框架的真正作用 因此,“管理层”才是智能体规模化的真正操作系统。因此,“管理层”是智能体规模化的真正操作系统 智能体生命周期不是三步,而是六步 立项阶段最重要的不是“能做”,而是“值不值得做 先选可控高频场景,再扩展到复杂场景 设计阶段写边界,试点阶段找极限 不要等上线后才发现自标函数错了 试点阶段:红队测试,找准极限 设计阶段:明确目标,写好边界 ?红队:引入独立的红队进行模拟攻击和压力测试,寻找弱点。√异常样本:使用非典型、稀有或错误的输入数据进行测试。极端工况:在超出正常运行范围的条件下评估系统表现,暴露盲点。?越早暴露问题,越不容易在规模化阶段付出高昂代价。 明确目标:清楚定义系统或产品的预期功能和成功标准。 ?权限:界定不同用户和角色的操作权限和访问范围 知识范围:划定人工智能模型或系统所基于的数据和知识边界。 人工接管条件:预设在何种情况下需要人工干预或接管。 部署后真正开始管理 退役阶段决定组织能否穿越模型更替 组织设计、治理与采购规则 智能体一进组织,最先变化的不是流程,而是角色结构 业务、平台、风险与责任人必须同时在场 一过去是业务提需求、IT交系统;现在需要四类角色协同。一谁定义目标、谁维护系统、谁审风险、谁签字负责,都要明确。一否则智能体一旦出错,就会出现责任真空。智能体出错 为什么必须有“chief AI Officer”式角色 公开Al战略与inventory的意义 AgentOps:智能体时代的平台中枢 它不是简单的MLOps升级版 一AgentOps要同时关注编排、工具调用、日志、权限、知识与回滚一它面对的是【行动系统(ActionSystems)】,而不只是模型服务。一没有AgentOps,组织看见的只是零散“成功案例”。 业务所有者必须重新成为智能体治理核心 技术团队不能单独定义业务成功 业务与技术共管 V业务负责人主导定义正确的业务目标、明确的错误边界和可靠的接管机制。 业务负责人要定义目标函数、可接受错误和接管条件。 (技术团队负责平台能力,不应独自承担业务成败判断。 技术团队提供强大、灵活的平台能力,确保智能体运行在安全范围内。 业务拥有流程并全面承担智能体的业务责任,技术提供支持。 谁拥有流程,谁就必须拥有智能体的业务责任。 安全、法务、审计需要从末端审批前移到前端设计 高影响场景尤其如此 法务 清新研究团队/2026年3月|数据来源:https://www.whitehouse.gov/wp-content/uploads/2025/02/M-25-21-Accelerating-Federal-Use-of-A/-through-lmnovation-Governance-and-Public-Trust.pdfhttps:/www.whitehouse.gov/wp-content/uploads/202S/02/M-25-22-Driving-Efficient-Acquisition-of-Artificial-lntelligence-in-Government.pdf 真正的规模上限,往往由监督带宽决定 不是token不够,而是人看不过来 一试点阶段看似可行,常常因为有少量资深员工持续町住输出一一旦规模扩大,最先耗尽的往往是人工审核、纠偏和复盘能力一因此,监督带宽必须被当作战略资源来预算。 自动化越深,关键人工节点的责任越重 这就是“责任折返 智能体时代的精确治理 普通任务被自动化后,留下来的往往是更高风险更高争议的例外。 一所以智能体时代不是少治理而是更精确的治理。 一问责会向少数关键节点集中,而不是自然消失。 高影响AI不能套用同一套轻治理模板 影响越大,控制越前置 AI采购正在成为治理起点,而不是采购终点 条款、接口与验证决定长期成本 开放与标准化API 是反锁定的基础 协议资产会在模型更替时保护组织 米开放接口减少模型替换和平台迁移时的重复集成成本。米标准化日志和权限结构,让历史责任和效果评估可延续。★这也是协议资本之所以重要的原因。 组织治理的终极目标 第五部分 指标体系、单位经济学与基础设施边界 先算单位任务经济账,再谈规模化 智能体不是免费的组织能力 一单位任务成本应包含模型调用、工具调用、人工复核和基础设施折旧。 一如果规模扩张只放大调用和审核成本,它就不是可经营资产。 真正的管理,是在质量与成本之间找到可持续平衡。 如果规模扩张只放大调用和审核成本,它就不是可经营资产。 可信吞春吐比总吞吐更重要 有效完成量必须同时满足质量、留痕和可回滚 可信吞吐 ·高吞吐但不可审计的系统,商业价值会被返工与事故吞噬 ·可信吞吐把结果、可靠性和责任一起计入产出定义。 :·它是智能体经营层最值得保留的总指标。 质量、速度、成本三角如何重新平衡 任何一边被忽略,规模化都会失真 一盲目追求速度,会推高例外率和回滚成本。 一只追求质量而不给成本上限,会让系统无法普及。 管理者要做的,是定义在什么场景下优先哪一边。平衡是关键 数据不是“越多越好”,而是“能否被智能体可靠调用 能否为智能体提供高质量、带时间戳可追踪的数据,比单纯堆数据更重要 劣质数据会在智能体时代放大为系统性错误 一知识过期、权限错配、数据碎片化会直接破坏行动质量。一能否为智能体提供高质量、带时间戳、可追踪的数据,比单纯堆数据更重要。一这也是数据治理从分析时代进入执行的标志。 能源边界正在进入管理报表 算力成本不再只是技术问题,而是经营