
产品层重构版:真正面向任务交付的通用agent竞争 这份报告不再以基座模型为中心而以真正的通用agent产品层为中心。 ·Manus、Genspark、Flowith是主 轴; Operator、Mariner、computer use 是底座能力层;Devin是高价值垂直代理。 ·核心问题不是谁更会答题Ⅱ,而是谁更像一个能接活、能交付、能持续协作的数字同事。 @清新研究团队简介 沈阳:清华大学新闻学院/人工智能学院双聘教授、博导 ·领导学术研究团队近30人。指导大数据、Al、人形机器人等多个产业团队。、团队坚持:整体主义、实证主义、社会建构、进步主义。 六大研究方向 1.AI大模型理论与哲学 4.新媒体与网络舆论 执行摘要 通用智能体竞争已经从模型竞争转向任务交付产品竞争 任务交付产品竞争 模型竞争 1未来护城河会更多体现在任务交付工作台入口、记忆与治理,而不是参数规模。●护城河 Manus、Genspark、Flowith更接近用户心智中的“真正通用智能体” OpenAl、Google、Anthropic更像是在提供 computer use、browseruse和tooluse的原语。 目录 三、底座能力层: OpenAl / Google/ Anthropic 五、竞争维度、原创概念与未来判断 第一部分:重新定义研究对象 先把基座模型、agent原语和真正的通用agent产品层区分开 什么才算真正的通用智能体 接任务、拆任务、执行任务、交付结果 ,, 模型层重要,但不是最终竞争单位 基座模型(Foundation Models) 产品层(用户实际使用) 新的三层框架 产品层、原语层、垂直代理层 第二部分:产品层主战场 真正的通用agent产品竞争,应该从这里开始写 一这一部分把Manus、Genspark、Flowith放到报告中心。 Manus:最典型的任务交付型通用 agent ★ autonomous general Al agent + virtual colleague with its own computer ★Manus官方把自己定义为autonomous general Alagent,强调像是主行强调像一个有自己电脑的虚拟同事。 ☆它的产品重心是create slides.buildwebsitesdevelopapps、design这类可交付任务。 # 为什么 Manus 必用能体必须在报告中心 它代表了通用智能体从“回答器”转向“交付器 【Manus通用智能体】 【传统/有限智能体】 ·单纯 Browser Agent(浏览器代理)·只能访问和提取网页信息·交付的是“信息”而非“成果”·局限于浏览器,无法自主生成文档 Compared: Broad Agents vs.Vertical Agents @清新研究团队/2026年3月 Manus的关键差异点 微本地浏览器执行+文件交付+任务端到端完成 一同时它能生成 PPT、网站等真实文件成果。 一BrowserOperator让Manus直接在用户本地浏览器里使用现有登录态和活动标签页。 一这让它比单纯在云端点网页的agent更接近生产环境。 Genspark: 把通用智能体做成 all-in-one AI workspace SuperAgent+Docs/Sheets/Slides/Designer/Teams 一Genspark首页把自己定义为yourall-in-oneAlworkspace Help Center 把 Super Agent定义为thinks,plans,andactsto complete your everydaytasks. 一它更像一个 agent-工作套件,而不只是单个代理。 Genspark 与 Manus 的路线差异 强执行代理 vs agent-native productivity suite Genspark Manus 一Manus更像“给我任务,我去完成”的强执行代理。 一争夺交付心智 一Genspark更像“把常见工作类型都放进一个AI工作台”的套件型平台。一争夺工作台入口 Genspark的平台化价值 为什么它不只是一个SuperAgent 一它把 Al Slides、AI Sheets、Al Docs、Al Designer、AI Developer、Teams 等模块拼成统一工作台。一这种结构天然更容易形成迁移成本和团队入口。一旦用户把文档、表格、会议和agent执行都迁进来,平台黏性会迅速增加。 Flowith:把通用智能体做成 canvas-first agent workspace Neo/Oracle/FlowithOs ,Flowith官方把产品定义为agenticAIworkspace,把知识、创作和执行连接在单一 flow 中。 Oracle 和 Neo 强调 autonomousplanning、task breakdown、tool invocation和 self-optimization。 ,它代表的是“长期上下文可视化工作流+agent协作空间”路线。 Flowith与Manus、Genspark的差异 不是只做执行,也不是只做套件,而是做上下文空间 一Flowith 的核心不是单次任务交付,而是长期项目与复杂研究过程中的连续协作。一它通过 Canvas、Recipe、Nodes 和 Knowledge Garden 把 agent 行为显式化。一这使它在深度研究、长期知识工作和复杂项目场景中更有辨识度。 产品层 Agent vs 基础层能力 泛型 Agent vs 垂直 Agent FlowithOS 的意义 它在争夺“AlAgentOperatingSystem心智 一FlowithoS 官方直接把产品定义为 next-generation Al Agent Operating System。 一关键词是self-improvement、memory、speed,而不是单纯聊天或搜索。一这说明Flowith的野心是成为默认agent环境而不是单个工具。 产品层三强对比 Manus/Genspark/Flowith三条不同路线 第三部分:底座能力层PART 3: FOUNDATION CAPABILITY LAYER 真正的通用agent产品,背后都依赖这些动作原语 这一部分解释为什么 OpenAI,Google、Anthropic 很重要但含重要,但不应替代产品层。 OpenAl: 从 Operator 到 ChatGPT agent computer use + integrated task execution 一Operator是能用自己的浏览器替用户执行任务的研究预览。 一 ChatGPT agent 则进一步把研究、表格、预订和 slides等任务整合合到统一产品里。 Google:Project Mariner 与universal assistant 路线 浏览器自动化只是更大路线的一部分 Project Mariner 强调 browser task automation,Project Astra 则直接指向 universal Al assistant。一Google 争夺的不是单一agent 产品,而是更长期的超级入口和多终端assistant体系。一这使它更像“平台底座+默认入口”的选手。 Anthropic: computer use 作为 agent 动作层能力 重点在工具和GUI操作,而不是消费级agent品牌 一Anthropic 的 computer use 让开发者可以在沙箱计算环境里操作 GUl。一它的重要性在于增强agent的执行能力,而不是直接争夺消费级通用 agent 入口。一这是一种更偏底层动作原语的角色。 为什么原语层重要,但不等于最终产品层 能点按钮,不等于就是用户默认的通用智能体 一原语层决定 agent 能不能看屏幕、点网页、切工具、跑复杂流程。 一但真正决定用户心智,是这些能力被如何包装成默认工作入口。 一所以底座厂商重要,但不应替代、产品层成为报告主角。 @清新研究团队|2026年3月 Devin 很强,但它更像深度代理而不是广义通用 agent 一这一部分解释为什么 Devin 必须写,但不应和Manus归为同一层。 Devin:最典型的高价值垂直agent Alsoftwareengineer/collaborativeAlteammate 一 Cognition 把 Devin 定位为 Alsoftware engineer 和collaborative Al teammate。 一它可以计划、执行复杂工程任务,并在 shell、编辑器和浏览器环境中工作。 一后续版本还加入self-verifyauto-fix和computeruse测试能力。 为什么 Devin 不能直接等同于“通用智能体 深度极强,但广度不等于通用agent 一而不是广义通用agent的代表。一未来更可能是Manus/Genspark/Flowith与 Devin 并存,而不是相互替代。 一Devin的核心场景仍然是软件工程而不是所有任务类型。 第五部分:真正的竞争维度 比较通用智能体,不能再只看模型强弱这一部分把竞争框架从模型分数,改成任务交付和工作台竞争。 五个真正重要的竞争维度 任务交付、环境控制、记忆、入口、治理 维度三:workspace与记忆Workspace/项目流。工作记忆存储(Workspace & Memory) 维度四:用户入口与平台黏性核心入口点。高平台黏性(User Entrance & Stickiness) 维度五:企业治理与控制面企业安全。控制台、策略管理(Governance & Control Plane) “默认任务承接方为什么未来比的是 不是谁最聪明,而是谁最先接管你的工作流 一用户不会长期围绕抽象模型迁移,而会围绕能把活做完的agent 迁移。 一谁成为默认任务承接方,谁就会拥有更强的数据、记忆和工作流优势。 一这比一次性的模型领先更更持久。 第六部分:原创核心概念 用五个概念重新解释通用智能体竞争 一以下五个概念用于帮助理解产品层原语层和垂直代理层之间的关系。 @清新研究团队|2026年3月 任务交付型智能体 任务交付型智能体=不是回答用户,而是替用户完成任务并交付结果 【用户输入(任务)]->「智能体(执行器}->「任务结果(交付物)一真正值钱的地方不在聊天, 一Manus、Genspark、Flowith都在争夺这个位置。 一未来用户选择agent,更像选择数同事而不是选择问答模型。 原语层与产品层分离 原语层与产品层分离=底座厂商提供动作能力,产品层玩家提供最终体验 一OpenAI、Google、Anthropic 更像是在提供computeruse、browser use、tooluse原语。 工作台护城河 工作台护城河=用户把常见工作都迁入同一workspace后形成的高切换成本 广度智能体与深度智能体 →广度智能体覆盖更多任务类型,深度智能体在单一场景做得更深 团队首创概念 交付替换权 交付替换权=agent成为用户默认任务承接方后的持续支配力 一一旦某个 agent 默认接研究、演示、网站、表格和复杂任务,它就不再只是工具。 一它会变成新的工作入口。 一谁先拿到这层位置,谁就更接近通用智能体时代的平台红利。 第七部分:未来两年判断 接下来两年,通用智能体竞争会越来越像产品与入口竞争 一→本章收束为几个最值得执行层关注的判断 未来两年的三条主判断 产品竞争强化