2025年03月06日20:04 关键词关键词 agent推理能力reasoning take action信息检索数据可视化多智能体系统网页抓取API模型路由可观测性企业知识库C端私有数据大模型工程化落地产品化multi agents multi action模型能力 全文摘要全文摘要 新推出的产品“minus”旨在作为个人助理,尤其在处理复杂任务和数据收集方面展现出潜力,与微软Copilot有相似之处。然而,“minus”在实现其核心功能时遇到了挑战,特别是在执行具体行动方面能力有限。尽管在工程化实施方面已取得进展,提高了功能多样性和场景适用性,但将强大的模型能力有效转化为实际产品应用,特别是在多agent协同和工程化层面,仍然是当前的主要难题。 Agent应用的应用的ChatGPT时刻时刻20250306_导读导读 2025年03月06日20:04 关键词关键词 agent推理能力reasoning take action信息检索数据可视化多智能体系统网页抓取API模型路由可观测性企业知识库C端私有数据大模型工程化落地产品化multi agents multi action模型能力 全文摘要全文摘要 新推出的产品“minus”旨在作为个人助理,尤其在处理复杂任务和数据收集方面展现出潜力,与微软Copilot有相似之处。然而,“minus”在实现其核心功能时遇到了挑战,特别是在执行具体行动方面能力有限。尽管在工程化实施方面已取得进展,提高了功能多样性和场景适用性,但将强大的模型能力有效转化为实际产品应用,特别是在多agent协同和工程化层面,仍然是当前的主要难题。未来,“minus” 需更好地融合现有模型能力与工程化技术,以解决实际问题,其产品功能和市场定位着重于提供高效、智能的个人助理服务,助力用户优化工作流程和数据管理。 章节速览章节速览 ● 00:00关于关于minus产品的汇报与分析产品的汇报与分析讨论集中在一款名为minus的产品上,将其与微软Copilot进行对比,强调了它在代理(agent) 能力上的进展,特别是其推理(reasoning)和执行复杂多步骤任务的能力。汇报中提及了A型报告以及OPI路线图,强调了模型解决连续复杂任务所需的两大核心能力:任务拆解和按照逻辑顺序执行。此外,通过详细分析,指出了当前大模型在多步骤任务执行上的不足,并由同事波兄详细介绍了minus产品的基本情况和观察到的要点。 ● 03:18多智能体系统在通用多智能体系统在通用AI助手中的应用与发展助手中的应用与发展此产品定位为通用型个人助理,专注于初C 方向,具备强大的信息检索和数据分析能力,可广泛应用于研究、生活、教育和生产力等领域。其核心技术在于工程化实施,优化多智能体系统的编排,利用大模型能力实现数据收集、分析和可视化等功能。测试结果显示,该助手在复杂任务处理方面超越了OpenAI的相关功能。技术架构上,产品类似一个多智能体编排器,通过不同模型的协作提供服务,并计划开源部分模型以促进社区发展。创始团队从浏览器插件开始,逐步迭代至桌面和移动端应用,再到模型API平台和自定义聊天机器人的开发工具,最终形成了现在的多智能体代理产品。 ● 08:00 Agent技术在菜单自动化中的工程化实践技术在菜单自动化中的工程化实践讨论集中于Agent技术在菜单自动化中的应用及其实现框架,特别是针对网页抓取和数据整理等操作的限制与解决 策略。通过自动编码形式开发接口或爬虫助手,解决网页访问权限和动态数据抓取的问题。此外,强调了Agent技术进入工程化阶段的重要性,涉及多模型驱动下的模型路由、编排器、可观测性以及企业级应用中的数据存储和身份认证等关键环节。最后,指出在这一过程中,如何有效协同多个Agent以实现目标一致性,以及提升复杂任务处理能力的挑战与机遇。 ● 12:27 A轮加速进入复杂数据应用场景的演进轮加速进入复杂数据应用场景的演进 A轮正在加速进入复杂数据场景,其演进方向由数据复杂度决定。初期应用如AI搜索和企业知识库基于相对简单的存量数据,随后发展到涉及私人数据和企业单点功能的实现。更复杂的数据场景融合涉及个人行为数据和企业多维协同,如生活类助手和企业AH编排器。未来的核心区别在于数据权限,C端通过技术方案获取更详细数据,企业场景中私有数据壁垒的价值在大模型时代进一步凸显。 ● 15:44大模型大模型Agent能力与产品化挑战能力与产品化挑战总结指出,当前大模型的核心关注点在于A型,特别是agent 能力的实现。虽然模型在定量复杂推理方面表现强劲,但在定性推理上存在挑战,主要因为奖励函数难以设置。尽管模型具备执行复杂任务的能力,但在产品化落地时面临工程能力不足的问题。强调了模型与产品能力之间的差异,以及未来模型演化的方向是将定量复杂推理转化为定性的简单推理。此外,关注了multiagents的概念,即通过多个agent协同工作来执行任务,这与工程化能力紧密相关,而非模型能力本身。最后,提出了在现有模型能力下,关注哪些厂商能够实现这类产品,特别是在to c和to b领域中的应用。 问答回顾问答回顾 发言人发言人问:今天早上的产品发布会上,关于问:今天早上的产品发布会上,关于manus的的agent,大家有什么样的反响和感受?,大家有什么样的反响和感受? 发言人答:大家对manus的agent产品反响热烈,感觉它在某种程度上类似于2023年微软推出的Copilot,尤其在agent能力上给我们带来了一些震撼。 发言人发言人问:当前问:当前manus agent的核心点与之前相比有何不同?的核心点与之前相比有何不同? 发言人答:目前manus agent的核心卡点有两个。第一个是解决问题的能力,第二个核心能力是take action,即执行连续复杂的多步骤任务的能力。 发言人发言人问:问:manus agent如何实现连续复杂的多步骤任务?如何实现连续复杂的多步骤任务? 力(reasoning),能够将任务拆解;其次是有执行动作的能力(take action),能够按照逻辑顺序完成拆解后的各个步骤。 发言人发言人问:当前大模型在处理连续复杂多步骤任务上的表现如何?问:当前大模型在处理连续复杂多步骤任务上的表现如何? 发言人答:目前大模型在拆解任务方面表现出色,但在执行连续复杂多步骤任务时,take action的能力较弱,manus agent在这方面则有较好的表现。 发言人发言人问:对于问:对于manus产品的定位是什么?产品的定位是什么? 发言人答:manus本质上是一款面向个人用户的通用型agent助理,主要应用于生活、数据分析、教育生产力等领域,并且通过大量工程化实施优化了整个产品的功能和使用场景。 发言人发言人问:问:manus在测评数据上的表现如何?在测评数据上的表现如何? 发言人答:根据互联网上的测评数据,manus在三类复杂任务上的得分超越了OpenAI的MapReduce功能,尤其是在level 1和level 3任务上,超出幅度较大。 发言人发言人问:问:manus的技术架构是怎样的?的技术架构是怎样的? 发言人答:manus的技术架构类似一个多智能体系统的编排器,其中包含多种模型,能够根据需要调动不同功能,如代码助手编写API等。 发言人发言人问:公司产品从早期到现在经历了怎样的演进历程?问:公司产品从早期到现在经历了怎样的演进历程? 发言人答:公司产品经历了从浏览器扩展插件到桌面移动端应用,再到模型API平台和个人聊天机器人开发工具的演变,最终形成了当前的agent代理产品。 发言人发言人问:关于问:关于manus底层模型的开源策略是怎样的?底层模型的开源策略是怎样的? 发言人答:manus作为多智能体系统的底层模型,由几种不同的模型共同辅助支持,并且后续会考虑将部分模型反馈到开源社区,同时也强调了产品的迭代与开源社区技术和积累密切相关。 发言人发言人问:创始人团队在微信生态方面有何经历?问:创始人团队在微信生态方面有何经历? 发言人答:创始人团队早年围绕微信生态开发了面向企业用户的微版助手,后来开启了莫尼卡项目,进而发展到现在的网页插件和个人通用产品manual。 发言人发言人问:在问:在GPT等工具中,为何在处理网页数据抓取和访问权限问题时存在困难?等工具中,为何在处理网页数据抓取和访问权限问题时存在困难? 发言人答:在使用GPT等工具进行网页抓取和数据整理时,核心问题在于它们往往只能静态访问网页当前加载的内容,对于无法动态加载或需要特定权限才能访问的数据,其访问和处理能力受限。 发言人发言人问:针对上述问题,问:针对上述问题,Menu如何解决?如何解决? 发言人答:Menu通过自动编码和规划开发接口的方式,构建了一个能够自主抓取相关数据的爬虫助手,并能在未能成功加载数据时操控屏幕进行更全面的搜索展示,从而有效解决了在action环节中的部分制约与阻碍。 发言人发言人问:目前问:目前A类产品的实现框架中有哪些较为成熟的工程化部分?类产品的实现框架中有哪些较为成熟的工程化部分? 发言人答:A类产品的实现框架底层涉及许多成熟的工程化部分,包括CPU和GPU计算资源、容器编排基础设施、数据库、数据提取转换以及基础大模型等环节。随着大模型通用性能力的拓展,A类产品能够实现的功能也日益丰富。 发言人发言人问:在问:在A类产品的中间环节,有哪些关键的挑战或发力点?类产品的中间环节,有哪些关键的挑战或发力点? 发言人答:该环节主要挑战包括模型路由(即选择合适的模型执行不同任务)和agent编排器(协调多个A之间协同工作)。例如,如何实现多A之间目标一致性、分工协作以及最终形成统一结果。 发言人发言人问:问:A类产品的可观测性和可溯源性为何重要,以及当前布局情况如何?存储、内存、身份认证类产品的可观测性和可溯源性为何重要,以及当前布局情况如何?存储、内存、身份认证和和前端界面开发等技术在前端界面开发等技术在A类工程化阶段的重要性如何?类工程化阶段的重要性如何? 发言人答:对于A类产品而言,可观测性和可溯源性至关重要,尤其是在企业级应用中。目前国内外的A类企业都在加紧布局这些功能,以应对不确定性增大和错误率隐患加大等问题。这些技术在A类产品的工程化阶段扮演着重要角色,尤其是数据存储和记忆能力的扩展,以及对于复杂任务处理能力的关注度非常高。 发言人发言人问:问:A类产品的演进方向和数据复杂度的关系是什么?类产品的演进方向和数据复杂度的关系是什么? 发言人答:A类产品的演进方向随着数据复杂度的提升而变化。最初基于简单联网数据和企业私有数据的应用如AI搜索和企业知识库,随着数据复杂度增加,应用场景扩展至个人和企业层面的知识管理、单点功能实现(如客服、合规等),再到融合更复杂的数据场景。 发言人发言人问:问:A类工具在复杂数据场景中的发展趋势如何?类工具在复杂数据场景中的发展趋势如何? 发言人答:A类工具正加速进入复杂数据场景,从处理简单数据到融合行为数据、生活习惯等多元量化数据,发展出生活类agent助手。在企业端,类似A编排器的新系统正被推出,起到多维协同的作用,以应对未来企业内部多业务系统的复杂协同需求。 发言人发言人问:在大模型时代,数据权限将成为核心卡位,对吗?问:在大模型时代,数据权限将成为核心卡位,对吗? 发言人答:是的,在大模型时代,数据权限将成为区分竞争的关键点。C端通过编程技术解决了数据访问的单一属性问题,能够获取更详细和私密的数据。而在企业场景中,过去构建的私有数据壁垒在未来的大模型价值链中可能得到更显著的价值体现。 发言人发言人问:问:A型模型(型模型(agent)在今年大模型的关注点中占据核心地位,是这样吗?)在今年大模型的关注点中占据核心地位,是这样吗? 发言人答:没错,今年大模型的核心关注点之一确实是A型模型。虽然从模型角度看,今年的重点在于提升模型能力,但实际在产品端,A