AI智能总结
华人团队发布Manus,多智能体协同效果惊艳。3月6日Monica团队发布通用Agent产品Manus,可以解决各类复杂多变的任务,能通过独立思考和系统规划,在自己的虚拟环境中灵活调用各类工具,编写并执行代码、智能浏览网页、操作各类网页应用,直接交付完整的任务成果,而非仅仅提供建议或答案。在GAIA基准评测超越OpenAI的DeepResearch。Manus使用多智能体的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制来处理复杂任务。多智能体的架构也让Manus可以在虚拟环境中调度多种工具完成任务,例如自动编写并执行代码来处理数据或自动化操作,解压缩ZIP文件提取信息等。 Agent进入快速发展阶段,应用价值凸显。1)当前Agent的三大核心组件规划、记忆、工具使用都在进步中,多Agent协同工作也将进一步提升Agent的能力上限:规划方面o1开始的推理模型让单个大模型的规划能力大幅提升,开源推理模型DeepSeek R1、QwQ-32B进展不断;记忆方面DeepSeek等模型厂商对增强大模型长上下文能力持续探索;工具使用方面业内不断有重大进展,如Anthropic推出计算机使用功能和开源模型上下文协议。2)随着技术进步,AI Agent的价值将体现在提升各行业效率以及提升决策科学性这两个关键方面。红杉资本合伙人指出,AI Agent在2025年及未来,将会从单一的Agent发展成“群体协作”的模式,以此完成更复杂的任务,价值不仅在于效率提升,更在于其对企业核心竞争力的重塑能力。AI可以为人们提供决策支持,帮助制定更加客观、合理的决策规则和标准,减少人为因素导致的道德风险。例如招聘、招标环节的应用。2025年的政府工作报告也指出以DeepSeek为代表的人工智能技术的迅猛发展,为加速数字政府、高效政府建设带来了新的机遇。随着人工智能技术的不断进步,世界各地都在致力于利用人工智能提升治理效能。 垂类Agent具备较高壁垒,软件公司将深度受益。我们认为未来AI Agent将分为通用型Agent和垂类Agent,通用型Agent将在C端及专业程度较低的B端广泛应用,预计互联网大厂将有较大的优势。垂类Agent则因为有较深壁垒,通常需要结合行业特定的知识库、工具链和数据源,因此需要各行业专业的软件团队开发。连接大模型与具体行业客户的Agent软件厂商是必不可少的环节。Agent开发需要跨越算法工程化、领域知识融合、实时数据处理等多重技术鸿沟,因此多数企业需要外部技术支持。目前以互联网大厂和独角兽创业公司为主的大模型厂商不一定在各领域具备深耕的行业know-how,另外大模型厂商的研发人员通常人力成本较高,由其他服务商去对接具体的行业客户是性价比更高的选择。我们认为在垂类深耕的公司以及具备长期软件服务经验的公司有望把握Agent落地机遇,在对接大模型和具体行业的过程中深度受益。 AI驱动国内IT基本面质变,中美对比估值修复空间显著。我们认为AI进步使国内IT基本面发生了质变:DeepSeek模型近期的突破证明了中国科技创新能力,Manus的进展也表明可完成复杂任务的AI Agent正在快速发展中。计算机软件公司发展空间广阔,同时也会带动上游云厂商、算力等AI基建的需求。同时国内财政政策或更积极,IT企业增速有望进一步修复。中国企业在这一轮AI革命中展示强大活力,中美以IT为核心的科技资产价值对齐有望形成共识,带动企业估值持续回升。 以2025年3月7日股价为准: 港股SW计算机分类平均PS( TTM )为5.31; A股SW计算机分类平均PS( TTM )为10.92; 美股纳斯达克计算机指数成分平均PS( TTM )为64.21。 对标中美代表云计算和SAAS相关公司PS估值,国内企业估值整体也相对较低。我们认为后续国内企业进一步深入应用AI,营收与估值均有较大提升空间。 建议关注: IAAS:阿里巴巴、奥飞数据、云赛智联、神州数码、弘信电子、深信服、深桑达、科华数据、品高股份、金山云、润建股份、海南华铁、圣阳股份、南都电源、优刻得、浪潮信息、中科曙光、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技等。 国产算力:寒武纪、海光信息等。 SAAS:金山办公、用友网络、金蝶国际、泛微网络、鼎捷数智、宇信科技、京北方、致远互联、金桥信息、汉得信息、朗新集团、新致软件、云天励飞、同花顺、萤石网络、润达医疗、恒生电子、上海钢联、星环科技、协创数据、卫宁健康、创业慧康、软通动力、光云科技,科大讯飞、万兴科技、海天信息、创业黑马、光云科技、迈富时、小商品城。金证股份、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。 互联网大厂AI链:寒武纪、恒玄科技、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、孩子王、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、新致软件、亚康股份、申菱环境、兆龙互连等。 军工AI:品高股份、普天科技、能科科技、海格通信。 风险提示:AI技术迭代不及预期风险、宏观经济风险、行业竞争加剧风险。 一、华人团队发布Manus,多智能体协同效果惊艳 3月6日Monica团队发布通用Agent产品Manus,Manus可以解决各类复杂多变的任务,能通过独立思考和系统规划,在自己的虚拟环境中灵活调用各类工具,编写并执行代码、智能浏览网页、操作各类网页应用,直接交付完整的任务成果,而非仅仅提供建议或答案。Manus官网展示的案例包括旅行规划、股票分析、课程准备、保险政策比较、供应商采购、财务报告分析、电商运营分析等多个领域。 图表1:Manus官网展示案例 Manus在GAIA基准评测超越OpenAI的DeepResearch。GAIA是评估通用人工智能助手解决现实世界问题的基准。Manus在所有三个难度级别上实现了新的最先进(SOTA)性能,得分都超越了OpenAI的DeepResearch。 图表2:Manus在GAIA三个难度等级上都达到了新的最先进(SOTA)表现 据北京日报,Manus团队的创始人肖弘毕业于华中科技大学软件工程专业,2015年创办了武汉夜莺科技有限公司,研发了用于企业微信服务的微伴助手和新媒体工具壹伴助手。 2022年创立了“蝴蝶效应”公司,并推出了AI浏览器插件Monica,主要作为AI assistant工具,面向海外用户提供集成主流大模型应用服务,目前Monica的用户数量已达到1000万。公司联合创始人兼首席科学家季逸超创立了从事信息提取与检索技术研发的Peak Labs,并获得红杉资本和真格基金投资。 据腾讯科技,Manus AI使用一套名为“Multiple Agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过API或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务,同时支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。 图表3:Manus架构与工作流 具体实现中,Manus会把任务拆解,放在一个todo.md里,每做完一步就勾掉一个。腾讯技术工程公众号评价这种用外置文件来实现“工作记忆”的方式很有趣,也有工程师指出,Manus没有按任务的复杂度来分配资源大小,合理的是加上这方面的思考过程。 图表4:Manus会将任务放在一个todo.md文件中 多智能体的架构也让Manus可以在虚拟环境中调度多种工具完成任务。Manus可以自动编写并执行代码来处理数据或自动化操作。在分析英伟达、迈威尔科技和台积电股票价格之间的相关性的场景中,Manus先是通过API访问雅虎金融等信息网站,获取股票历史数据,同时还会交叉验证数据准确程度,避免被单一信息来源误导。之后使用Python进行数据分析和可视化,引入金融相关的专业工具进行深入分析,最终通过数据可视化图表搭配详尽的综合分析报告。在简历筛选中Manus能自动解压缩用户上传的ZIP文件逐个打开简历文档。Manus也具备多模态能力,可以从图片或PDF中提取信息。这一系列工具使用能力使Manus能执行复杂的任务。 二、Agent进入快速发展阶段,应用价值凸显 据OpenAI前应用研究主管Lilian Weng的定义,由LLM驱动的Agent系统需要三大关键组件: 1、规划:包括子目标和分解、反思与改进。 2、记忆:包括短期记忆和长期记忆。 3、工具使用:调用外部API来获取模型权重中缺少的额外信息。 图表5:LLM驱动的自主Agent系统概览 当前Agent的三大核心组件都在进步中,我们认为Agent在各领域的能力进步及应用 落地将不断加速。 1)规划方面,据腾讯科技:从GPT-o1开始的推理模型让单个大模型的规划能力大幅 提升。相比基础模型,推理模型在四种关键认知能力上有很大提升: 验证:如同一位细心的校对者,不放过任何错误; 回溯:当发现道路不通,敢于放弃并寻找新路径; 子目标设定:将庞大山峰分解为可攀登的阶梯; 逆向思考:从终点回望起点,寻找最优路径。 国内开源推理模型进展不断,继1月20日DeepSeek推出DeepSeek R1后,阿里 于3月6日推出最新的推理模型千问QwQ-32B。在一系列权威基准测试中,千问 QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模 型DeepSeek-R1:千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗 需求,非常适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级 硬件上轻松将其部署到本地设备中,进一步打造高度定制化的AI解决方案。千问 QwQ-32B模型中还集成了与智能体Agent相关的能力,使其能够在使用工具的同时 进行批判性思考,并根据环境反馈调整推理过程。通义团队表示,未来将继续探索将 智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目 标。 2)记忆方面,业内一直在对增强大模型长上下文能力进行探索,预计未来也会对 Agent能力进步起到关键作用。如2025年2月18日DeepSeek发布的NSA是一种与 硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。 3)在工具使用方面,近期产业内不断有重大进展: 2024年10月22日Anthropic推出计算机使用功能,开发人员可以通过API控制Claude以人类的方式使用计算机——查看屏幕、移动光标、单击按钮和输入文本。 2024年11月25日Anthropic将模型上下文协议(MCP)开源。此前模型受到与数据隔离的限制,每个新数据源都需要自己的自定义实现,这使得真正互联的系统难以扩展。MCP解决了这一挑战,它为连接AI系统和数据源提供了一个通用的开放标准,用单一协议取代了分散的集成,让AI系统可以更简单、更可靠地访问其所需的数据。 2025年1月23日OpenAI发布了Operator,一个可以上网执行任务的Agent。使用自己的浏览器,它可以查看网页并通过键入、单击和滚动来与之交互。 我们认为,Agent的三大核心组件基础都在持续进步,同时多Agent协同工作也将进一步提升Agent的能力上限,有望在各领域快速应用。 AI Agent的价值体现在提升各行业效率以及提升决策的科学性这两个关键方面。 据36kr,红杉资本合伙人Konstantine Buhler在接受彭博社采访时指出,AI Agent在2025年及未来,将会从单一的Agent发展成“群体协作”的模式,以此完成更复杂的任务。照这一趋势,AI Agent的市场价值不仅在于效率提升,更在于