您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [财通证券]:Genspark:国产超级AI Agent惊艳亮相 - 发现报告

Genspark:国产超级AI Agent惊艳亮相

信息技术 2025-04-06 - 财通证券 陈曦
报告封面

Genspark超级智能体震撼发布:登顶GAIA,开启智能新纪元。2025年4月2日,Genspark总裁景鲲发布Genspark超级智能体,发布后其在GAIABenchmark中性能指标领先,成为排名第一的AI Agent。该智能体采用整合多AI模型的MoA系统,集成9个模型,涵盖主流及图像、视频生成、机器翻译等多种模型,含80多个工具集与10多个高级数据集。它快速可靠、操控性强,近乎即时出结果,任务执行中错误和幻觉大幅减少,用户可完善输出内容。目前Genspark无需邀请码就能注册,新用户有免费体验积分,付费升级后每月获10000积分,可优先访问智能体及使用图像、视频生成模型等。 Genspark超级智能体测评:集成多款头部模型,Agent能力高效,交互体验优秀。根据Genspark发布会视频,Genspark多AI模型的混合代理(MoA)系统支持的重点功能包括帮助用户制定旅行计划,例如为用户规划4月中旬去圣地亚哥为期5天的行程,满足步行逛街、餐厅偏好等特殊需求,甚至能帮忙打电话预定餐厅;还能根据用户兴趣创作个性化视频,如制作烹饪鳕鱼的视频,无需用户掌握视频剪辑软件;也能依据热点新闻制作《南方公园》动画风格的视频。此外,还能辅助销售人员策划外展活动页面、协助HR筛选简历评估人才、进行数据可视化分析等,满足多种场景需求。我们针对Genspark目前支持功能进行了几项测评。 Genspark产品特点显著,MoA系统充分发挥各模型优势。经测评,Genspark优势显著。它集成多款头部模型,通过MoA系统依用户需求选用内嵌模型,融合不同模型功能,交互体验良好。团队背景赋予其强大信息处理能力,面对复杂研究能输出带思维链的思考过程,生成详实报告。执行任务可调用工具,方案直观可行,PPT生成质量高,文字内容可用性强。但也存在不足,如视频生成丰富度欠佳,报告缺图表,PPT格式有问题,受视频数据权限影响存在信息缺失,演示文稿信息可能因音频信息不完整而不完善。 产品和技术结合,从Genspark看AI Agent的最佳实践。Genspark作为AIAgent,充分发挥团队在搜索引擎领域优势。成员来自百度等,经验丰富,让其信息搜索高效精准。产品能力出色,融合AIAgent关键要素,交互体验丝滑,如在深度研究任务中与用户沟通确认细节。作为全球首个MoA系统,接入9个强大模型,能调用适配模型处理任务。Genspark展示了产品与技术结合的最佳实践,有望成未来AIAgent领域标杆之一。 投资建议:见正文。 风险提示:应用测试结果与本报告不一致的风险;技术迭代不及预期的风险; 商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。 1Genspark超级智能体震撼发布:登顶GAIA,开启智能新纪元 2025年4月2日,Genspark总裁景鲲(EricJing)发布Genspark超级智能体。 发布后,其各项性能指标在GAIABenchmark中名列前茅,成为排名第一的AI Agent。它采用整合多AI模型的混合代理(MoA)系统,包含80多个工具集和10多个高级数据集,背后集成了多达9个模型,涵盖Claude、谷歌、OpenAI、DeepSeek等主流模型,以及文本到图像生成模型Ideogram、Recraft等,视频生成模型Kling、PixVerse等,还有用于机器翻译的大型语言模型DeepL。 图1.Genspark在GAIA Benchmark中表现第一 从发布会效果看,Genspark超级智能体具备快速、可靠、操控性强的优势,近乎即时得出结果。在任务执行过程中,错误和幻觉现象大幅减少,用户可引导和完善AI输出内容,直至符合要求。目前Genspark无需邀请码即可注册使用,新注册用户可获得一定免费体验积分。体验结束后若想继续使用,需付费升级为PLUS会员,价格为239.88美元/年或24.99美元/月。升级后每月可获得10000使用积分,并享有优先访问所有AI智能体、使用最新图像和视频生成模型等高级权益。 图2.Genspark集成多个各领域顶尖模型 前百度高管创立Genspark,以AI革新搜索引擎。Genspark是一家于2023年创立的AI驱动搜索引擎初创公司,总部位于加利福尼亚州帕洛阿尔托。Genspark专注于AI搜索领域,为用户提供更精炼、用户友好且无商业偏见的搜索体验,目标是挑战传统搜索引擎如Google等。根据TechCrunch的报道,其创始人景鲲和朱凯华(KayZhu)均为前百度员工。景鲲曾是微软Bing团队的发展经理,还在百度的核心搜索和AI部门担任首席产品经理;朱凯华则在Google和百度积累了丰富的搜索相关经验。根据Reuters报道,2025年2月公司完成1亿美元的A轮融资,最新一轮估值达到5.3亿美元。 图3.Genspark超级智能体网页版 2025年3月,Genspark上线iOS超级AI应用程序,集AI搜索、广告拦截功能的快速浏览器、AI聊天、图片工作室和深度研究功能于一体。 图4.Genspark iOS应用 2Genspark超级智能体测评:集成多款头部模型,Agent能力高效,交互体验优秀 GensparkMoA系统支持多场景应用,重塑生活与工作体验。根据Genspark发布会视频,其多AI模型的混合代理(MoA)系统支持的重点功能包括帮助用户制定旅行计划,例如为用户规划4月中旬去圣地亚哥为期5天的行程,满足步行逛街、餐厅偏好等特殊需求,甚至能帮忙打电话预定餐厅;还能根据用户兴趣创作个性化视频,如制作烹饪鳕鱼的视频,无需用户掌握视频剪辑软件;也能依据热点新闻制作《南方公园》动画风格的视频。此外,还能辅助销售人员策划外展活动页面、协助HR筛选简历评估人才、进行数据可视化分析等,满足多种场景需求。 我们针对Genspark目前支持功能进行了几项测评。 图5.Genspark规划行程 图6.Genspark生成个性化视频 2.1Genspark生成视频:任务理解能力较强,生成视频丰富度有待提高 测试任务:“生成一个5秒的乐高样式的影片,内容为哈利波特大战蝙蝠侠。”首先,用户可在左栏中选择执行任务的模型,例如“Mixture-of-Agents”,即Genspark自动选择最适合任务的模型,或可直接选择具体模型。 图7.Genspark生成视频 随后,Genspark开始“反思”任务,即对任务进行解读与拆解,生成脚本。 图8.Genspark生成视频脚本展示 视频生成部分表达准确,但内容丰富度有待提升。从生成结果看,模型对于关键词“乐高哈利波特”、“挥舞魔杖”等理解较为准确,但大部分内容并未得到完整展示,较模型在“反思”过程中生成的脚本有较大差距。因此,最终呈现的5秒内容较为单薄,实际效果接近于幻灯片。 图9.Genspark生成视频第一秒和最后一秒仅为镜头推进 2.2Genspark深度研究:任务执行能力强,交互体验优异 测试任务:“生成一份美国与日本机电产品进出口贸易状况的文字报告,其中数据部分选取2017年至2023年,至少需要从贸易总量、贸易结合度、产品结构、国际竞争优势等方面进行特点分析和总结,并给出趋势变化合理的解释。” 在收到问题后,Genspark首先会进行在思考后形成一个研究套餐,在思考中会给出详细的含思维链的思考过程。 图10.Genspark深度研究 在思考完毕后,Genspark会提出深度思考后需要确定的细节,使得报告分析深度与用户需求相符。在此问题之下,Genspark便对HS编码的层级和数据提出了更近一步的细节确认。 图11.Genspark深度研究细节确认 对细节进行确认后,Genspark会给出详细的研究计划,并与用户商讨修改事宜后再由用户下达开始指令。在研究任务开始后,用户可以离开对话界面,且最终报告会在研究完成后自动发送至邮箱。 图12.Genspark深度研究思考过程 Genspark的深度研究功能十分成熟,同时非常注重交互体验。用户可以在布置研究任务后关闭Genspark网页,只需等待任务完成后收到如图所示的邮件提醒即可。 Genspark在布置任务过程中也会与用户确认细节和研究框架,细化报告内容。任务耗时大约20分钟,生成的报告内容详实,参考内容来源多达91个,整体可读性很高。在报告质量上美中不足的是,在生成文字居多且数据丰富的报告时没有绘制相应的各类图表(我们估计在提示词中增加相关要求应该可以表现更完美)。 图13.Genspark深度研究报告生成 2.3Genspark制定旅行计划:可调用工具丰富,最终呈现形式直观且可行性强 测试任务:“请为5月1日至5日创建一个令人惊叹的济州岛行程,包括每个地点的高质量照片、每日地图和可共享的数字格式,其中包括:每天最多3个景点(每个地点允许90多分钟)、无需自驾的便捷交通选择、各类景点的周到平衡、最少的步行路线、最好的餐厅的预订,并以美观的布局呈现,地图可以很容易地与朋友分享。” 在接受任务后,Genspark即开始拆解任务,并搜索相关信息。 图14.Genspark制定旅行计划 Genspark在制定旅行计划时充分体现了作为AI Agent调用各种工具的能力。 Genspark不仅调用了基础的联网搜索能力,还调用了图片搜索、地图搜索、生成图片、创建演示文稿、创建网页等丰富的工具,且在任务过程中实时显示代码和思考过程。 图15.Genspark制定旅行计划执行过程 Genspark制定旅游计划可行性强,美观适用网页或者演示文稿呈现最终方案。在这个任务中,Genspark灵活调用各类工具,最终生成了一份详细的旅行计划,包括每日的出行时间表、目的地的概览图、目的地地图位置。最终方案呈现形式美观,内容充实,可行性强。 图16.Genspark制定旅行计划最终方案 2.4Genspark视频内容生成演示文稿:可用性较高,但格式和表格等复杂功能仍有完善空间 测试任务:“httos://www.youtube.com/watch?v=2f3K43FHRKo&t=14s&ab_channel=OpenAl帮我对视频内容进行精确总结,并制作一个15页左右的PPT。” 在接受任务后,Genspark将任务进行拆解,先进行了“理解视频”,再基于视频内容进行了“创建演示文稿”。 图17.Genspark视频内容生成演示文稿 在处理任务过程中,Genspark逐句转录了视频的音频内容并根据音频内容制定了任务报告计划和PPT。 图18.Genspark视频内容生成演示文稿逐句转录 Genspark根据视频生成的PPT在内容上准确度较高,形式精美。Genspark生成内容整体较为完整,可读性较强,逻辑基本清晰。 图19.Genspark视频内容生成演示文稿亮点展示 格式呈现依旧有提升空间,信息获取完整性有待改善。然而,Genspark生成PPT时,部分页数会出现格式较为混乱的问题。另外,由于问题中使用的视频为Youtube上的网页视频,可能存在数据获取壁垒(权限或版权问题),导致Genspark无法捕捉视频截图,从而使生成的PPT缺失图片。此外,在利用视频生成演示文稿这一方面,Genspark主要依赖音频信息,因此若视频没有详细的配音,则生成的演示文稿信息可能不全,这或许是该功能存在的局限性。 图20.Genspark视频内容生成演示文稿格式混乱 图21.Genspark视频内容生成演示文稿信息缺失 3Genspark产品特点显著,MoA系统充分发挥各模型优势 Genspark集成多款头部模型,拥有强大的Agent能力,基本能在多场景高效运作,从我们的测评可以看出,Genspark具有诸多显著优势,包括但不限于: Genspark采用整合多AI模型的MoA系统,在执行不同任务时,可以根据用户要求选择不同的内嵌模型; Genspark将不同模型的功能点进行了较好的融合,产品体验有显著优势和特色,交互体验