AI智能总结
证券研究报告2024 年 08 月18 日 MultiOn发布AlAgentQ,谷歌Al手机Pixel9抢先落地 AI行业跟踪35期(20240812-20240816) 核心结论 分析师陈影$0800522100004chentongg@research.xbmei.com.cn 行业要闻追踪 和创公司MultiOn发布高效AIAgentQ,智能体是大模型落地的核心交互介质。我们认为,智能体应用正处于快速增长期,市场格局尚未明确,开发门仍需进一步降低。为争李份额,以字节跳动、阿里、百度和腾讯为代表的厂商平台纷纷加入份格成,调整了填下大模型产品的定价策略。与此同时,当前许多平台存在操作流程紫填、界面不友好等问题。复杂的功能设置和参数调整让用户感到围感,增加了使用的难度和学习成本,仍有较多待优化的地方。 相关研究 送信:Googie伊化A#工具,FigureAI行生乐路34期(20240805-20240809)2024-08-12送信:Google准出新模型,北美科技大厂或布最新财技(20240729-20240802)AI行业联路332024-08-07送信:Llama3.1与用源模型差馆小,容时AI投资志度权级—AI行业源多32期(20240722-20240726)2024-07-28 谷歌GeminiLive抢先落地,Al手机军备竞赛加剧。我们认为,随着谷款抢跑推出GeminiLive,有望进一步加剧端侧AI的军备竞券力度。近一年未已经发布的AI手机,各大厂商均把大模型当作了自已的核心宣传卖点。从需求侧看,用户的需求在于AI而非"AI享头”,仅有真正提升用户体验感的AI功能才能够激发鲜热潮过后的长期需求: 行情回顾 本周(08.12-08.16),我们构建的西部AI股票池中,其中108家A股公司整体周平沟涨幅1.76%,59家美股公司整体周平均涨幅7.03%。A股各板块至现不同涨%,液冷散热板块上涨3.74%,光模块板块上涨3.27%:美股各板块全面上涨,其中光模板块涨幅量大,上涨14.17%,服务器板块上涨13.19%根据舌部通信股票池,A股市场中本周(08.12-08.16)涨幅居前十的个股分别是富券股份(+52.55%)、飞荣达(+9.68%)、胜宏科技(+9.19%)、锐捷网络(+8.19%)、天享通信(+7.74%)、永鼎股份(+7.20%)、天源迪科(+6.97%)、海光信息(+6.71%)、荣联称技(6.68%)、中际旭创(+6.60%)。美股市场中本周(08.12-08.16)涨%居前五的个股分别是超微电脑(+23.59%)、BuzzFeed(+22.51%),Coherent(+20.98%)、戴尔科技(+20.25%)、Lumentum拉股(+20.19%) 投资建议:AIGC和数字中国共振,算力托底。建议重点关注AI算力硬件,关注光模块(中际旭创、天享通信、源杰科技等):散热领域(英维竞)及ICT设备商等。 风险提示:技术落地不及预期、硬件设备市场接受度不及预期、监管政策风险、中美贸易摩擦风险 内容目录 AI行业重点事件点评1.1初创公司MultiOn发布高效AlAgentQ,智能体是大接型落地的核心交互介质....31.2谷致GeminiLive抢先落地,Al手机军各竞赛加剧.AI行业动态一览......62.1国外价业动态.....62.2国内行业动态。...72.3行业最会/大会前瞻流理三、AI行情回顾:美股光模法额涨四、投资建汉:持续关注AI应用和算力基础设施五、风险提示, 图表目录 图1:AgentQ在执行预订任务时的步象标解图2:完整的AI反馈过程图3:WebShop实验结果..图4:OpenTable实验结果..图5:GeminiLive界面示意图6:GeminiLive不同声音选择图7:A股A1行业分板块周涨跌满对比(08.12-08.16)图8:美股AI行业细分板块月涨跌幅对比(08.12-08.16) AI行业重点事件点评 1.1初创公司MultiOn发布高效AlAgentQ,智能体是大模型落地的核心交互介质 事件:初创公司MultiOn最近发市了号称目前最强”的AgentQ,在真实的预订任务中可以达到95.4%的成功率。 点评: 点评1:技术端,AgentQ拥有规划、推理能力,以及自我修复功能,解决了此前LLM训练技术的局限性。近年未,虽热LLM已经彻底额覆了NLP领域并取得了基著成就,但在交互环境中仍西临重大挑战,无其多步推理任务,加如同页导航。当前依赖静态语言数据集的训练方法,不足以使这些模型造应动态的现实世界互动。AgentQ的出现是AI智能体领或的一个重大里程碑,其结合了搜索、自我反思和强化学习,能够进行规划和自我修复。它的训练方法结合了蒙特卡洛树搜索(MCTS)和自我批评,并且通过一种叫做直接偏好优化(DPO)的算法来学习人类的反绩,解决了之前LLM训练技术的局限性,使其能够实现自主网页导航。与此月时,作为相有规划和AI自我修复功能的下一代AI智能体,AgentQ的性能是LLama3基线零样本性能的3.4传。同时,在真实场景任务的评估中,AgentQ的成功率达到了95.4%。其关键组件包括: 1)基于MCTS的引导式搜索:通过探索不同的行为和网页自主生成数据,并在深索(exploration)和利用(exploitation)之间取得平衡。MCTS使用较高的采样温度和多样化提示调未扩展行为空间,确保能收集到多样化且最优的轨连。 2)AI自我批评:每个步累中,基于AI的自我批评都危提供有份值的反馈,从而优化智能体的决策。这种步累级反馈对于长周期任务至关重要,因为作蔬信号往往导改学习围难。 3)直接偏好优化:DPO算法通过构建由MCTS生成数诺的偏好对来微调模型。这种off-policy的训练方法允许模型从聚合数据集中有效学习,包括搜索过程中探索的次优分支,从而提高复杂环境中的成功率。 HR源: Ager Q: Advanced Reasoning and Leaming for Autonomcus ArAgents,西事注证券节发中心 f +*: : Agent Q: Advanced Reasoning and Leamig for Autonomous A/ Agonts,要证券研发中心 点评2:测试实验中,研究者设定了模拟网上商店和模拟订餐实验检验AgentQ在真实 世界中的表现。1)在实验1楼就商店(WebShop)实验中,基于xLAM-v0.1-r模型构建的用于模秘网上商店的任务中,agent需要进行提索以找到特定商品。虽然RFT、DPO和集束披索等方法也能实现一定提升,但幅度不及AgentQ。如果同时使用AgentQ和MCTS方法,任务成功率即可从28.6%提升至50.5%,相当于平对人类水平50%:2)在实验2模拟订餐任务(OpenTable)真实预订任务中,AgentQ需要执行多个步骤,包括找到对点的餐厅页面、选择合适的日期讨间、根据用户偏好理择合造的座位、提交用户的联络方式,最后完成任务。这个复杂度较Webshop上了一个台阶。根据实验后的统计,完成Webshop任务的平均步聚为6.8,OpenTable则翻了一倍达到13.9,由于OpenTable并非模拟数据集,而是真实的在线环境,很欢进行自动化评估,国此论文使用了GPT-4-V作为评估者,根据预先定义的指标对agent每个步的操作给予奖励值,并标记任务是否完成.AgentQ将LLaMa-3的零样本成功率从18.6%提升至81.7%,分数提高比例达340%,而且仅经过了一天的自主数据妆集。加入在线的蒙特卡罗树披索后,成功率能送一步提高纠95.4% if *2 ; Agent Q: Advanced Reasonng and Leaming for Autonomous A/ Agents,i证券研义中心 点评3:头部金业相维推出智能体,智能体是大模型落地的核心交互介质。2024年1月,OpenAl推出名为GPTStore的平台,允许用户创建、发统和使用针对各种目的定制的GPT,选一步降低了AI智能体应用的开发和使用门提。国内多家互联同大厂也纷纷布局,如字节的扣子、腾讯的元器、以及百度的APPBulider等,这些AI应用商店不仅可以创作AI智能体产品,还可以对创作出的产品进行分发。7月30日于上海举办的2024京东云峰会上,高东正式发布一站式智危体开发平台,言革智能体平台。京东云判斯,智能体、数字人、具身智能是术来大模型与终端用户的核心交互介质。百度CEO李彦宏在WAIC2024演讲中表示,“智能体是我们最看好的AI应用发展方向,搜索是智能体分发的最大入口"。而在2024春季火山引擎FORCE原动力大会上,扣子产品经理潘字扬介绍,和子作为字节距动推出的新一代AI应用开发平台,会填补大模型到用户场景的最后一公里。 我们认为,智能体应用正处于快追增长期,市场格局尚未明确,开发门槛仍需进一步降低。据MarketsandMarkets数据,2019年全球自主智能体市场规模为3.45亿美元,预计到2024年将达到29.92亿关元。当前市场格局尚不明晰,为争夺份额,以字节跳动、阿里、百度和腾讯为代表的厂商平台纷纷加入价格战,调整了旗下大模型产品的定价策略。与此同时,当前评多平台存在操作流程繁项、界面不友好等问题。复杂的功能设置和参数调整让用户感到困感,增加了使用的难度和学习成本,仍有较多待优化的地方。 1.2谷歌GeminiLive抢先落地,Al手机军备竞赛加剧 事件:北京时间8月14日谷我MadebyGoogle年度发会如期季行,发布了四款TensorG4Pixel9Al手机,并公布了容歌Gemini的最新进展。会上谷歌发布了对标Gpt-4o高阶语音瓶的GeminiLive,并且针对所有的GeminiAdvanced用户开放,端侧系统级应用载据联动功能则优先萃果落地。谷歌的先进板Al助手GeminiLive现已在三星智能手机上推出,甚至早于Pixel9系列的发布。这意味着三智能手机和平板电脑成为前批体验Gemini Live的设备。但GeminiLive月前仅对Gemini付费点订阅用户开效。 点评: 点评1:谷歇Pixel手机深度融合了AI技术,探案手机+AI新样态。谷获北次年度发布会介绍了Pixel9系列的Al驱动的新功能,重点包括内置的Al助手GeminiLive、增强的照片处理工具、图像生成器、定制的天气预告、屏募截图信息回忆、保存通活中的记录和细节等。其中,关于具备多模态识别能力的智能语音动手GeminiLive,用户可以通过文本、图像或语音与其进行交流。Gemini Live对标OpenAI ChatGPT最新上线的AdvancedVoice模式(限量Alpha测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逐真的多轮对话。 点评2:GeminiLive的核心特性在于其自然、流畅的交互体验,并与其他应用程序和工县连接。用户能够像与普通人交流一样,与这个AI助手进行选续对活。并且用户可通过打断对话来获取更多信息,并在销后继续之前的话题,达种人性化的互动设计给用户营来前所未有的智能助手使用体验。然而,当前的GeminiLive尚未与谷歌的其他服务(如日历、云端硬壹、Gmail、Keep、YouTube和YouTubeMusic)实现深度集成,谷款表示,这些功能将在未来几个月内逸步上线,此后用户就无需耗费功夫在应用程序和服务之调切接。在界面设计上,Gemini Live遵简简洁明了的原则,占据整个屏靠但会显示后台的其他应用。北外,用户还可以从十独声音选项中选择Gemini Live的语音,并在应用设置中切换“打断实时响应"功能,目前,GeminiLive仅支持英语版本,但谷款已承诺将在未来几个月内推出对其他语言的支持。 资料六源:Google官H,西部证季带发中心 资料来源:Gongl