证券研究报告2024年12月16日 OpenAI发布“Projects”功能,谷歌推出Gemini 2.0 AI行业跟踪43期(20241209-20241213) 核心结论 分析师 陈彤S080052210000418859272982chentong@research.xbmail.com.cn 行业要闻跟踪 OpenAI发布“Projects”功能,谷歌推出Gemini 2.0。1)OpenAI推出ProjectsIn ChatGPT:该服务可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,它不仅支持Canvas界面,还能通过ChatGPT Search轻松接入互联网资源。Projects In ChatGPT在上下文管理、对话式项目管理、信息整合和检索上创新,提高个人项目及团队协作效率。2)谷歌推出Gemini 2.0:Gemini2.0亮点在于性能提升、Agent功能强大、支持多模态输出与原生工具调用。速度方面,Gemini 2.0是前代Gemini 1.5 Pro的两倍,在多模态方面也有出色表现,其对文本、代码、视频、空间的理解和推理能力全面提升。Agent方面,推出Project Astra(通用AI助手)、Project Mariner(浏览器中的人类-代理交互)和Jules(AI驱动的代码代理)等智能体应用。多模态输出方面,Gemini 2.0可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音音频。同时,Gemini 2.0可操控人形机器人执行任务,打开AgenticAI未来想象空间。 联系人 张璟17521789238zhangjing@research.xbmail.com.cn 相关研究 通信:AI for Science潜力大,DeepMind提出相关生产函数模型—AI行业跟踪42期(20241125-20241129)2024-12-02通信:昆仑万维进军语音大模型赛道,英伟达发 布FY25Q3财 报—AI行 业 跟 踪41期(20241118-20241122)2024-11-24通信:Scaling Laws撞墙引发热议,百度发布两 项AI新 技 术—AI行 业 跟 踪40期(20241111-20241115)2024-11-18 量子位发布《2024年AI行业发展趋势》,多维度前瞻AI发展。技术视角,大模型架构创新推动算力突破与AGI进展,虚拟与现实智能融合加速。产品视角,AI应用细分与创新,智能助手、AI搜索和多模态交互引领新商业模式。行业视角,AI技术的渗透与产业变革,智能驾驶、教育、医疗和投融资的快速发展。 行情回顾 2024年12月09日-2024年12月13日,我们构建的西部AI股票池中,其中75家A股公司整体周平均涨幅1.0%,60家美股公司整体周平均跌幅2.0%。A股公司中,算力租赁、液冷散热、AI应用板块上涨幅度最大,分别上涨6.0%、5.7%、1.4%。美股公司中,光模块、高速serdes、数字巨头板块涨幅最大,分别上涨6.8%、3.1%、2.3%。根据西部通信股票池,A股市场中本周涨幅居前十的个股分别是润泽科技(+41.5%)、掌阅科技(+29.6%)、申菱环境(+17.5%)、高澜股份(+14.0%)、恒润股份(+12.4%)、浙文互联(+10.8%)、沃尔核材(+8.6%)、兆龙互连(+8.6%)、同飞股份(+8.1%)、罗博特科(+7.6%)。美股市场中本周涨幅居前五的个股分别是谷歌A(+9.9%)、Sprinklr(+5.5%)、财捷(+4.0%)、天睿(+3.0%)、瞻博网络(+2.1%)。 投资建议:AIGC和数字中国共振,算力托底。建议重点关注AI算力硬件,关注光模块(中际旭创、天孚通信、源杰科技等);散热领域(英维克)及ICT设备商等。 风险提示:技术落地不及预期、硬件设备市场接受度不及预期、监管政策风险。 内容目录 一、AI行业重点事件点评......................................................................................................31.1 OpenAI发布“Projects”功能,谷歌推出Gemini 2.0.................................................31.2《2024年度AI十大趋势报告》发布,多维度前瞻AI发展.........................................5二、AI行业动态一览..............................................................................................................62.1国外行业动态...............................................................................................................62.2国内行业动态...............................................................................................................7三、AI行情回顾:A股算力租赁与液冷散热引领板块动向,美股板块分化...........................8四、投资建议:持续关注AI应用和算力基础设施.................................................................9五、风险提示.........................................................................................................................9 图表目录 图1:Gemin2.0的机器人代理,让人形机器人叠积木............................................................5图2:A股AI行业细分板块周涨跌幅对比(12.09-12.13)....................................................8图3:美股AI行业细分板块周涨跌幅对比(12.09-12.13)....................................................8 表1:AI发展趋势前瞻.............................................................................................................5 一、AI行业重点事件点评 1.1OpenAI发布“Projects”功能,谷歌推出Gemini 2.0 OpenAI推出Projects In ChatGPT 自美国当地时间12月5日起,OpenAI已相继推出满血版o1模型、强化微调技术、视频生成工具Sora、交互式界面Canvas、高级语音视觉功能,以及如何在iPhone或Mac上的Siri中以多种方式集成ChatGPT。12月14日,OpenAI推出Projects In ChatGPT,并称其为今年发布的最重要的人工智能功能之一,该服务可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,它不仅支持Canvas界面,还能通过ChatGPTSearch轻松接入互联网资源。 Projects In ChatGPT在上下文管理、对话式项目管理、信息整合和检索上创新,提高个人项目及团队协作效率。1)在“项目”中,用户可以充分利用ChatGPT的所有功能,包括SearchGPT、Canvas以及编码等。2)在创建一个项目的过程中,用户可以在一个集中化的界面内设定标题、自定义文件夹的颜色、上传与项目相关的文件,并编写说明来指导ChatGPT如何最高效地协助用户完成项目。3)在项目内部,用户可以即刻开启聊天,并通过侧边栏轻松地将过往的聊天记录添加到项目中。4)项目支持利用上下文信息来回答问题的能力,聊天内容能够保存在项目中,便于支持用户稍后继续对话,并清楚地知道在哪里查找所需内容。用户能够分享他们正在撰写小说的多个笔记和文件,项目中的每个新聊天都能直接访问这些数据,省去了每次会话开始时重复共享文档的繁琐步骤。5)项目内的任意聊天均可访问项目内的所有信息,用户可以像操作文件夹那样,利用项目将类似的聊天整合在一起,实现更加高效的管理。 谷歌推出Gemini 2.0 谷歌发布Gemini 2.0,引领AI Agent新时代。Gemini 2.0基于谷歌定制的硬件第六代TPU Trillium构建而成,TPU为Gemini 2.0的训练和推理提供100%算力支持。这一模型被谷歌称为迄今为止最强大的人工智能模型,专为智能体时代设计。目前谷歌完全对外开 放的是Gemini 2.0 Flash体验版,这个版本具有低延迟特性,其聊天版本可供全球用户使用,而具有文本到语音和图像生成功能的实验多模式版本则可供开发人员使用。 Gemini 2.0亮点:性能提升、Agent功能强大、支持多模态输出与原生工具调用。 性能大幅提升:速度方面,Gemini 2.0是前代Gemini 1.5 Pro的两倍,在关键基准测试中更是超越了此前的旗舰模型。同时,Gemini 2.0在多模态方面也有出色表现,其对文本、代码、视频、空间的理解和推理能力全面提升。例如,利用SpatialUnderstanding功能,上传一张图片,Gemini 2.0能快速进行图像中的物体检测(2D和3D形式均可)和标注,并生成结构化的数据(JSON格式),为机器学习训练数据准备、图像分析或计算机视觉研究等场景提供了有力支持。此外,Gemini 2.0的地图交互功能也十分强大,利用Map explorer可以展示世界上最有意思的大城市,让用户直观地感受到其强大的功能。 Agent功能强大:Gemini 2.0推出了多个强大的智能体应用:1)Project Astra(通用AI助手)作为升级版通用AI助手,能流畅对话、调用谷歌搜索等工具、增强记忆能力,使用多种语言和混合语言进行交谈,同时访问谷歌搜索、地图等工具并保持对话语境记忆。同时,Project Astra可以在会话中保持长达10分钟的记忆,并能记住过去与用户的对话,提供更个性化的体验,处理语言的速度可以与人类在日常对话中的处理速度相媲美,还能通过手机或原型眼镜为用户在现实世界中完成各种任务。2)Project Mariner(浏览器中的人类-代理交互)能理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网络元素,通过Chrome扩展程序为用户完成任务。虽然目前仍处于早期阶段,但已展现出巨大潜力。3)Jules(AI驱动的代码代理)是编程助手,能集成到GitHub工作流中。它可以在开发者休息时自主修复软件错误并准备代码更改,与传统编程助手不同,Jules能够作为自主代理直接集成到GitHub的工作流程系统中,分析复杂的代码库,跨多个文件实施修复,并准备详细的拉取请求,而无需持续的人工监督。开发者始终掌控着整个过程,Jules会在采取行动前提出建议方案,用户可以监控其编写代码的过程,确保开发过程始终处于人工监督之下。 多模态输出与原生工具调用:Gemini 2.0可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音音频。其原生图像输出功能还能进行多轮编辑迭代,直到生成满意的图