AI智能总结
GPT–4o场景理解力阶跃式提升,“贾维斯时刻”或即将到来 —计算机行业周报 投资要点 推荐(维持) ▌算力:A100-80G租赁价格下降,谷歌发布第六代TPU芯片 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 本周跟踪算力租赁平台中,显卡配置为A100-80G中,恒源云13核+128G价格为9.00元/时,价格环比下降10.00%。产业动态上,谷歌公司于5月15日召开的I/O 2024开发者大会上 , 发 布 了 第 六 代 数 据 中 心AI芯 片Tensor处 理 器 单 元(TPU)Trillium,并将于今年推出交付。与上一代TPU v5e相比,Trillium TPU的每芯片峰值计算性能提高近5倍,为下一代AI模型的研发提供强大动力。 ▌AI应用:OpenAI推出新一代旗舰AI模型GPT-4o,反应速度大幅提升 5月13日,OpenAI正式发布GPT-4o,实现实时多模态对话。用户可免费使用GPTs,browsing,图像理解,代码解释器等此前付费功能。GPT-4o在GPT-4的基础上改进了多模态能力,实现从模型到硬件Infra到推理工程软件的全面优化。其次,一月前英伟达交付H200与OpenAI,其推理速度为H100的2倍,几乎达到人类的反应速度。同时,OpenAI与苹果需求深度匹配,有望定义新一代AI手机,引发新一轮硬件接入大模型的激烈竞争。 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:月之暗面发布Kimi+,新一轮AI应用军备竞赛进行时》2024-05-132、《计算机行业周报:商汤日日新5.0大 模 型 综 合 性 能 或 超 越GPT-4Turbo,端侧AI加速推进进行时》2024-04-293、《计算机行业周报:Adobe携手OpenAI重塑视频编辑生态,Gaudi3芯片引领AI算力新突破》2024-04-22 ▌AI融资动向:机器人公司The Bot Company、无代码云分析服务商Sigma Computing获最高融资额 本 期AI初 创 公 司 的 融 资 中 ,Sigma Computing/The BotCompany融 资 额 前 二 , 分 别 为2亿/1.5亿 美 元 。SigmaComputing专注为分析人员提供便捷的分析工具。The BotCompany则致力于利用技术解决家庭杂务的挑战,本次融资将用于开发和部署专门设计用于处理家庭杂物的机器人。 ▌投资建议 ChatGPT 4o近一步印证算力需求。尽管部分国产AI大模型在训练优化算法方面取得了显著效果,例如通过诸如模型剪枝、量化和知识蒸馏等技术手段,有效降低训练与推理过程中的算力消耗。但ChatGPT 4o的原生多模态大模型,无疑将推动AI 模型的复杂度和精细化程度向更高水平发展,意味着目前仍处算力密集型AI时代。 人机交互效果逼近“贾维斯时刻”,大幅拓展应用场景。GPT-4o的先进能力预示着AI可以提供更加自然、流畅且富有洞察力的交互体验,类似于贾维斯与钢铁侠的互动,真正开放使用后,将大幅打开实时视觉助手、虚拟陪伴人等领域的应用场景。 建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI应用金桥信息(603918.SH)等。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:A100-80G租赁价格下降,谷歌发布第六代TPU芯片................................41.1、数据跟踪:A100-80G租赁价格环比下降..............................................41.2、产业动态:谷歌发布第六代TPU芯片,计算性能提升近5倍.............................42、AI应用动态:OPENAI推出新一代旗舰AI模型GPT-4O,多模态交互再创高峰.....................52.1、流量跟踪:Kimi访问量环比增速46.73%.............................................52.2、产业动态:OpenAI推出新一代旗舰AI模型GPT-4o,引领人机交互新时代.................63、AI融资动向:无代码云分析服务商SIGMA COMPUTING、机器人公司THE BOT COMPANY获最高融资额.84、行情复盘...............................................................................95、投资建议...............................................................................116、风险提示...............................................................................12 图表目录 图表1:本周算力租赁情况...............................................................4图表2:Google I/O发布现场............................................................5图表3:2024.5.8-2024.5.14 AI相关网站流量..............................................6图表4:启动语音功能,GPT-4o进行意大利语-英语实时交替翻译..............................7图表5:启动摄像头,GPT-4o实时给出过程及答案...........................................7图表6:启用摄像头展现面部,由GPT-4o分析情绪..........................................7图表7:输入购物要求,由Kimi+进行商品推荐..............................................8图表8:本周AI初创公司的融资动态......................................................8图表9:本周指数日涨跌幅...............................................................10图表10:本周AI算力指数内部涨跌幅度排名...............................................10图表11:本周AI应用指数内部涨跌幅度排名...............................................10图表12:重点关注公司及盈利预测........................................................11 1、算力动态:A100-80G租赁价格下降,谷歌发布第六代TPU芯片 1.1、数据跟踪:A100-80G租赁价格环比下降 恒源云A100-80G价格下降10.00%,其余环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为10.00元/时;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G的价格为9.00元/时。 1.2、产业动态:谷歌发布第六代TPU芯片,计算性能提升近5倍 5月15日,谷歌公司在召开的I/O 2024开发者大会上,发布了第六代数据中心AI芯片Tensor处理器单元(TPU)Trillium,并将于今年推出交付。此款芯片旨在为最苛刻的生成式人工智能模型和工作负载提供支持,提供比现有TPU显着增强的计算、内存和网络功能。 资料来源:Google I/O,华鑫证券研究 迄今为止性能最高、能效最高的TPU。全新的Trillium能够以更快的速度训练新一代AI模型,同时减少延迟和降低成本。与上一代TPU v5e相比,Trillium TPU的每芯片峰值计算性能提高了4.7倍,为了达到这种性能水平,谷歌扩大了矩阵乘法单元(MXU)的大小并提高了时钟速度;高带宽内存(HBM)容量和带宽提高了一倍,可以实现缩短大型模型的训练时间和服务延迟。;芯片间互联(ICI)带宽也提高了一倍,使训练和推理作业能够扩展到数万个芯片;作为迄今为止谷歌最具可持续性的TPU,能效提高了超过67%。 配备了第三代SparseCore。SparseCore是专业的加速器,用于处理先进的基于人工智能的排名和推荐系统中的超大嵌入。借此,Trillium TPU将能够训练下一代基础人工智能模型,并以更低的延迟和成本为这些模型提供服务。 Trillium将为下一代AI模型提供动力。Google Cloud的一部分客户已经计划使用Trillium TPU。例如Google DeepMind将使用新芯片来训练和服务未来几代Google的Gemini模型;Deep Genomics正在利用人工智能为药物发现的未来提供支持。此外,Trillium TPU还将与Google Cloud的AI Hypercomputer项目集成,这是一种专为尖端人工智能工作负载而设计的突破性超级计算架构。AI超级计算机将最先进的TPU和GPU与开源软件框架和灵活的消费模式集成在一起,以支持开发极其强大的新AI工作负载。 2、AI应用动态:OpenAI推出新一代旗舰AI模型GPT-4o,多模态交互再创高峰 2.1、流量跟踪:Kimi访问量环比增速46.73% 本 期 (2024.5.8-2024.5.14)AI相 关 网 站 流 量 数 据 : 访 问 量 前 三 位 分 别 为Bing(314.9M)、Discord(252.8M)和Canva(143.6M);访问量环比增速前三位分别为Kimi(46.73%)、文心一言(34.39%)和Character.AI(6.02%);平均停留时长前三位分别为Character.AI(0:14:34)、Canva(0:10:03)和Deepl(0:08:54);平均停留时长环比增速前三位分别为Kimi(2.56%)、Gemini(1.31%)和QuillBot(1.15%)。 2.2、产业动态:OpenAI推出新一代旗舰AI模型GPT-4o,引领人机交互新时代 当地时间5月13日,OpenAI正式发布GPT-4o,其原生多模态模型特性大幅提升整合方面的精细度,可以在语音,文本和视频分析之间快速切换。这类模型具有思维链和涌现能力,生成结果不断接近人类思考的关键特征。同时,多模态模型能够实现更好的常识推理性能,允许模型在大量模态数据中自然学习能力。 目前用户可免费使用GPTs,browsing,图像理解,代码解释器等此前付费功能。GPT-4o在GPT-4的基础上改进了文本,视觉以及音频方面的能力,实现从模型到硬件Infra到推理工程软件的全面优化。OpenAI通过跨文本,视觉和音频端到端训练新模型,使所有输入和输出由同一神经网络处理。其次,一月前英伟达交付H200与OpenAI,其推理速度为H100的2倍,进一步降低延迟,几乎达到人类的反应速度。发布会展现的GPT-4o部分具体功能如下: 1)无延迟对话:区别于GPT-4模型先将用户语音转为文字,生成回复文本,再转回语音的长时间过程,GPT