您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰君安证券]:Open AI发布会事件点评:GPT-4o多模态能力进化,AI-Agent渐入现实 - 发现报告

Open AI发布会事件点评:GPT-4o多模态能力进化,AI-Agent渐入现实

信息技术2024-05-16秦和平、李奇国泰君安证券
Open AI发布会事件点评:GPT-4o多模态能力进化,AI-Agent渐入现实

事件:OpenAI发布GPT-4o并完全免费,可实现实时语音视频交互。 新模型具备多模态、低延迟特点,并免费开放。本次发布会的重点: 1)发布ChatGPT新UI、桌面版GPT;2)发布新模型GPT-4o,具备多模态、极低延迟、可在桌面运行等特点,且向用户免费开放。相较于现有的语音助手功能,GPT-4o可用性大幅提高,主要体现在: 1)极低延迟,API速度快于GPT-4,成本降低50%,最快可以在232毫秒的时间内响应音频输入,平均响应时长320毫秒。作为对比,ChatGPT语音对话的平均延迟为2.8秒(GPT-3.5)和5.4秒(GPT-4); 2)通过语音能力理解话语、状态、情感,并可通过视觉识别用户所处环境及实时活动;3)对话可随时打断,且能接续对话。 新模型实现极低延迟,主要得益于端到端设计及H200高性能。实现极低延迟主要因:1)此前语音模式由三个独立的模型组成,分别负责将音频转录为文本、接收并输出文本、将文本转换回音频,而GPT-4o是单独训练的新模型,可以端到端地处理文本、视觉和音频,输入和输出都由同一个神经网络处理;2)此前英伟达已向OpenAI交付首台DGX H200,H200推理速度比H100快90%(在70B Llama 2上)。GPT-4o的表现将推动大模型厂商进一步追求极低延迟,从而带动硬件需求,我们认为NVL 72凭借互联技术实现130TB/s的GPU带宽,推理速度相较上一代提升30倍,需求有望爆发性增长。 发布为macOS设计的ChatGPT桌面应用,苹果与OpenAI的合作有望推动换机潮、释放巨大端侧推理需求。OpenAI推出适用于macOS的ChatGPT桌面应用程序,通过键盘快捷键即可向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。此前据彭博社消息,iPhone或计划2024年在iPhone中引入OpenAI的大模型,由ChatGPT为“聊天机器人”提供支持,内置于iOS 18中。我们认为,苹果可为OpenAI提供端侧系统级应用权限,而GPT将为Siri及iOS系统赋能,进一步加速端侧AI应用落地。目前苹果全球活跃设备数量超22亿台(其中iPhone超10亿台),引入OpenAI语音对话功能加速推动端侧AI应用落地,推动新一波换机潮,同时可释放巨大的端侧推理需求,带动推理算力产业链进一步扩容。 风险提示:技术迭代不及预期;监管风险;下游接受度不及预期。 1.重点公司估值表 GPT-4o向用户免费开放,考虑到其广泛的用户群体,有望释放巨大的推理需求,从而提振算力基础设施需求,英伟达及上下游产业链有望受益。同时,GPT-4o表现出的极低延迟将推动大模型厂商进一步追求推理速度,NVL 72凭借互联技术实现130TB/s的GPU带宽,推理速度相较上一代提升30倍,需求有望爆发性增长。 苹果可为OpenAI提供端侧系统级应用权限,而GPT将为Siri及iOS系统赋能,引入OpenAI语音对话功能加速推动端侧AI应用落地,推动新一波换机潮。苹果有望凭借统一OS体验、安全生态、芯片自研能力,享受端侧AI爆发红利。 推荐标的:英伟达(NVDA.US)、台积电(TSM.US)、苹果(AAPL.US)、微软(MSFT.US)、高通(QCOM.US),受益标的:美光(MU.US)。 图1重点公司估值表 2.风险提示 技术迭代不及预期风险;监管风险;消费者接受度不及预期风险。