评级及分析师信息 一、OpenAISora颠覆视频生成领域 OpenAI发布了文生视频大模型Sora,它能够根据提示文本,生成60s的连贯视频,颠覆了传统视频生成领域平均只有“4s”的视频生成长度。Sora基于Diffusion Transformer (DiT)模型(发表于ICCV2023)构建-简而言之,它是一个带有Transformer主干的扩散模型:DiT = [VAE编码器+ ViT + DDPM +VAE解码器]。Sora的强大主要体现在:1、视频生成能力。2、复杂场景和角色生成能力。3、语言理解能力。4、多镜头生成能力。5、从静态图像生成视频能力。6、物理世界模拟能力。我们认为此次Sora的出现对于目前AI视频生成领域是颠覆性的,是AI生成视频领域的里程碑事件。同时,Sora的出现也预示着在未来,AI生成视频很可能会颠覆视频剪辑、电影制作、游戏制作等众多领域。 分析师:赵宇阳邮箱:zhaoyy1@hx168.com.cnSAC NO:S1120523070006联系电话: 二、谷歌Gemini 1.5不断优化架构,凸显强大性能 谷歌最新一代多模态大模型——Gemini 1.5,最高可支持10,000K token超长上下文的Gemini 1.5 Pro,也是谷歌最强的MoE大模型。在百万级token上下文的加持下,可以更加轻易地与数十万字的超长文档、 拥有数百个文件的数十万行代码库、一部完整的电影等 等进行交互。Gemini 1.5的设计是基于谷歌在Transformer和混合专家(MoE)架构方面的前沿研究,这样的专门化的MoE架构,使得模型效率大幅提升。我们认为谷歌Gemini 1.5的架构创新带来的,不仅仅是更迅速地掌握复杂任务、保持高质量输出,在训练和部署上也变得更加高效。Gemini 1.5的诞生使大模型领域从此进入一个全新的时代。 三、投资建议 受益标的: 多模态素材相关:美图公司、虹软科技、万兴科技、超讯通信、佳都科技、平治信息、佳创视讯、博汇科技、数码视讯; 多模态应用厂商:科大讯飞、大华股份、海康威视、中科创达、千方科技、海天瑞声; AI算力基础设施:中科曙光、高新发展、网宿科技、云赛智联、神州数码、拓维信息、海光信息、首都在线。 四、风险提示 核心技术水平升级不及预期的风险,AI伦理风险,政策推进不及预期的风险,中美贸易摩擦升级的风险。 正文目录 1.本周热点:OpenAI Sora颠覆视频生成领域;谷歌Gemini 1.5不断优化架构,凸显强大性能.....................................52.OpenAI Sora颠覆视频生成领域,谷歌Gemini 1.5架构优化,凸显强大性能....................................................................62.1OpenAI Sora颠覆视频生成领域.........................................................................................................................................................62.2.谷歌Gemini 1.5不断优化架构,凸显强大性能.......................................................................................................................122.3投资建议..................................................................................................................................................................................................163.本周行情回顾...........................................................................................................................................................................................173.1行业周涨跌及成交情况.......................................................................................................................................................................173.2个股周涨跌、成交及换手情况.........................................................................................................................................................183.3核心推荐标的行情跟踪.......................................................................................................................................................................193.4整体估值情况........................................................................................................................................................................................204.本周重要公告汇总..................................................................................................................................................................................215.本周重要新闻汇总..................................................................................................................................................................................216.历史报告回顾.............................................................................................................................................................................................267.风险提示......................................................................................................................................................................................................27 图表目录 图表1 Sora与其他主流视频生成工具对比1.........................................................6图表2 Sora与其他主流视频生成工具对比2.........................................................6图表3 Sora中从视频到patch的转换..............................................................7图表4从左至右,训练计算的资源逐步增加.........................................................8图表5不同尺寸视频制作........................................................................8图表6改变视频的画面表现和构图效果.............................................................8图表7根据图片生成视频(黑高领衫的柴犬)........................................................9图表8生成无缝的循环视频.......................................................................9图表9根据文本生成图像........................................................................10图表10视频风格的转换........................................................................10图表11 3D空间的真实感........................................................................11图表12视频的一致性和物体的持续存在...........................................................11图表13持久的笔触.............................................................................11图表14数字世界的模拟........................................................................11图表15玻璃碎裂不准确........................................................................12图表16长视频逻辑不连贯......................................................................12图表17各模型上下文窗口限制对比..............................................................12图表18 Gemini 1.5 Pro大海捞针结果1...........................................................13图表19 Gemini 1.5 Pro大海捞针结果2.........