您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:传媒Sora发布有望加速AI视频技术迭代进程,持续关注AI应用的商业化落地 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒Sora发布有望加速AI视频技术迭代进程,持续关注AI应用的商业化落地

文化传媒2024-03-11德邦证券申***
传媒Sora发布有望加速AI视频技术迭代进程,持续关注AI应用的商业化落地

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 行业点评 传媒 2024年03月11日 传媒 优于大市(维持) 证券分析师 马笑 资格编号:S0120522100002 邮箱:maxiao@tebon.com.cn 研究助理 王梅卿 邮箱:wangmq@tebon.com.cn 市场表现 相关研究 1.《传媒互联网行业周报:Claude 3模型发布;抖音本地业务人事变动》,2024.3.10 2.《传媒互联网行业2月报:Sora横空出世加速技术迭代,关注AI多模态技术迭代与应用落地》,2024.3.7 3.《传媒互联网行业周报:上海电影发布AI新战略;国产版号连续三个月数量超过100款》,2024.3.3 4.《传媒互联网行业周报:央视听大模型研发共同体创立;国务院召开央企人工智能专题推进会》,2024.2.27 5.《传媒互联网行业周报:OpenAI发布Sora视频模型;春节档票房创历史新高》,2024.2.18 Sora发布有望加速AI视频技术迭代进程,持续关注AI应用的商业化落地 [Table_Summary] 投资要点:  从Sora效果来看,“一致性”迎来突破,“真实性”有望增强。2023年,基于Diffusion的视频生成模型密集发布,例如Gen-2、Pika、SVD等,但主要的瓶颈在于一致性,生成的人物和场景无法在每一帧中保持一致,因此应用落地有限。同时,模型单次生成的视频时长最长为18秒,虽然支持通过预测延长视频,但延长后的视频通常缺乏一致性和逻辑性。根据Sora发布的Demo,模型在一致性方面获得巨大突破。1)3D一致性:Sora可以生成摄像机动态运动的视频,随着摄像机的移动和旋转,人物和场景元素在3D空间中的移动会保持一致。2)长期连续性:Sora经常(并非总是)能够有效地模拟短距离和长距离依赖关系。例如,即使人、动物和物体被遮挡或离开画面,也能保持它们的存在。3)对象永恒性:Sora能在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观。真实性方面,当与物理世界产生互动,Sora有时可以模拟一些影响世界状态的简单动作。例如,画家可以在画布上留下新的笔触,并随着时间的推移而持续;或者一个人在吃一个汉堡时,留下咬痕。虽然目前Sora的模拟尚有局限,不能准确地模拟许多基本交互的物理现象,但我们认为未来有望不断趋近真实场景。  技术层面,在Diffusion基础上,以Transformer替代传统U-Net架构或进一步提升效果。我们认为,Transformer的核心优势在于:1)训练数据兼容性提升。传统的U-Net架构对于视频的尺寸有限制,所有视频规格需统一,换言之,不可避免裁剪带来的信息丢失;而Transformer对于视频尺寸的兼容性更好,Sora可以采样宽屏1920x1080p视频、竖屏1080x1920视频以及两者之间的所有类型。优势在于,一是训练层面,保留原生视频尺寸,可以保持自然和连贯的视觉叙事,获得更好的效果;二是输出层面,生成的视频可以兼容不同的设备类型。为了将所有类型的视觉数据转换为统一的表示,Sora 使用patches作为其表示方式,类似于LLM中的tokens。2)符合Scaling Law。Scaling Law的含义为,随着模型大小、数据集大小和用于训练的计算浮点数的增加,模型的性能会提高。在LLM的研究中,OpenAI已经论证过Transformer符合Scaling Law,因此将Transformer迁移到LVM中,视频模型亦可“大力出奇迹”。  高质量数据是Sora性能提升的另一关键因素。一方面,OpenAI将 DALL·E 3 引入的re-captioning技术应用到视频中。一是训练一个高度描述性的标题模型,然后使用它为训练集中的所有视频生成文本标题,以此提高文本的准确性以及视频的整体质量。二是利用GPT将用户的简短Prompt转换为更详细的长标题,然后将其发送给视频模型,因此Sora可以准确地遵循用户的提示。另一方面,根据英伟达科学家Jim Fan推测,可能通过UE5等大量生成了合成数据作为训练集,以此获得模拟物理世界的能力。  影视应用落地开启,国内AI动画已率先落地。2月26日晚间,国内首部文生视频AI动画片《千秋诗颂》在央视综合频道开播,从美术设计到动效生成,再到后期成片,该片均为AIGC辅助制作。技术方面,依托总台海量视听数据以及上海人工智能实验室的多项AI技术,包括视频生成大模型-书生·筑梦、文生视频框架-AnimateDiff及多项可控图像生成、图像驱动等技术。AI赋能后,制作效率提升3倍。根据团队描述,在同等预算条件下,按照传统动画制作流程计算,类似《千秋诗颂》这样的动画片,一个月只能做一集;现在一个月可以做三集。  海外方面,AI生成作品已登陆银幕,应用工具逐步优化。3月6日,《终结者2》-33%-22%-11%0%11%22%33%44%55%2023-032023-072023-11传媒沪深300 行业点评 传媒 2 / 3 请务必阅读正文之后的信息披露和法律声明 翻拍作品《我们的终结者2重制版(Our T2 Remake)》在洛杉矶首映。其创作团队由50位AI领域艺术家组成,利用Midjourney、Runway、Pika、Kaiber、Eleven Labs、ComfyUi、Adobe等多个AIGC工具进行创作,不使用原电影中的任何镜头、对话或音乐,确保《Our T2 Remake》所有内容均为原创。以色列初创公司Lightricks发布了一款AI驱动的电影生成和剪辑软件——LTX Studio,通过文字就能直接生成复杂的剧情,包含语音、音效、视频画面。LTX Studio重新定义了视频制作的工作流,其中包括自动编写脚本工具、调整多镜头的场景控制工具、保证角色一致性的工具、摄像机控制、一键编辑等。公司将在3月27日正式上线该平台。我们认为,伴随技术层面模型的迭代和应用层面工作流的优化,AI在影视领域的可用性提升。然而,在当前技术节点,由于一致性问题尚未完全解决,对重要人物和场景事先建模或为中间阶段的最优解。同时,从专业影视角度,另一难点在于可控性,特别是针对镜头画面,例如镜头轨迹等。后续一致性、可控性的提升或是技术优化迭代的关键。  建议关注相关受益标的:我们认为,1)AI生成视频领域进程加速,技术有望从“预览级”升级为“成品级”。建议关注AI视频技术与工具及落地应用场景相关公司:【万兴科技,昆仑万维,美图公司,汤姆猫,风语筑等】等。2)动画领域应用已落地,降本增效显著。我们认为AI时代动画领域的主要壁垒在于动画数据积累以及IP价值。建议关注IP类及动漫动画影视类素材和创意内容产出公司:【中文在线,汤姆猫,上海电影,光线传媒,奥飞娱乐,华策影视,果麦文化,荣信文化】等。3)广告营销电商素材等应用场景类受益公司,【因赛集团,蓝色光标,浙文互联,天龙集团,龙韵股份,青木股份,思美传媒等】。4)央国企持续投入 AI传媒等,且有海量的视频内容素材和国有的媒体传播渠道。建议关注:【中视传媒,上海电影,芒果超媒,中广天择,国脉文化,中国电影,浙文影业】等。  风险提示:行业竞争加剧;技术发展不及预期,应用落地不及预期等。 行业点评 传媒 3 / 3 请务必阅读正文之后的信息披露和法律声明 信息披露 分析师与研究助理简介 马笑,华中科技大学硕士,2022年加入德邦证券,传媒互联网&海外首席分析师,行业全覆盖。5年多二级研究经验,2年产业战略/投资/咨询经验。曾任新时代证券TMT组长,传媒/计算机首席分析师,此前担任过管理咨询顾问/战略研究员/投资经理等岗位。2018年东方财富百佳分析师传媒团队第一名;2020年wind金牌分析师。 王梅卿,2022年加入德邦证券研究所传媒互联网组。 分析师声明 本人具有中国证券业协会授予的证券投资咨询执业资格,以勤勉的职业态度,独立、客观地出具本报告。本报告所采用的数据和信 息均来自市场公开信息,本人不保证该等信息的准确性或完整性。分析逻辑基于作者的职业理解,清晰准确地反映了作者的研究观 点,结论不受任何第三方的授意或影响,特此声明。 投资评级说明 [Table_RatingDescription] 1. 投资评级的比较和评级标准: 以报告发布后的6个月内的市场表现为比较标准,报告发布日后6个月内的公司股价(或行业指数)的涨跌幅相对同期市场基准指数的涨跌幅; 2. 市场基准指数的比较标准: A股市场以上证综指或深证成指为基准;香港市场以恒生指数为基准;美国市场以标普500或纳斯达克综合指数为基准。 类 别 评 级 说 明 股票投资评级 买入 相对强于市场表现20%以上; 增持 相对强于市场表现5%~20%; 中性 相对市场表现在-5%~+5%之间波动; 减持 相对弱于市场表现5%以下。 行业投资评级 优于大市 预期行业整体回报高于基准指数整体水平10%以上; 中性 预期行业整体回报介于基准指数整体水平-10%与10%之间; 弱于大市 预期行业整体回报低于基准指数整体水平10%以下。 法律声明 本报告仅供德邦证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况 下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容 所引致的任何损失负任何责任。 本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可 能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。 市场有风险,投资需谨慎。本报告所载的信息、材料及结论只提供特定客户作参考,不构成投资建议,也没有考虑到个别客户特殊 的投资目标、财务状况或需要。客户应考虑本报告中的任何意见或建议是否符合其特定状况。在法律许可的情况下,德邦证券及其 所属关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供投资银行服务或其他服务。 本报告仅向特定客户传送,未经德邦证券研究所书面授权,本研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件 或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为 本公司的商标、服务