您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[浦银国际]:AIGC行业趋势:Sora横空出世,向多模态应用加速迈进 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC行业趋势:Sora横空出世,向多模态应用加速迈进

文化传媒2024-02-22赵丹、杨子超浦银国际杨***
AIGC行业趋势:Sora横空出世,向多模态应用加速迈进

互联网行业 | 行业追踪 本研究报告由浦银国际证券有限公司分析师编制,请仔细阅读本报告最后部分的分析师披露、商业关系披露及免责声明。 AIGC行业趋势:Sora横空出世,向多模态应用加速迈进 近期,OpenAI的Sora的横空出世再一次引发市场对AIGC的关注,文生视频领域取得重大突破,效果远超预期。我们将围绕Sora的核心优势、技术特点、行业影响、未来趋势等方面进行阐述。 相较于此前的文生视频模型,Sora取得哪些突破? 近期,OpenAI发布了文生视频模型Sora,可以用文字指令生成长达1分钟的高清视频。相较于此前市场上的同类模型,如Runway、Pika等,Sora的生成效果有大幅提升,远超预期:  首先,视频长度方面,Sora可以生成长达60秒的视频,长度远远大于其他AI视频模型的几秒钟长度。  其次,Sora在视频内容质量稳定性方面有大幅的提升,镜头多角度切换,视频中的主角和背景能够保持高度一致性和稳定性。  此外,Sora还展示了其对物理世界部分规律的理解,这也是一重大突破,甚至能够实现一定程度的物理交互。 Sora的核心优势和技术特点体现在哪些方面? Sora的技术优势在于“Patches”和深度语言理解。Sora是一个在不同时长、分辨率和宽高比的视频及图像上训练而成的扩散模型,同时采用了Transformer架构。Sora模型的技术优势和特点主要在于:  视觉数据Patches化:相较于大语音模型把所有的文本、符号、代码都抽象为Tokens,Sora则把视频抽象为Patches(补片),是一种具备高度扩展性且适用于视频和图片生成式模型训练的有效表示(图表1);  视频压缩网络(Video compression network):将原始视频进行压缩,从而降低视觉数据维度,用于训练并生成视频;  时空补片技术(Spacetime latent patches):给定一个压缩的输入视频,模型提取一系列时空补片(patches),用于对不同分辨率、时长和长宽比的视频和图像进行训练;  扩展Transformer视频生成:Sora是一个扩散Transformer模型,通过输入噪声patches训练来预测除噪的原始patches。OpenAI在这项研究中发现,扩散型Transformer同样能在视频模型领域中完成高效扩展(图表2);  视频多样化:相较于一些模型使用标准尺寸视频用于训练或生成,Sora能够处理不同分辨率、时长、宽高比的视频,在采样灵活性、改进框架和构图方面有显著优势;  语言理解:基于GPT模型的深度语言理解,能够更加准确地理解提示词所表达的真实需求;  图生视频、视频生视频:除了文生视频外,Sora也能够通过输入图像和视频用于生成视频,能够实现静态图片动态化、视频向前和向后拓展、视频编辑等能力(图表3)。 浦银国际 行业追踪 AIGC行业趋势 赵丹 首席互联网分析师 dan_zhao@spdbi.com (852) 2808 6436 杨子超,CFA 互联网分析师 charles_yang@spdbi.com (852) 2808 6409 2024年2月21日 扫码关注 浦银国际研究 互联网行业 | 行业追踪 本研究报告由浦银国际证券有限公司分析师编制,请仔细阅读本报告最后部分的分析师披露、商业关系披露及免责声明。 Sora模型对哪些行业影响更大? Sora最直接的影响主要是对视频行业造成冲击,这将对于广告业、电影预告片、短视频行业以及游戏带来颠覆。Sora大大降低了视频制作的门槛和成本。  对于国内AI创业公司的影响:和ChatGPT一样,我们认为Sora的出现也会吸引国内玩家追随,但由于文生视频模型的训练难度和成本更大,准入门槛也进一步提高。  Sora影响最大的将是短视频行业,未来或将极大地提升内容供给及创作质量,尤其是流量热点驱动的内容,或将进入“全民创作”时代。同时,文生视频技术或将为当下热门的短剧市场带来变数,短剧重心有望回归高质量剧本创作。  长视频由于对内容质量等专业化要求较高,AI生成视频在精准度、可编辑性等方面仍需进一步打磨,高额的成本也或是短期应用落地阻碍,但长期来看其未来发展空间足够广阔。  对于游戏行业,Sora模型有助于进一步提高开发效率。文生视频能力可降低游戏CG和PV制作成本,可用于丰富游戏剧情和故事情节,提升玩家代入感。  视频相较于文字而言,对于算力的需求将会是几何式的增长。我们认为算力限制可能是影响文生视频类应用开放使用的重要因素。 2024年AIGC行业有哪些趋势? 多模态模型或在2024年迎来爆发。此前大模型在各个领域的应用,主要集中在文生文、文生图之上,而在文生视频领域却进步缓慢。此次文生视频模型Sora的发布,将给长短视频,游戏和广告行业带来颠覆性创新。随着文生图、图片对话技术的成熟,文生视频已成为多模态大模型下一步发展的重点。大模型领域的竞争将进一步白热化,多模态大模型将成为生成式AI的重点发展方向,并有望推动本轮AI行情进一步扩散。 除了在计算机视觉、自然语言处理等特定领域模型的发展,多模态大模型的进一步交叉融合或将成为未来重要的应用方向。未来人与机器之间的交互方式将更加丰富,或通过文字、视觉、语音等多维度沟通,进而提升效率。AI所创造的虚拟世界与现实世界的边界逐渐模糊,逐渐向AGI方向迈进。 投资风险:行业监管,内容合规,成本控制,商业模式。 2024-02-21 3 图表 1:视频数据Patches化 资料来源:OpenAI、浦银国际 图表 2:扩散Transformer模型训练生成视频 资料来源:OpenAI、浦银国际 图表 3:静态图片生成视频 资料来源:OpenAI、浦银国际 2024-02-21 4 免责声明 本报告之收取者透过接受本报告(包括任何有关的附件),表示及保证其根据下述的条件下有权获得本报告,且同意受此中包含的限制条件所约束。任何没有遵循这些限制的情况可能构成法律之违反。 本报告是由从事证券及期货条例(香港法例第 571 章)中第一类(证券交易)及第四类(就证券提供意见)受规管活动之持牌法团–浦银国际证券有限公司 (统称“浦银国际证券”)利用集团信息及其他公开信息编制而成。所有资料均搜集自被认为是可靠的来源,但并不保证数据之准确性、可信性及完整性,亦不会因资料引致的任何损失承担任何责任。报告中的资料来源除非另有说明,否则信息均来自本集团。本报告的内容涉及到保密数据,所以仅供阁下为其自身利益而使用。除了阁下以及受聘向阁下提供咨询意见的人士(其同意将本材料保密并受本免责声明中所述限制约束)之外,本报告分发给任何人均属未授权的行为。 任何人不得将本报告内任何信息用于其他目的。本报告仅是为提供信息而准备的,不得被解释为是一项关于购买或者出售任何证券或相关金融工具的要约邀请或者要约。阁下不应将本报告内容解释为法律、税务、会计或投资事项的专业意见或为任何推荐,阁下应当就本报告所述的任何交易涉及的法律及相关事项咨询其自己的法律顾问和财务顾问的意见。本报告内的信息及意见乃于文件注明日期作出,日后可作修改而不另通知,亦不一定会更新以反映文件日期之后发生的进展。本报告并未包含公司可能要求的所有信息,阁下不应仅仅依据本报告中的信息而作出投资、撤资或其他财务方面的任何决策或行动。除关于历史数据的陈述外,本报告可能包含前瞻性的陈述,牵涉多种风险和不确定性,该等前瞻性陈述可基于一些假设,受限于重大风险和不确定性。 本报告之观点、推荐、建议和意见均不一定反映浦银国际证券的立场。浦银国际控股有限公司及其联属公司、关联公司(统称“浦银国际”)及/或其董事及/或雇员,可能持有在本报告内所述或有关公司之证券、并可能不时进行买卖。浦银国际或其任何董事及/或雇员对投资者因使用本报告或依赖其所载信息而引起的一切可能损失,概不承担任何法律责任。 浦银国际证券建议投资者应独立地评估本报告内的资料,考虑其本身的特定投资目标、财务状况及需要,在参与有关报告中所述公司之证劵的交易前,委任其认为必须的法律、商业、财务、税务或其它方面的专业顾问。惟报告内所述的公司之证券未必能在所有司法管辖区或国家或供所有类别的投资者买卖。对部分的司法管辖区或国家而言,分发、发行或使用本报告会抵触当地法律、法则、规定、或其它注册或发牌的规例。本报告不是旨在向该等司法管辖区或国家的任何人或实体分发或由其使用。 美国 浦银国际不是美国注册经纪商和美国金融业监管局(FINRA)的注册会员。浦银国际证券的分析师不具有美国金融监管局(FINRA)分析师的注册资格。因此,浦银国际证券不受美国就有关研究报告准备和分析师独立性规则的约束。 本报告仅提供给美国1934年证券交易法规则15a-6定义的“主要机构投资者”,不得提供给其他任何个人。接收本报告之行为即表明同意接受协议不得将本报告分发或提供给任何其他人。接收本报告的美国收件人如想根据本报告中提供的信息进行任何买卖证券交易,都应仅通过美国注册的经纪交易商来进行交易。 英国 本报告并非由英国2000年金融服务与市场法(经修订)(「FSMA」)第21条所界定之认可人士发布,而本报告亦未经其批准。因此,本报告不会向英国公众人士派发,亦不得向公众人士传递。本报告仅提供给合资格投资者(按照金融服务及市场法的涵义) ,即(i)按照2000年金融服务及市场法2005年(金融推广)命令(「命令」)第19(5)条定义在投资方面拥有专业经验之投资专业人士或(ii)属于命令第49(2)(a)至(d)条范围之高净值实体或(iii)其他可能合法与之沟通的人士(所有该等人士统称为「有关人士」)。不属于有关人士的任何机构和个人不得遵照或倚赖本报告或其任何内容行事。 本报告的版权仅为浦银国际证券所有,未经书面许可任何机构和个人不得以任何形式转发、翻版、复制、刊登、发表或引用,浦银国际证券对任何第三方的该等行为保留追述权利,并且对第三方未经授权行为不承担任何责任。 权益披露 1) 浦银国际并没有持有本报告所述公司逾1%的财务权益。 2) 浦银国际跟本报告所述公司在过去 12 个月内并没有任何投资银行业务的关系。 3) 浦银国际并没有跟本报告所述公司为其证券进行庄家活动。 2024-02-21 5 评级定义 证券评级定义: “买入”:未来12个月,预期个股表现超过同期其所属的行业指数 “持有”:未来12个月,预期个股表现与同期所属的行业指数持平 “卖出”:未来12个月,预期个股表现逊于同期其所属的行业指数 行业评级定义(相对于MSCI中国指数): “超配”:未来12个月优于MSCI中国10%或以上 “标配”:未来12个月优于/劣于MSCI中国少于10% “低配”:未来12个月劣于MSCI中国超过10% 分析师证明 本报告作者谨此声明:(i)本报告发表的所有观点均正确地反映作者有关任何及所有提及的证券或发行人的个人观点,并以独立方式撰写;(ii)其报酬没有任何部分曾经,是或将会直接或间接与本报告发表的特定建议或观点有关;(iii)该等作者没有获得与所提及的证券或发行人相关且可能影响该等建议的内幕信息/