传媒2024年06月07日 AI产品测评体验系列报告 推荐 (维持) 快手可灵:国产首发对标Sora的DiT架构文生视频AI模型 ❑快手可灵是快手于2024年6月6日推出的一款AI视频生成大模型的AI视频。可灵为快手AI团队自研,基于快手在视频技术方面的多年积累,采用类似Sora的DiT技术路线,结合多项自研技术创新,效果对标Sora。 华创证券研究所 证券分析师:刘欣电话:010-63214660邮箱:liuxin3@hcyjs.com执业编号:S0360521010001 ❑从技术角度看,快手可灵结合多项自研技术创新,采用了原生的文生视频技术路线,替代了图像生成+时序模块的组合,实现了可灵生成时间长、帧率高,能准确处理复杂运动的能力。在完成度上,能够模拟物理世界特性,完成大幅度的合理运动;在创新度上,具备强大的概念组合能力和想象力,能够将用户丰富的想象力转化为具体的画面;在参数表现上,不仅支持生成长达2分钟的30fps且具备1080p分辨率的超长视频,同时支持多种宽高比。 行业基本数据 占比%股票家数(只)1420.02总市值(亿元)12,270.011.41流通市值(亿元)10,952.731.61 ❑从功能体验看,快手可灵大模型具备强大的视频生成能力让用户可以轻松高效地完成艺术视频创作,通过文字描述,可灵生成的视频可实现1)大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律,复杂、大幅度的时空运动也能准确刻画;2)长达2分钟的视频生成:得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps;3)模拟物理世界特性:基于自研模型架构及ScalingLaw激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频;4)强大的概念组合能力:基于对文本-视频语义的深刻理解和Diffusion Transformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实的世界;5)电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现;6)支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需要。 %1M6M12M绝对表现-13.5%-25.7%-35.8%相对表现-11.7%-31.4%-30.1% ❑从行业视角看,快手作为头部短视频公司积极布局AI,其产品表现不仅展现了快手在AI大模型技术方面的深厚积累,也体现了国产AI视频模型的技术能力。我们看好AI技术持续迭代,中国厂商技术加速追赶,看好AI视频应用加速发展与商业化探索,看好内容创作的门槛降低。 相关研究报告 《AI产品测评体验系列报告:PixVerse:国内AI视频生成工具先锋》2024-06-05《传媒行业周观察(20240527-20240531):腾讯推出AI助手App“元宝”,传媒关注AI与估值修复机会,港股继续看好边际向好个股》2024-06-02《传媒行业重大事项点评:腾讯正式发布AI助手APP「元宝」,看好AI产业应用侧景气度提升》2024-06-01 ❑风险提示:政策监管趋严,AI技术迭代发展不及预期,AI产品商业化不及预期。 目录 一、产品简介...........................................................................................................................4 二、功能体验...........................................................................................................................4 (一)大幅度的合理运动...............................................................................................4(二)长达2分钟的视频生成.......................................................................................4(三)模拟物理世界特性...............................................................................................5(四)强大的概念组合能力...........................................................................................6(五)电影级的画面生成...............................................................................................6(六)支持自由的输出视频宽高比...............................................................................7 三、风险提示...........................................................................................................................7 图表目录 图表1宇航员在月球上奔跑的画面,动作流畅,步态和影子的运动合理恰当.................4图表2仅依靠提示词“小男孩在花园里骑自行车经历秋冬春夏四季变换”,即可生成长达一分半的长视频.................................................................................................................5图表3小男孩吃汉堡的生成视频中,吃汉堡的过程被真实反映,咬合位置与汉堡上的咬痕匹配,脸部肌肉动态逼真.............................................................................................5图表4对于猫咪开着车的充满想象力的场景,逼真展现....................................................6图表5生成视频分辨率高达1080p.........................................................................................6图表6同一个视频支持自由的高宽比,其中包括快手原生态的竖版视频.........................7 一、产品简介 快手可灵是快手于2024年6月6日推出的一款AI视频生成大模型的AI视频。可灵为快手AI团队自研,基于快手在视频技术方面的多年积累,采用类似Sora的DiT技术路线,结合多项自研技术创新,效果对标Sora,具有一系列优势:1)能够生成大幅度的合理运动;2)能够模拟物理世界特性;3)具备强大的概念组合能力和想象力;4)生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。(部分功能效果尚未对外开启使用测试) 二、功能体验 根据可灵官网,可灵大模型具备强大的视频生成能力让用户可以轻松高效地完成艺术视频创作,通过文字描述,可灵生成的视频可实现: (一)大幅度的合理运动 可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律,复杂、大幅度的时空运动也能准确刻画。 (二)长达2分钟的视频生成 得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。 资料来源:快手可灵官网 (三)模拟物理世界特性 基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。 图表3小男孩吃汉堡的生成视频中,吃汉堡的过程被真实反映,咬合位置与汉堡上的咬痕匹配,脸部肌肉动态逼真 资料来源:快手可灵官网 (四)强大的概念组合能力 基于对文本-视频语义的深刻理解和Diffusion Transformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实的世界。 资料来源:快手可灵官网 (五)电影级的画面生成 基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。 资料来源:快手可灵官网 (六)支持自由的输出视频宽高比 可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需要。 三、风险提示 1、政策监管趋严;2、AI技术迭代发展不及预期;3、AI产品商业化不及预期; 传媒组团队介绍 组长、首席研究员:刘欣 中国人民大学硕士。先后于中金公司(2015-2016)、海通证券(2016-2019)、民生证券(2019-2020),从事TMT行业研究工作。所在团队2016/2017年连续两年获得新财富最佳分析师评选文化传媒类第三名,2016年水晶球评选第三名,2016年金牛奖第三名,2017年水晶球第五名,2017证券时报金翼奖第一名,2019年获得WIND第七届金牌分析师评选传播与文化类第五名等。 联席首席研究员:廖志国 莫纳什大学硕士。2021年加入华创研究所。 助理研究员:吴婧 上海交通大学硕士,2023年加入华创证券研究所。 研究员:郭子萱 哥伦比亚大学硕士。曾任职于瑞银证券,2023年加入华创证券研究所。 分析师:刘文轩 威斯康星大学麦迪逊分校硕士,2024年加入华创研究所,曾任职于德邦研究所。2023年所在团队获得21世纪金牌分析师传媒互联网第五名,港股及海外市场第五名。 研究员:赵海楠 复旦大学硕士。曾任职于浙商证券研究所,2023年所在团队获得Wind第11届金牌分析师传媒第二名。2024年加入华创证券研究所。 华创证券机构销售通讯录 华创行业公司投资评级体系 基准指数说明: A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标普500/纳斯达克指数。 公司投资评级说明: 强推:预期未来6个月内超越基准指数20%以上;推荐:预期未来6个月内超越基准指数10%-20%;中性:预期未来6个月内相对基准指数变动幅度在-10%-10%之间;回避:预期未来6个月内相对基准指数跌幅在10%-20%之间。 行业投资评级说明: 推荐:预期未来3-6个月内该行业指数涨幅超过基准指数5%以上;中性:预期未来3-6个月内该行业指数变动幅度相对基准指数-5%-5%;回避:预期未来3-6个月内该行业指数跌幅超过基准指数5%以上。 分析师声明 每位负责撰写本研究报告全部或部分内容的分析师在此作以下声明: 分析师在本报告中对所提及的证券或发行人发表的任何建议和观点均准确地反映了其个人对该证券或发行人的看法和判断;分析师对任何其他券商发布的所有可能存在雷同的研究报告不负有任何直接或者间接的可能责任。 免责声明 本报告仅