您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰海通证券]:可灵专题报告:全球 AIGC 视频商业化加速,可灵打通技术-生态-变现闭环释放长期价值 - 发现报告

可灵专题报告:全球 AIGC 视频商业化加速,可灵打通技术-生态-变现闭环释放长期价值

2026-01-26秦和平、高翩然国泰海通证券曾***
AI智能总结
查看更多
可灵专题报告:全球 AIGC 视频商业化加速,可灵打通技术-生态-变现闭环释放长期价值

快手-W(1024)[Table_Industry]传播文化业 快手可灵专题报告 本报告导读: 可灵通过2.5 Turbo(基础能力升级)-O1(全模态与成片能力突破)-2.6(音画一体化革命)的阶梯式迭代,完成从“高质量视频生成”到“重构AI视频创作工作流”的技术升级。 投资要点: 生成式AI行业进入高景气扩张周期,AIGC生产工具加速渗透。自上而下来看,25年全球视频流媒体收入为2146亿美元,假设AI视频渗透率10%,技术替代溢价率1.2,则AI视频TAM达250亿美元。自下而上来看,将AI视频的用户群体分为B端企业(营销、培训、电商等)、C端创作者(短视频博主、自媒体等)、专业机构(影视制作、广告公司等),中性假设下AI视频TAM达218亿美元。长期看,随着新模型技术突破、算力成本下行,To C内容平台有望凭借用户规模效应与场景延展性,实现市场规模的指数级增长。 多强竞争快速迭代,AIGC视频生成进入“通用模型vs垂直能力vs平台生态”分化阶段。参考Artificial analysis,Kling 2.5 Turbo 1080p分别在图/文生视频榜单中排名第二/一,高性能&高性价比优势突出。与其他模型相比,可灵以“音画同出”一体化生成、中文语境精准理解及强可干预性为核心标签,支持角色级声音一致性与低成本批量生成。虽单次基础生成时长较短,但通过多次延展可满足中长内容需求,且端到端生成速度与性价比优势显著。适配电影预演、广告分镜、游戏CG等专业商用场景,专业用户贡献超70%收入。 线上营销持续回暖,坚定投入AI战略2025.11.20电商直播略超预期,AI全面赋能2025.08.23业绩增长稳健,可灵AI商业变现提速2025.06.03 可灵打通“技术-生态-变现”闭环,释放长期价值。25Q1-Q3,可灵收入分别为1.5/2.5/3亿人民币。25年12月,可灵当月收入突破2000万美元,对应年化收入运行率(ARR)达2.4亿美元。截止25年底,可灵AI已在全球拥有6000万创作者,累计生成超6亿个视频,累计合作超3万家企业用户,长期商业化价值凸显。 风险提示:研发不及预期风险,商业化变现不及预期,行业竞争加剧,内容成本上涨,版权风险等。 目录 1.AIGC视频生成技术在竞争周期中加速跃迁................................................31.1.AIGC:从创作工具向内容产业核心生产力的结构性跃迁...................31.2.生成式AI行业进入高景气扩张周期,AIGC生产工具加速渗透........52.多强竞争快速迭代,AIGC视频生成进入“通用模型vs垂直能力vs平台生态”分化阶段......................................................................................................73.可灵打通“技术-生态-变现”闭环,释放长期价值..................................104.盈利预测与估值............................................................................................145.风险提示........................................................................................................15 1.AIGC视频生成技术在竞争周期中加速跃迁 1.1.AIGC:从创作工具向内容产业核心生产力的结构性跃迁 AIGC(生成式人工智能,AI Generated Content)正从辅助创作工具加速迈向内容产业的核心生产力。以深度学习和多模态大模型为基础,AIGC已形成“图像生成—视频生成—音频生成”的多模态感官内容生产技术体系,实现从静态视觉到动态视觉、再到听觉的全链路自动化内容生产。根据信通院白皮书,AIGC的技术演进已历经规则模板驱动、深度学习驱动两大阶段,当前进入以跨模态理解与生成为核心的大模型时代。这一阶段的模型具备对现实世界语义、物理规律与艺术风格的统一建模与表达能力,显著重构内容生产链路,推动行业创作成本与准入门槛大幅下降。 数据来源:中国信息通信研究院 在需求端,传媒、电商、广告与影视等行业对高效率内容供给的需求持续提升,使AIGC成为缓解内容供给紧张的结构性供给侧工具。在技术端,扩散模型、Transformer、多模态大模型的突破显著提升了生成质量与可控性,其中视频生成因涉及运动一致性、物理模拟与长序列建模,是行业中技术难度最高、商业价值最明确的环节。 数据来源:《基于生成式人工智能的图像视频生成方法综述和展望》 数据来源:《ControllableVideo Generation:A Survey》 2024年全球视频生成模型进入集中发布期,行业从图像生成全面转向视频生成,模型能力快速提升成为科技公司核心竞争方向。OpenAI、Google、Runway、Luma、字节、快手、MINIMAX等头部厂商在时长、清晰度、动作一致性与生成速度等关键指标上持续突破,视频生成的“商用化门槛”显著下降。集中式产品迭代表明:视频大模型已成为全球科技公司继通用大模型后的新一代技术主战场。视频内容的商业价值显著高于图像,且需求结构性增长,使视频生成能力成为平台提升生产效率与内容供给的关键切入点。 1.2.生成式AI行业进入高景气扩张周期,AIGC生产工具加速渗透 生成式AI(从大规模数据集中的模式和结构中学习,根据用户输入生成新的内容)行业已进入快速扩张通道。参考弗若斯特沙利文数据,按收入口径测算,全球生成式AI市场规模预计2029年达952亿美元,2024–2029年复合增长率为37.3%。长期增长动能来自于模型能力持续进化、多模态内容需求扩张以及企业与创作者端应用的不断深化。 数据来源:弗若斯特沙利文,国泰海通证券研究 根据Grand View Research统计,2025年全球AI视频生成器市场规模预计为7.9亿美元,并有望在2033年增长至34.4亿美元,2026–2033年CAGR达20.3%。从需求侧拆分,2025年解决方案细分市场和服务细分市场的规模占比分别为63%/37%。大型企业客户贡献约62%的收入占比,显示当前行业主要由具备明确商业场景的视频生成需求所驱动。 从应用层面看,营销相关场景占据最大规模;社交媒体相关场景预计在预测期内实现显著增长,进一步验证AI视频生成在内容分发与商业传播中的核心价值。从区域结构看,2025年亚太地区以31%的收入占比位居首位。作为全球人口第一大区域,亚太地区拥有高互联网渗透率,区域内中小企业数量持续增长、社交媒体用户基数不断扩大,催生了对优质视频内容的刚性需求。与此同时,亚太地区AI初创企业数量显著增加,AI工具的应用率也实现大幅提升。 数据来源:GrandviewResearch 数据来源:GrandviewResearch 自上而下分析,参考Omdia数据,2025年全球视频流媒体收入为2146亿美元,年增长率为12.8%。若假设AI视频渗透率为10%,技术替代溢价率为1.2,则AI视频TAM(可触达市场规模)约为250亿美元。 自下而上分析,将AI视频的用户群体分为B端企业(营销、培训、电商等)、C端创作者(短视频博主、自媒体等)、专业机构(影视制作、广告公司等)。初步加总以下三者的市场规模,则中性假设下AI视频TAM为218亿美元。 1)针对B端企业,参考世界经济论坛数据,全球中小企业数量约3.6亿家。假设10%有视频需求,年付费意愿为400美元一年,则B端细分市场规模为144亿美元。 2)针对C端创作者,参考Demandsage数据,全球内容创作者约2亿人。假设付费渗透率为20%,年付费25美元,则C端细分市场规模为10亿美元。 3)针对专业机构,参考IBIS World数据,全球大型制作公司及广告代理商约8万家。假设传统制作成本替代率为40%,平均制作成本为20万美元,则专业机构细分市场规模为64亿美元。 当前阶段,技术成熟度不足(如长视频连贯性、画面可控性待提升)、消费级使用门槛较高、单位生成成本偏高等因素,导致ToC市场尚未进入规模化爆发的拐点。随着新模型技术突破,叠加开源生态推动的算力成本下行, 长期来看,To C市场的增长天花板远高于To B:全球近57亿社交媒体用户构成的庞大基数,叠加AI技术持续降低创作门槛后,普通用户的UGC内容创作需求将被全面激发,从生活记录到创意表达的多元化场景有望催生海量增量需求。相较于B端有限的商业场景天花板,To C内容平台有望凭借用户规模效应与场景延展性,实现市场规模的指数级增长,成为AI生成视频行业最具想象空间的核心赛道。 2.多强竞争快速迭代,AIGC视频生成进入“通用模型vs垂直能力vs平台生态”分化阶段 参考Artificial analysis数据,文生视频榜单中,Runway Gen-4.5、Kling 2.5Turbo 1080p、Veo 3(No Audio)、Sora 2Pro(No Audio)、Ray 3位居前列;图生视频榜单中,Kling 2.5 Turbo 1080p、Veo 3.1 Fast Preview(No Audio)、PixVerse V5、Hailuo 02 Pro、Seedance 1.5 pro(No Audio)位居前列。对比各自的API定价,可以发现快手、MiniMax、字节旗下的国产模型性价比突出。 海外模型对比方面,功能特征上,①OpenAI的Sora以长时视频生成(支持25秒高清内容,可延展至更长时长)、多模态交互灵活性及影视级动态细节还原为核心优势,擅长复杂叙事与场景构建。但存在指令执行易混乱、运镜逻辑不稳定的局限,且尚未完全开放商用。②谷歌Veo 3.1聚焦光影效果优化与生成效率提升,支持720p/1080p分辨率及最长148秒视频延展,具备原生音画同步与对象级编辑能力,缺乏自定义语音与角色声线固化功能,技术升级多集中于工具性补充。③Runway以功能全面性为亮点,深耕影视后期全流程工具链,支持视频重剪辑、绿幕合成及多帧修改,专业级编辑能力突出。④可灵以“音画同出”一体化生成、中文语境精准理解及强可干预性为核心标签,支持角色级声音一致性与低成本批量生成。虽单次基础生成时长较短,但通过多次延展可满足中长内容需求,且端到端生成速度与性价比优势显著。 适用场景上,①Sora更适合影视级长视频创意探索、概念预演等前沿场景,面向专业创作团队的创意发散需求。②Veo3.1适配对视觉风格稳定性、光影质感有高要求的商业广告、品牌素材制作场景,服务追求高效产出的专业用户。③Runway主打影视工业级动态分镜设计、后期剪辑优化等场景,成为好莱坞等专业影视团队的辅助工具。④可灵深度契合国内短视频营销、电商素材制作、本地化内容创作等场景,依托快手短视频、电商生态实现内容生成-分发-转化的闭环。同时凭借高性价比与中文适配性,覆盖中小创作者与中小企业的批量生产需求,形成差异化竞争壁垒。 国内模型对比方面,功能特征上,①可灵以3D感知控制与影视级质感为核心标签,凭借CineMaster框架实现目标-相机联合控制,支持复杂物理模拟与多模态编辑,在角色运动准确率、镜头切换流畅度上达专业水准。同时依托快手生态实现内容生成-分发闭环,性价比与商用稳定性均衡。②即梦聚焦数字人情感表演与多场景适配,通过OmniHuman模型实现单图+音频驱动的情绪动作同步,支持多人互动、节奏性表演及多模态细节调控。操作门槛低且本土适配性强,免费额度充足。③海螺以高帧率输出与低成本优势突围,实现1080P/30fps高清生成,角色情感