AI智能总结
从工具到社交生态,Sora 2引领AI多模态转型 行业投资评级:强于大市|维持 陈涵泊/李佩京/王思中邮证券研究所人工智能团队 中邮证券 发布时间:2025-10-10 投资要点 Sora双箭齐发:2代铸就创意里程碑,App解锁AI社交新形态。 9月30日凌晨,OpenAI Sora 2正式发布,相较早期Sora文生视频模型,Sora 2改善早期Sora音频与画面往往不同步、物理运动不够真实、人物连贯性不足等问题,实现创意领域的“ChatGPT时刻”。OpenAI同步推出一款名为Sora APP,上线第四天拿下了苹果美国应用商店App Store的免费应用榜第一名,并引入“客串”和“混剪”功能,发展AI+社交新模式。 我们认为,OpenAI推出Sora APP这一平台性产品,本质上是从“单一对话工具”(ChatGPT)向“生态化社交平台”的核心战略转型。这一布局并非简单的功能延伸,而是针对AI产品增长逻辑的深层优化,标志着OpenAI从“AI工具提供商”向“AI生态构建者”的转变:通过Sora APP串联起“模型能力→用户场景→商业变现”的完整链路,既避免了因单一工具属性导致的增长乏力,更以“数据飞轮+社交网络”的双重护城河,巩固了在AI生成式内容领域的领先地位。 AI视频生成商业空间巨大,Sora创新IP生成新商业模式。 据Fortune business insights测算,2024年AI视频生成全球市场规模为6.15亿美元,预计2025年达到7.17亿美元,同比增长17%。预计到2032年,AI视频生成市场规模达到25.63亿美元,2025至2032年的复合增速为20%。 我们认为,Sora有望由APP平台主导,形成“IP+创作者”收入分成商业模型。OpenAI正在急速构建一个围绕视频生成的、由IP驱动的新生态系统。其核心两点为“精细化控制”和“收入分成”。这意味着,Sora将不再是简单的工具,而是一个连接IP方与全球亿万创作者的经济平台。 Sora有望持续AI算力“军备竞赛”,OpenAI不断宣布算力新合同。 Sora 2或带来AI多模态训推算力需求指数级增长。据Factorial Funds预测,训练Sora模型一个月可能需要使用4200到10500片英伟达H100 AI加速卡。而如果使用单片H100加速卡,则生成1分钟视频需要渲染12分钟。推理阶段,Sora每单位输出1分钟视频,GPT-4和LLama 2每单位输出1000个Token的文本,DiT每单位输出一张512x512px的图像,Sora的推理估计在计算上要多耗费几个数量级。 OpenAI启动超大规模算力扩张,8年内将算力能源需求或提升125倍。今年以来,OpenAI已签署了价值高达约1万亿美元的交易,从而获得运行人工智能模型的计算能力,这些协议的交易方包括AMD、英伟达、甲骨文和CoreWeave等,这些企业的利益也与OpenAI未来的盈利能力相绑定。 投资建议:建议关注:1)AI多模态,其在动态内容生成精度与场景适配性上的进阶持续打开应用边界;2)AI+IP领域,依托“IP+创作者”收入分成模式构建的生态系统有望催生商业价值爆发;3)AI Agent领域,基于多模态技术的精准指令执行与场景交互能力,在更多场景具备广阔落地空间;4)AI算力领域,受多模态模型训推阶段指数级需求及巨头算力扩张驱动,相关产业链将迎来强劲增长。具体投资标的见正文。 风险提示:地缘政治冲与贸易风险、技术迭代不及预期、算力供应不及预期、行业竞争加剧风险等。请参阅附注免责声明 Sora双箭齐发:2代铸就创意里程碑,App解锁AI社交新形态 二四一三 AI视频生成商业空间巨大,Sora创新IP生成新商业模式 目录 Sora有望持续AI算力“军备竞赛”,OpenAI不断宣布算力新合同 投资建议与风险提示 Sora双箭齐发:2代铸就创意里程碑,App解锁AI社交新形态 1.1Sora2:三大升级,创意领域的“ChatGPT时刻”1.2SoraApp:引入“客串”和“混剪”功能,为AI而生的社交新物种1.3商业破局:对话转社交+数据飞轮,盘活8亿WAU助价值变现 1.1 Sora 2:三大升级,创意领域的“ChatGPT时刻” 9月30日凌晨,OpenAI悄然投下一枚“核弹”——Sora 2正式发布。这不仅是一次技术升级,更是内容创作领域的地震级变革。CEO奥特曼激动地称之为“创意领域的ChatGPT时刻”,预言人类创造力即将迎来一次“寒武纪大爆发”。据OpenAI官方介绍,Sora 2模型能够生成“高度逼真”的场景与音效,是2024年2月OpenAI首次发布Sora模型以来的一次重要技术升级。 相较早期Sora文生视频模型,Sora 2改善早期Sora音频与画面往往不同步、物理运动不够真实、人物连贯性不足等问题。 物理准确性提升:诸如流体、重力运动等此前难以模拟的物理现象,有了更真实表现。 一致性与可控性:在多个镜头或不同场景间保持人物、风格连续性,更好响应用户提示。 图表1:Sora 2相较早期Sora三大升级点 一致性与可控性 Sora 2在先前Sora基础上,实现以往视频模型难及的功能(更精准物理效果、清晰真实感、同步音频、强可控性、广风格范围),能精准遵指令创作兼具想象力与真实动态的视频,既拓展叙事和创意表达工具库,也向精准模拟物理世界复杂性的模型迈进。 奥运会体操动作 资料来源:OpenAI官网,中邮证券研究所 请参阅附注免责声明 1.2 Sora App:引入“客串”和“混剪”功能,为AI而生的社交新物种 OpenAI发布Sora 2的同时,同步推出一款名为“Sora by OpenAI”的iPhone应用,上线第四天拿下了苹果美国应用商店App Store的免费应用榜第一名,超越了OpenAI的ChatGPT和谷歌的Gemini。 目前,Sora仍处于邀请制测试阶段,仅在美国和加拿大地区的iOS设备上提供。尽管存在这些限制,Sora仍然登顶苹果美服应用排行榜。据应用情报提供商Appfigures的数据,在仅限美国和加拿大地区并采用邀请制的情况下,Sora的iOS应用程序于9月30日和10月1日上线后的头两天内,总计获得了16.4万次下载。从首日下载量来看,Sora尽管不及ChatGPT,但已经和xAI推出的Grok持平,不过考虑到Sora并未全面开放,其市场潜力可能更为巨大。 1.2 Sora App:引入“客串”和“混剪”功能,为AI而生的社交新物种 Sora APP提供客串(Cameos)和混剪(Remix)两大革命性功能,使得Sora不是简单的视频生成创造工具,而有望成为AI时代的TikTok,打造AI社交工具。 客串(Cameos):这是Sora最具革命性的功能。用户只需在应用内进行一次性的简短音视频录制,以验证身份并捕捉你的形象,Sora 2模型就能以惊人的保真度将用户上传的形象复刻。之后,用户进行形象授权,将用户的虚拟形象置入任何AI场景中,创建带有用户个人形象的“客串视频”。 混剪(Remix):内置的剪辑工具,只允许用户输入提示词,对平台上的任何视频和潮流进行「二创」,生成属于用户自己的版本。 我们认为,Sora APP的成功说明了大模型厂商之间的竞争已从过往简单的模型SOAT比拼升级至产品落地、商业变现等价值维度层面。Sora有望激活AI多模态竞争格局,加速Google、Meta等大厂技术跟进迭代AI+社交产品,创造AI多模态新蓝海市场。通过Cameo等功能,Sora巧妙地解决了AI+社交的难题,将重点放在熟人关系的低成本Remix共创上,而非单纯追求视频质量。这意味着,定义应用与产品的能力,其重要性正变得与构建模型同样重要。 1.3商业破局:对话转社交+数据飞轮,盘活8亿WAU助价值变现 10月7日,在OpenAI召开的DevDay上,Sora 2的API预览版已经正式发布,开发者现在可以直接在自己的产品内生成高质量视频。当前,已有400万名开发者使用OpenAI模型构建产品,超8亿人每周用ChatGPT,API每分钟处理60亿tokens。而2023年,OpenAI只有200万名每周活跃开发者,以及1亿名每周活跃用户。 我们认为,OpenAI推出Sora APP这一平台性产品,本质上是从“单一对话工具”(ChatGPT)向“生态化社交平台”的核心战略转型。这一布局并非简单的功能延伸,而是针对AI产品增长逻辑的深层优化,标志着OpenAI从“AI工具提供商”向“AI生态构建者”的转变:通过Sora APP串联起“模型能力→用户场景→商业变现”的完整链路,既避免了因单一工具属性导致的增长乏力,更以“数据飞轮+社交网络”的双重护城河,巩固了在AI生成式内容领域的领先地位。 AI视频生成商业空间巨大,Sora创新IP生成新商业模式 2.12032年AI视频生成市场规模有望达25.63亿美元2.2重塑视频产业商业机会,创作者和IP分成模式有望登场 2.1 2032年AI视频生成市场规模有望达25.63亿美元 现阶段,AI视频生成领域正在不断探索商业化路径,主要通过To C端和To B端两种服务模式实现商业化。To C端主要通过提供付费订阅服务,如快手可灵、字节即梦、智象未来(HiDream.ai)等,这些平台提供不同等级的订阅服务,如免费版、标准版、高级版、尊享版,价格为每月数元到数百元不等。To B端则主要通过API接口和解决方案服务,如快手可灵、生数科技、爱诗科技等,服务领域涵盖了影视、互联网、营销广告等,价格为每月数十元到数万元不等。 AI视频生成的市场规模有望进一步扩大,分领域看营销和广告市场份额最大,社交媒体领域增速最快。据Fortune business insights测算,2024年AI视频生成全球市场规模为6.15亿美元,预计2025年达到7.17亿美元,同比增长17%。预计到2032年,AI视频生成市场规模达到25.63亿美元,2025至2032年的复合增速为20%。分领域看,营销和广告部门占2024年最大的市场份额,这是由于AI视频生成的使用不断增加,以优化广告和营销内容的质量成本效益,采用AI视频内容生成工具还有助于提供高质量的视频,以满足目标受众的特定营销需求并增强品牌知名度;社交媒体部门将在预测期内以最高的速度增长,这是由于多媒体技术的使用日益增长的使用,例如深层假图像处理和自然语言处理,以生成更全面而引人入胜的视频内容并改善用户参与度。 2.2重塑视频产业商业机会,创作者和IP分成模式有望登场 OpenAI正在急速构建一个围绕视频生成的、由IP驱动的新生态系统。其核心就两点:“granular control(精细化控制)” 和 “revenue share(收入分成)”。这意味着,Sora将不再是简单的工具,而是一个连接IP方与全球亿万创作者的经济平台。 图表7:Sam Altma发文阐述Sora商业化思路 精细化控制:OpenAI将为版权方提供更细粒度的控制权,允许他们对角色生成进行更精确的管理,类似于“肖像同意”模型,但将加入更多控制选项。 收入分成:OpenAI计划尝试将一部分收入分享给那些希望用户生成自己角色的版权方。 我们认为,Sora有望由APP平台主导,形成“IP+创作者”收入分成商业模型。 对IP方(好莱坞、游戏大厂、日漫出版社):沉睡的IP资产库变成了可24小时开采的“油井”。不仅可以坐收授权费,更能借助全球创作者的脑洞,维持IP热度和生命力,甚至通过数据反馈(哪个角色、哪种风格最火)指导后续创作。 对创作者:终于可以合法、合规、低成本地使用蝙蝠侠、皮卡丘,甚至《三体》中的角色来创作视频。创作从“技术活”变成了“创意活”,核心能力从操作软件变为提示词工程和审美。更重要的是,你的爆款视频将能带来真金白银的平台分成。 请参