行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

申万宏源AI研究二十讲多模态模型

2026-07-04 未知机构洪雁

多模态及AI视频生成赛道发展历程：多模态模型自2021年CLIP发布起发展，2023-2026年视频生成模型集中爆发，原生多模态较后接视觉模块优势显著。
行业技术迭代与竞争格局：当前AI视频生成模型迭代周期为1季度至半年，无厂商长期领先，2026年6月榜单前五包含谷歌Gemini3.1Flash、字节可灵2.0等，主流采用Diffusion+Transformer架构，行业处于从可用到好用阶段。
字节可灵阶段性突破与市场表现：字节可灵2.5实现30秒视频输出、50张以上参考图支持的突破，阶段性领先但同行或2-3个月内追上，2026年7月其ARR接近6亿元，估值180亿元。
市场规模与算力需求：AI视频B端渗透率达20%-30%对应千亿级市场，算力需求指数级增长。

报告封面

点击免费查看完整报告

你可能感兴趣

【财联社早知道】华为申请AI模型处理专利，以提高AI模型在存储和传输方面的机密性，这家公司参股企业是业界领先的多模态AI行业大模型与算法服务提供商；这家公司已获得腾讯新“游元梦之星 IP授权

未知机构2023-12-13

传媒行业点评报告：多模态模型再迎新突破，继续布局AI应用及算力

文化传媒开源证券2024-02-17

传媒行业周观察（20250331-20250404）：多模态模型、AI端侧、Agent方向催化频出，清明档大盘略平淡

文化传媒华创证券2025-04-06

AI动态汇总：谷歌推出Gemini Robotics On-Device大模型，快手开源keye-VL多模态模型

中邮证券2025-07-02

计算机行业：字节全新发布豆包AI视频模型，AI多模态有望迎来爆发期

信息技术国信证券2024-09-25

AI专题：opa推出多模态模型GPT-4V，加速AI应用发展

信息技术国信证券2023-09-26

传媒行业：海外AI再度加速：多模态模型突破与应用革新

文化传媒信达证券2024-02-18

互联网传媒行业周报周观点：字节、阿里推出图生视频AI生成器，谷歌上线多模态AI模型Gemini1.0

信息技术上海证券2023-12-11

通信行业周报：最强AI模型Gemini正式发布，多模态应用前景广阔

信息技术上海证券2023-12-14

AI产业跟踪：商汤发布并开源NEO原生多模态模型架构，实现视觉、语言深层统一

信息技术国泰海通证券2025-12-10