多模态AI:逐光前行,加速进击 传媒互联网行业2026年度中期投资策略 姓名方光照(分析师)证书编号:S0790520030004邮箱:fangguangzhao@kysec.cn 核心观点 1.全球多模态技术持续迭代,国产模型从追赶到局部超越,整体商业化提速 自2021年OpenAI DALL-E首次将大语言模型引入图像生成领域起,海外科技大厂、高校聚焦多模态技术持续迭代模型架构,多模态大模型生成内容质量、效率、成本不断优化。国内科技大厂快速追赶,并在视频生成、音频/音乐生成领域实现局部反超。技术成熟度提升及应用推广驱动AI原生应用ARR快速增长,Midjourney、快手可灵、ElevenLabsARR达数亿美元,Gemini对NanoBanana的引入助其MAU三个月内增加2亿。全球人才、资本聚集或推动多模态技术继续高速发展,模型商业化迎来广阔市场并有望提速 2.多模态大模型下游广泛,应用拓展或加速国产模型Token调用量/ARR增长 多模态大模型可深度赋能内容生产、营销、工业制造等,只要AI在工作流中创造价值高于Token成本,需求星辰大海。2026年头部模型Token调用量跃升,豆包3月实现两年千倍增长,智谱3月ARR同比增长60倍,年初以来增长6.4倍。对比OpenAI ARR超250亿美元、Anthropic ARR超440亿美元(较2025年底提升389%),我们认为国产模型商业化空间依然广阔;参考主流多模态大模型,单秒音频/单张图像/单秒视频对比单个文字,输入Token消耗量高1-2/3/2-3个量级,输出Token消耗量高1/2-3/4个量级,我们测算仅国内视频消费场景每日所需Token即有望达350万亿,看好应用拓展带动各模型收入延续高增长。重点推荐:腾讯控股、快手,受益标的:Minimax、阿里巴巴、智谱、昆仑万维。 3.多模态大模型深度赋能内容产业链,积极布局“AI+视频/游戏/营销”赛道 (1)视频:过去动漫/海外实拍等成本高,AI制片下单部短剧成本低至数万元。AI真人剧登顶红果热播总榜、入选戛纳展映,或反映AI内容已获观众认可;《三星堆:未来往事》获“龙标”标志AI电影上映跑通;“内容+成本”闭环或打开增量市场。重点推荐:阅文集团,受益标的:中文在线、德才股份、博纳影业。 (2)游戏:AI赋能研发全流程,技术门槛下降有助于分发平台/UGC生态游戏/开放世界游戏促成玩家向创作者的转化,打造“内容-用户”正循环。AI重塑交互体验,其中叙事类、社交竞技类游戏或率先受益。重点推荐:完美世界、网易、巨人网络、恺英网络、心动公司、哔哩哔哩,受益标的:世纪华通。 (3)营销:多模态大模型助广告系统实现深度个性化,以ChatGPT为代表的高CPM AI应用商业化加速,AI提效下内容激增将提升广告重要性,或共驱广告市场扩容。程序化广告技术领先及与头部AI应用公司合作紧密的营销公司或率先受益。重点推荐:汇量科技、引力传媒,受益标的:蓝色光标、易点天下。 4.多模态大模型加快渗透或进一步扩大算力缺口,算力租赁/AIDC或充分受益 供需失衡推高算力价格,2026Q1国内头部云厂商价格上涨5%-34%。多模态输入提升单位Token算力占用,应用发展或进一步扩大算力缺口。字节跳动/阿里巴巴/腾讯2025年资本开支同比增长88%/71%/3%,2026年算力投资力度加大,看好算力产业链公司。重点推荐:顺网科技,受益标的:华策影视、浙数文化。 5.风险提示:大模型迭代速度、AI应用商业化进展、算力投资力度不及预期等。 目录C O N T E N T S 全球多模态技术持续迭代,国产模型从追赶到局部超越 多模态AI商业化开启进击之路2 投资建议及风险提示 1.1全球多模态技术持续迭代,商业化逐步启动 海外模型厂商引领多模态技术升级,生成内容质量、效率、成本持续优化。科技大厂模型变现主要靠API调用收费及在已有APP中拓展AI相关功能带动活跃用户及ARPU提升,原生AI应用商业化程度有限。多模态AI各领域独角兽涌现,Midjourney 2022年7月发布beta版模型,截至2023年2月实现千万社区成员,营收破亿美元;Runway持续迭代视频模型,推动ARR由2022年底的100万美元提升至2026年的9000万美元;ElevenLabs及Suno深耕音频/音乐,2026年ARR分别破5/3亿美元。 1.2国产大模型厂商技术快速跟进,积极推进模型商业化 2026年,国产大模型在视频生成、音频/音乐生成领域居全球前列,截至5月14日,ArtificialAnalysis文生视频榜单前三模型分属于阿里巴巴、字节跳动、快手,而昆仑万维、MiniMax在音频领域全球领先。 商业化方面,快手、字节跳动结合旗下短视频平台探索视频生成模型变现,据晚点LatePost公众号,可灵2026年5月ARR已达5亿美元,比春节前翻倍。 1.2国产大模型厂商技术快速跟进,积极推进模型商业化 目录C O N T E N T S 全球多模态技术持续迭代,国产模型从追赶到局部超越 多模态AI商业化开启进击之路 投资建议及风险提示 2.1.1AI大模型:多模态大模型下游应用广泛,市场高速增长 图像生成领域,下游用户包括平面设计、影视、广告、电商等领域的专业创作者和个人爱好者,模型帮助其激发灵感并实质提升设计工作效率;视频生成领域,模型改变影视、短视频、短剧、广告、电商等行业工作流,允许一人工作室落地;音频生成领域,Al语音Agent在招聘、金融、医疗等场景的销售和客服中替代人力,在有声书教育、配音、游戏等场景提供贴近真人的语音能力。据前瞻产业研究院及PrecedenceResearch,2025-2030年全球及中国多模态大模型市场规模CAGR或分别达37%/67%。 2.1.2AI大模型:快手、字节跳动、阿里巴巴居视频生成模型第一梯队 快手可灵模型能力长期维持第一梯队,强调影视级质感(画质支持4K);字节跳动Seedance2.0、阿里巴巴HappyHorse1.0快速崛起,其中Seedance2.0的物理一致性、镜头调度能力广受好评,HappyHorse1.0的生成效率、简单场景生成质感领先;昆仑万维推出全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型。商业化上,可灵ARR已达5亿美元;Seedance2.0上线后,即梦入口多次“涨价”;昆仑万维以自研模型赋能短剧业务。 2.1.2AI大模型:图像、音频生成模型能力各有侧重 各公司主要基于自研模型与其他业务的协同效应选择发力方向,如阿里巴巴图像生成模型可编辑性强、文字输出准确、清晰度高,语音模型注重攻克客服场景痛点,可赋能淘系电商小B商家;MiniMax、昆仑万维模型生成内容“好听”,助力同公司旗下AI伴侣或音乐内容产品。 2.1.2AI大模型:腾讯、昆仑万维、阿里巴巴等布局世界模型 3D生成/世界模型方面,头部厂商模型均可生成720P、分钟级稳定世界,为游戏、自动驾驶、具身智能等场景应用奠定基础,其中对比主流世界模型仅能生成视频文件,腾讯HY-World2.0支持多格式3D资产导出,与现有的游戏工作流无缝对接。 2.1.3AI大模型:多模态大模型应用深化加速国产模型Token调用量/ARR增长 据火山引擎,豆包大模型日均Token调用量由2024年5月的1200亿增长千倍至2026年3月的120万亿,2月发布的Seedance 2.0视频模型加速Token调用量提升。智谱披露,截至2026年3月,APIARR已突破2.5亿美元,同比增长60倍,年初以来增长6.4倍。MiniMax披露2026年2月公司ARR超1.5亿美元,面向企业客户和个人开发者的开放平台产品2026年2月新注册用户数达2025年12月的4倍以上。2023年以来,Open AI、Anthropic收入增速持续提升,2026年5月,Anthropic ARR超440亿美元,比2025年底的90亿美元提升389%。对比海外大厂,我们认为,国产模型厂商多模态AI业务空间广阔,技术追赶及算力扩充有望推动Token调用量/ARR增长进一步加速。 资料来源:The Information 2.1.4AI大模型:多模态大模型应用拓展或显著拉升模型Token消耗量 参考主流多模态大模型,单秒音频/单张图像/单秒视频对比单个文字,输入Token消耗量高1-2/3/2-3个量级,输出Token消耗量高1/2-3/4个量级,我们测算仅国内视频消费场景每日所需Token即有望达350万亿。 资料来源:新闻世界公众号、特看观察公众号、火山引擎、东南传播公众号、《中国短视频发展研究报告(2025)》、开源证券研究所 2.1.5AI大模型:看好多模态模型发展带动各厂商Token调用量及收入高增 重点推荐:腾讯控股、快手,受益标的:Minimax、阿里巴巴、智谱、昆仑万维。 2.2.1AI视频:2025年国内短剧市场翻倍增长,海外短剧市场潜力初步释放 2025年中国短剧市场同比+98%,主要得益于免费微短剧市场的持续扩容(约占真人微短剧整体市场的2/3。2025年海外短剧收入23.8亿美元,同比+263%,其中AI短剧/漫剧市场规模仅1亿美元。 2.2.1AI视频:AI真人剧越过奇点,有望重塑海内外真人剧市场 我们认为AI真人剧内容质量已获观众认可。2026年4月《菩提临世真人AI版》超越系列真人短剧,连续数日登顶红果热播总榜;两部由中国团队、全AI制作的竖屏短剧《摸金之天机入梦》、《饿塔》入选第79届戛纳国际电影节FantasticPavilion官方展映单元。 AI大幅降本,据短剧自习室公众号,一部100分钟左右的短剧真人实拍成本普遍在50-100万元,头部精品项目成本可达200万元,而AI技术将单部短剧的制作成本下探至5-10万元。此外,AI降低塑造宏大世界观所需的复杂场景变换和特效设计成本,有效拓宽真人剧题材选择范围。针对海外市场本地化难题,AI翻译不仅贴合当地语言习惯与流行表达,成本也仅为人工翻译的10%,且AI制作视频成本仅为传统海外实景拍摄成本的20%。 2.2.1AI视频:二次元文化受众广泛,AI大幅提升漫剧产能 据DataEye短剧出海公众号,全球动画市场规模约4500亿美元,狭义动漫市场约400亿美元。AI赋能下,动漫制作成本由传统方式下数万元/分钟降低至0-1000元/分钟,据吉星文化,应用AI工具后单人生产效率提升10倍。视频模型进步有望推动漫剧市场高增,2026年3月,快手及字节漫剧日耗峰值加总达9000万元,考虑整体投放回报应高于费用,国内漫剧单日流水或已近亿元;据DataEye研究院预估,2026年海外AI剧/漫剧市场规模预计达6.5亿美元,同比实现6倍增长。 2.2.1AI视频:AI电影跑通上映路径,制作方式变革或创造电影行业新增长点 2026年4月,博纳影业耗时超2年出品制作的《三星堆:未来往事》正式获得国家电影局颁发的“龙标”,标志AI原生电影符合中国电影审查标准,可登陆院线。我们认为《三星堆:未来往事》上映仅是AI电影发展的起点,多模态大模型进步将持续推动AI电影成片效果、制作效率及成本优化,孕育行业机遇。 2.2.1AI视频:看好布局IP、AIGC工具、短剧分发平台及AI影视制作公司 我们认为,AI技术进步将持续提升优质视频产能,优质内容上线或有助于短剧分发平台聚拢更多流量并提升ARPU;短剧景气或吸引更多制作团队入局,AIGC工具作为“卖铲人”,或持续受益于下游行业增长;成熟IP能为短剧提供完备世界观与流量基础,价值或进一步凸显。重点推荐:阅文集团,受益标的:中文在线、德才股份、博纳影业。 2.2.2AI游戏:游戏行业供需两旺 供给侧,版号发放数量自2022年触底以来稳步回升,2026年1-4月国产游戏发放版号数为600个,同比增长2