证券研究报告|2024年04月29日 AIGC系列研究:多模态大模型引领,应用端曙光初现 行业研究·深度报告传媒·传媒 投资评级:超配(维持评级) 证券分析师:张衡021-60875160 zhangheng2@guosen.com.cnS0980517060002 证券分析师:陈瑶蓉021-61761058 chenyaorong@guosen.com.cnS0980523100001 底层大模型持续迭代,国产大模型加速应用走向成熟。年初以来海内外大模型特别是多模态大模型持续迭代,应用底层支持能力不断提升。1)海外方面,OpenAI在23年发布GPT4.0Turbo之后、年初发布文生视频大模型Sora;Google上线Gemini1.5,长文本、情景学习等能力大幅提升;Meta开源Llama3,多模态版本随后将上线;SunoAI引发产业界对音乐GPT时刻到来的畅想;2)国内方面,Kimi为代表的国产大模型长文本能力提升显著,阶跃星辰、商汤、昆仑万维等国内厂商纷纷发布全新能力的多模态大模型;3)国内大模型能力快速提升,以Kimi、阶跃星辰、秘塔等为代表的新势力鲇鱼效应带动之下,国产大模型从能力到应用进展均有望超预期推进。 C端场景持续泛化。1)海外市场Chatgpt用户数持续处于高位,Kimi、豆包、天工等为代表国产应用表现迅猛,Chatbots当前仍是使用最为广泛的场景应用;2)基于AIGC,利用自然语言处理、机器学习、深度学习等技术,对用户的搜索语句进行分析和理解,从而具备更加精准的搜索结果呈现形式的AI搜索引擎开始破圈成长,从海外的bing,到国内的秘塔、天工搜索等产品,从用户体验到商业变现可能均展现出较强的生命力;3)AI社交应用方面,海外的CharaceterAI,国内出海应用Talkie(MiniMax)、linky(昆仑万维),国内市场XEva(小冰)等均有不错表现;4)音乐及视频,OpenAI发布由Sora制作的MV—《Worldweight》,国外Suno、国内SkyMusic的音乐生成能力获得广泛受众。 国产厂商应用落地优势开始展现。1)Chatbot方面,ChatGPT用户数量仍有绝对优势、但国内内Chatbot访问量增长迅猛。文心一言、阿里通义千问、豆包等大厂产品用户量高位持续增长,新实力Kimi等增长迅猛、展现出更强生命力;2)增速上来看,3月份全球前十应用增速前十中一半为中国厂商,其中增速榜前二的秘塔、Kimi均为中小创业团队,印证国内更为活跃的应用创新活力;3)产品形态上,国内APP端增速表现迅猛、技术扩散之下国内应用端机会更为明确。 投资建议:从概念到落地,关注应用驱动下的传媒板块机会。1)科技进步是传媒行业成长以及二级市场超额收益的核心动力。从当前阶段来看:以AI为代表的第四次生产力革命已来并成为驱动传媒板块表现的核心驱动力;从概念到产品,在底层技术逐步成熟可用的背景下,从0到1的产品化、商业化正处在随时落地的奇点时刻,AIGC应用端驱动的板块投资机会值得期待;2)关注海内外应用落地映射,重点把握产品化、商业化落地关键环节核心标的:a)大模型、IP及数据:昆仑万维、中文在线、上海电影、浙数文化、奥飞娱乐、光线传媒、华策影视、捷成股份、视觉中国、掌趣科技等标的;b)多模态持续推进,场景落地关注AI+视频\营销\游戏等领域,建议关注恺英网络、三七互娱、掌趣科技、华策影视、盛天网络、紫天科技、奥飞娱乐、汤姆猫、巨人网络、盛天网络、蓝色光标、天娱数科、浙文互联等标的。 01 大模型持续迭代,加速应用走向成熟 02 03 C端场景持续泛化 国产厂商应用落地优势开始展现 04 从概念到落地,关注应用驱动下的传媒板块机会 1.大模型:海外引领,国内加速 OpenAI发布Sora引发产业与资本市场震动 OpenAI发布Sora文生视频模型,可以根据用户输入的文本描述,生成一段视频内容,视频时长可达1分钟且视觉质量较高。对于任何需要制作视频的艺术家、电影制片人或学生来说,这都带来了无限可能。 Sora可以创建包含多人、特定运动类型和详细背景的复杂场景。它能生成准确反映用户提示的视频。例如,Sora可以制作时尚女性走在霓虹闪烁的东京街头的视频、雪地里的巨型长毛象视频,甚至是太空人冒险的电影预告片。 图:GPT4多模态 图:Sora生成“时尚女性走在霓虹闪烁的东京街头” 资料来源:OpenAI,国信证券经济研究所整理 图:Sora生成“雪地里的巨型长毛象” 资料来源:OpenAI,国信证券经济研究所整理 资料来源:OpenAI,国信证券经济研究所整理 谷歌:Gemini1.5上线 长语境理解方面取得突破,能够显著增加模型可处理的信息量,上下文窗口长度扩展到100万个tokens; 一次处理大量的信息:包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库;能对不同的模式执行高度复杂的理解和推理任务,包括视频、代码等; “情境学习”技能:可以从长时间提示的信息中学习新技能,而无需额外的微调 图:谷歌Gemini1.5模型参数 图:谷歌Gemini1.5模型提升对比 图:谷歌Gemini1.5能力 资料来源:OpenAI,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理资料来源:谷歌,国信证券经济研究所整理 Meta:发布最强开源大模型Llama3,多模态版本随后将上线 Meta在官网上宣布公布了旗下最新大模型Llama3。目前,Llama3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama3比前代Llama2有了“显著提升”。未来Meta将推出Llama3的更大参数版本,其将拥有超过4000亿参数。Meta也将在后续为Llama3推出多模态等新功能 根据Meta的测试结果,Llama38B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma7B和Mistral7BInstruct,70B模型则超越了名声在外的闭源模型Claude3的中间版本Sonnet,和谷歌的GeminiPro1.5相比三胜两负。 在常规数据集之外,Meta还致力于优化Llama3在实际场景中的性能,为此专门研发了一套高质量的人工测试集。该测试集包含1800条数据,涵盖了寻求建议、封闭式问题回答、头脑风暴、编码、写作等12个关键用例,并对开发团队保密。在这套测试集中,从结果来看,Llama3的成绩大幅超越了Llama2,也胜过了Claude3Sonnet、MistralMedium和GPT-3.5这些知名模型 图:Llama3表现测试 资料来源:Meta,国信证券经济研究所整理 图:Llama3实际场景横向对比 资料来源:Meta,国信证券经济研究所整理 图:400B+模型部分测试结果 资料来源:Meta,国信证券经济研究所整理 音乐界的GPT——SunoAI AI音乐生成模型Suno在发布V3版本后火爆出圈,只需要输入简单的提示词,比如音乐主题、风格、流派、歌词、音色等,Suno就能快速生成一首长达2分钟的完整音乐 资料来源:SunoAI,国信证券经济研究所整理 商汤科技发布“日日新SenseNova4.0” “日日新SenseNova4.0”拥有更全⾯的知识覆盖、更可靠的推理能力,更优越的长文本理解力及更稳定的数字推理能力和更强的代码生成能力,并⽀持跨模态交互。日日新·商量大语言模型-通用版本(SenseChatV4),支持128K语境窗口长度,综合整体评测成绩水平比肩GPT-4,相较GPT-3.5已经实现全⾯超越 商量多模态大模型(SenseChat-VisionV4)拥有300亿参数,图文理解能力在权威评测基准测试集MMEBenchmark上综合得分排名首位,综合得分达2199.5(超过GPT-4V的1926.57) 秒画文生图大模型(SenseMirageV4)较此前版本,参数量提升至百亿量级,通过Mixtureoftextexperts、Spatial-awareCFG等算法优化,语义理解能力与图像质感细节表现显著增强,可达成电影级海报生成水平 图:秒画文生图大模型 图:日日新·商量大语言模型能力对比图:日日新·商量多模态大模型模型能力对比 资料来源:商汤,国信证券经济研究所整理 资料来源:商汤,国信证券经济研究所整理 资料来源:商汤,国信证券经济研究所整理 昆仑万维发布天宫3.0大模型及SkyMusic音乐大模型 天工3.0参数规模达到4000亿级,是全球最大规模的开源MoE大模型。相较于上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30% 与海外顶尖的AI音乐大模型SunoV3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越SunoV3,成为全球AI音乐SOTA模型;同时还拥有独创的参考音乐生成与方言歌曲生成能力。 图:天工3.0模型参数超越Grok-1,成全球最大开源MoE专家混合大模型 资料来源:昆仑万维,国信证券经济研究所整理 图:天工SkyMusic综合性能超越SunoV3 资料来源:昆仑万维,国信证券经济研究所整理 字节跳动推出视频模型Boximator PixVerse——国产Sora? 图:Boximator生成“大风把女生的伞吹走了” 资料来源:Boximator,国信证券经济研究所整理 资料来源:PixVerse,国信证券经济研究所整理 2.C端场景持续泛化 从Chatgpt到Kimi,Chatbots当前仍是使用最为广泛的场景 图:豆包 资料来源:豆包,国信证券经济研究所整理 图:Kimi 资料来源:Kimi,国信证券经济研究所整理 图:天工 资料来源:天工,国信证券经济研究所整理 图:ChatGpt 资料来源:OpenAI,国信证券经济研究所整理 AI搜索引擎基于人工智能技术,利用自然语言处理、机器学习、深度学习等技术,对用户的搜索语句进行分析和理解,从而推荐更加准确的搜索结果。其实现原理是将用户的查询意图和知识库中的信息进行匹配和比对,找到最匹配的答案,并输出给用户 在搜索结果的呈现方式上,更加注重智能化、个性化和交互化的体验。通过分析用户在搜索过程中的行为与反馈,AI搜索引擎能够推荐更符合个性化需求的搜索结果,并不断优化搜索算法,提升搜索结果的质量和准确性 图:秘塔搜索 图:天工AI搜索 资料来源:秘塔,国信证券经济研究所整理资料来源:天工搜索,国信证券经济研究所整理 据MordorIntelligence报告,AI社交应用规模将从2023年的16.4亿美元增长至2028年的56.6亿美元; 海外的CharaceterAI,国内出海应用Talkie(MiniMax)、linky(昆仑万维),国内市场XEva(小冰)等均有不错表现; 图:Character.ai 图:Talkie 资料来源:CharacterAI,国信证券经济研究所整理资料来源:Talkie,国信证券经济研究所整理 OpenAI发布由Sora制作的MV(MusicVideo)——《Worldweight》 音乐GPT时刻:只需要输入简单的提示词,比如音乐主题、风格、流派、歌词、音色等,Suno就能快速生成一首长达2分钟的完整音乐 图:Suno图:Worldweight 资料来源:Suno,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理 3.国内应用端落地优势开始展现 2应用端:海外Chatbot访问量稳中有升,国内Chatbot访问量增长迅猛 图:海外Chatbot网页访问量(百万次) 资料来源:similarweb,国信证券经济研究所整理 图:国内Chatbot网页访问量(万次) 资料来源:similarweb,国信证券经济研究所整理 全球市场来看,C