您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国联证券]:互联网电商:大模型加速迭代,聚焦AI应用落地 - 发现报告
当前位置:首页/行业研究/报告详情/

互联网电商:大模型加速迭代,聚焦AI应用落地

商贸零售2023-12-08陈梦瑶国联证券米***
互联网电商:大模型加速迭代,聚焦AI应用落地

1 行业报告│行业专题研究 请务必阅读报告末页的重要声明 互联网电商 大模型加速迭代,聚焦AI应用落地  简述行业变化: 基础大模型持续升级演进,多模态成行业趋势。近期国内外AI基础大模型持续升级迭代,阿里、百度、微软、谷歌等头部大厂纷纷升级其基础大模型,在多模态、长文本、逻辑思维等方面能力均显著提升,我们认为各厂商大模型能力持续升级,有望加速应用落地。 底层架构的创新或引发新一轮变革。近期CMU和普林斯顿大学的研究者发布了全新Mamba架构,可以克服Transformer的致命缺陷:核心注意力层无法扩展到长期上下文。我们认为,底层架构的创新有望推动新一轮技术变革,提升AI应用落地效果。  AI应用逐步落地并商业化 随着AI基础的大模型的升级和优化,大量AI应用快速涌现,且已有较多应用进行了商业化。海外很多C端应用已经实现盈利,商业模式以订阅为主,应用更偏向于情感陪伴、AI绘画等泛娱乐应用。国内B端应用如智能客服、办公助理等也在快速落地应用,但C端现象级应用短缺。我们认为短期内AI应用主要在对准确性、专业性要求不高的场景,长期则有望向对准确性、专业性等要求更高的领域延伸,如教育、金融、医疗等场景。  AI视频生成领域逐渐突破 AI视频生成是多模态领域最大的难题,因为融合了文本、图像、音频等多种媒介,因此在AI生成方面难度最大,当前AI视频生成技术仍处于早期阶段。但近期AI视频生成领域逐渐迎来突破,Runway的Gen-2、Pika、字节的Magic Animate、阿里的Animate Anyone等产品表现亮眼,生成视频的流畅度、清晰度等均有较大升级。我们认为AI视频生成能力的提升,可广泛应用于电商、直播、影视等场景,助力相关公司降本增效。  AI Agent有望加速应用落地 AI Agent是具备环境感知、自主决策并执行的智能体,可以自主思考和调用工具从而完成既定任务,可以克服当前基础大模型存在的内容生成不准确、幻觉等问题,可以将用户从日常任务和重复劳动中解放出来,有望帮助处理几乎所有活动和生活各个领域的事务,对软件业和整个社会都将产生深远影响。  投资建议 我们认为随着基础大模型的持续升级优化以及AI Agent技术的快速成熟,AI应用有望规模落地,建议关注营销、游戏、教育等AI应用可快速落地的领域,具体标的上建议关注在AI应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。 风险提示:技术发展不及预期风险;竞争加剧风险;AI安全、隐私风险等。 证券研究报告 2023年12月08日 投资建议: 强于大市(维持) 上次建议: 强于大市 相对大盘走势 作者 分析师:陈梦瑶 执业证书编号:S0590521040005 邮箱:cmy@glsc.com.cn 联系人:周砺灵 邮箱:zhoull@glsc.com.cn 相关报告 1、《互联网电商:谷歌Gemini正式发布,多项能力行业领先》2023.12.07 -40%-23%-7%10%2022/122023/42023/82023/12互联网电商沪深300 请务必阅读报告末页的重要声明 2 行业报告│行业专题研究 1. 基础大模型持续升级演进 头部科技大厂引领行业发展,多模态成行业趋势。由于AI大模型依赖庞大的算力资源、优秀的AI人才、丰富的数据等条件,海外逐渐形成了以微软/OpenAI、谷歌、Meta、AWS等科技巨头为代表的竞争格局。国内大模型厂商除了阿里、百度、华为、腾讯等头部大厂,科大讯飞、360、Minimax等一众厂商纷纷入局,竞争激烈。技术方面,大模型技术不断从文字、代码延伸至音频甚至视频领域,多模态成为主流大模型的典型特征。与OpenAI深度合作的微软行业领先,正在将OpenAI最新大模型GPT-4 Turbo集成到自身产品中,在多模态、长文档、知识库等方面全新升级,持续引领行业。北美时间12月6日,谷歌正式发布全新原生多模态大模型Gemini 1.0,在推理、编程等多个方面行业领先。谷歌将在其相关产品中全面集成Gemini的能力,包括搜索、广告、Chrome、Duet AI等。Meta则押注开源大模型,LLaMA2已成为最优秀的开源模型之一,并衍生出过个应用和项目,但仍与OpenAI、谷歌PaLM2大模型有差距。10月17日,百度发布文心一言4.0,理解、生成、逻辑、记忆四大能力都有显著提升。10月31日,阿里通义千问2.0发布,阅读理解、逻辑思维以及数据处理等方面的能力都有了显著的提升。我们认为各个厂商大模型能力持续升级迭代,有望加速应用快速落地。 图表1:典型AI大模型进展梳理 资料来源:财联社、智东西、界面新闻、36氪、金融界、机器之心Pro、澎湃新闻、界面新闻、新智元、华尔街见闻,国联证券研究所整理 请务必阅读报告末页的重要声明 3 行业报告│行业专题研究 底层架构的创新或引发新一轮变革。Transformer是目前AI大模型的主流架构,但Transformer存在致命缺陷:Transformer模型中自注意力机制的计算量会随着上下文长度的增加呈平方级增长,导致核心注意力层无法扩展到长期上下文。近期CMU和普林斯顿的研究者发布了新的SSM架构Mamba,这种架构在语言建模上与Transformer能力相当,而且还能够线性扩展,同时具有5倍的推理吞吐量,在语言、音频、DNA序列模态上都实现SOTA。我们认为,底层架构的缺陷直接影响大模型的效果和性能,底层架构的创新有望推动新一轮技术变革,加速AI应用落地。 图表2:Mamba与Transformer吞吐量对比 资料来源:Mamba: Linear-Time Sequence Modeling with Selective State Spaces,国联证券研究所 2. 应用落地多点开花 2.1 AI应用逐步落地并商业化 随着基础大模型的持续升级和优化,大量应用快速涌现,其中海外应用起步较早,已经有比较多的AI应用进行了商业化落地。根据美国风险投资公司A16z提供的TOP 50的AI产品榜单,海外很多C端应用已经实现盈利,商业模式以订阅为主,应用类型则更多偏向于情感陪伴、AI绘画等泛娱乐应用,如C端情感陪伴类应用Character.AI、AI绘画应用Leonardo.ai。国内AI应用虽然起步较晚,但AI相关应用快速涌现,尤其是B端应用如智能客服、办公助理等,C端应用相对较少,类似妙鸭相机这样的应用短缺。我们认为,在AI应用落地早期以对话机器人Chatbot和简单的工具应用为主,主要在创意设计、聊天互动等对准确性、专业性要求不高的场景,长期则有望向对准确性、专业性等要求更高的领域延伸,如教育、金融、医疗等场景。 请务必阅读报告末页的重要声明 4 行业报告│行业专题研究 图表3:AI应用落地节奏 资料来源:澎湃新闻,36氪,国联证券研究所整理 2.2 视频生成领域逐渐突破 AI视频生成是多模态领域最大难题。与文字、图片相比,视频是融合了文本、图像、音频等多种媒介的综合体,在表达、画面丰富性等方面具有较大优势。也正是因为视频内容的复杂性,导致在AI生成领域视频内容生成成为一大难题,目前文生视频技术仍处于早期阶段。这与视频生成工具的底层原理类似,目前主流的文生视频主要包括扩散模型、生成对抗网络GAN以及Transformer模型,但扩散模型采样速度较慢,GAN存在训练不稳定的问题,Transformer模型质量高但计算成本大。同时在数据方面也面临较多问题,文生视频缺乏高质量数据集,且视频生成需平衡空间与时间信息,模型迭代方向集中在提高生成质量与连贯性。 请务必阅读报告末页的重要声明 5 行业报告│行业专题研究 图表4:AI视频生成三大方案 资料来源:Stable Diffusion,36氪,Thalles Silva,国联证券研究所 AI视频生成逐渐突破,应用前景广阔。近期AI视频生成领域国内外进展迅速,Gen-2、Pika1.0、字节Magic Animate、阿里Animate Anyone等产品均有亮眼表现。11月3日,Runway视频生成工具Gen-2迎来重磅更新,在文生视频和图生视频中为结果的保真度和一致性带来重大改进,克服了早期版本生成视频内容不连贯、闪烁变形以及低清等问题,视频效果甚至达到4K超逼真的高度。11月29日,成立仅半年的AI初创公司Pika正式推出AI视频生成工具Pika1.0,支持从普通2D动画到实拍感的电影场景、3D动画的生成,还能够支持对视频实时编辑和修改,其中生成的视频在光影、动作流畅度等方面甚至都不输好莱坞动画电影级别。近期阿里和字节也推出了自己的AI视频生成工具,阿里推出了Animate Anyone,只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。字节则联合新加坡国立大学推出了Magic Animate,同样是利用AI技术,将静态图像变成动态视频。我们认为,随着AI视频生成技术的不断优化,其应用前景广阔,可广泛应用于影视、游戏、电商等场景,助力相关公司降本增效。 请务必阅读报告末页的重要声明 6 行业报告│行业专题研究 图表5: 四种视频生成工具展示 资料来源:新智元、36氪、量子位、Arxiv.org,国联证券研究所 2.3 AI Agent有望加速应用落地 AI Agent是具备环境感知、自主决策并执行的智能体,可以自主思考和工具调用从而完成既定目标。我们认为,在基座大模型能力不断优化完善的背景下,AI Agent有望成为应用落地的主要路线之一。因为大模型基于Prompt进行被动交互,而且Prompt的质量会直接影响大模型的回答效果,大语言模型应用落地仍面临诸多挑战,尤其是基础大模型仍不完善,存在生成内容不准确、存在幻觉等问题。而AI Agent可以基于目标任务主动思考并行动,还能调用外部工具,可释放LLM的应用潜能。AI Agent可以帮助用户从日常任务和重复劳动中解放出来,从而缓解人类工作压力并提高任务解决效率,同时智能体可以独立地分析、计划和解决问题,不再需要用户提供明确的指令;在解放用户双手之后,智能体还解放了他们的思维,使他们能够从事探索性和创新性的工作,在前沿科学领域充分发挥他们的潜力。总之,Agent 有望帮助处理几乎所有活动和生活各个领域的事务,对软件业和整个社会都将产生深远的影响。 请务必阅读报告末页的重要声明 7 行业报告│行业专题研究 图表6:AI Agent工作原理 资料来源:Beehiiv.com,国联证券研究所 AI Agent浪潮将至。AI Agent是近期社会关注和热议的方向,国内外厂商纷纷布局。阿里云推出模型调用工具魔搭GPT(ModelScopeGPT),用户可以通过一键发送指令调用Mota社区中其他人工智能模型,从而实现模型的协作,完成复杂的任务;昆仑万维正式发布“天工 SkyAgents”平台,用户可以通过自然语言和简单操作,无需代码编程,即可在几分钟之内部署属于自己的AI Agents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等需求。海外在Agent方面研究进展更快,AutoGPT是GPT-4完全自主运行的首批示例之一,突破了人工智能所做的边界,他结合了GPT-4和GPT-3.5技术,通过API创建完整的项目;Baby Agent是一个人工智能驱动的任务管理系统,能够根据先前任务的结果自主解决任务并保持预定义的目标,还能有效地确定任务的优先级。 请务必阅读报告末页的重要声明 8 行业报告│行业专题研究 图表7:一个设想中的智能体社会 资料来源:The Rise and Potential of Large Language Model Based Agents