行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

互联网电商：大模型加速迭代，聚焦AI应用落地

商贸零售 2023-12-08 陈梦瑶国联证券米软绵gogo

根据提供的行业报告内容，我们可以总结如下：

行业变化与趋势

基础大模型持续升级：
- 头部科技大厂如阿里、百度、微软、谷歌等持续升级其基础大模型，提升多模态、长文本、逻辑思维等方面的能力。
- CMU和普林斯顿大学发布的全新Mamba架构有望解决Transformer的核心注意力层无法扩展到长期上下文的问题，推动技术变革。
AI应用商业化进程加快：
- 海外AI应用商业化进展较快，尤其在C端，如情感陪伴、AI绘画等泛娱乐应用实现盈利，商业模式以订阅为主。
- 国内B端应用如智能客服、办公助理快速落地，但C端现象级应用较少。
- 预计短期内AI应用主要在非专业性场景落地，长期将扩展至教育、金融、医疗等领域。
AI视频生成领域突破：
- AI视频生成是多模态领域挑战性最高的任务，技术仍处于早期阶段，面临数据集质量和底层算法优化等问题。
- 近期产品如Gen-2、Pika、Magic Animate等在视频生成质量、连贯性和保真度上取得显著进步，未来可广泛应用于电商、直播、影视等行业，助力降本增效。

投资建议与风险提示

投资建议：看好营销、游戏、教育等AI应用领域，推荐关注在AI应用方面布局深入、拥有丰富数据和应用场景的公司，如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒等。
风险提示：
- 技术发展不及预期风险：AI大模型技术进步缓慢，影响应用规模落地。
- 竞争加剧风险：行业内竞争激烈，中小企业和创业公司增多。
- AI安全、隐私风险：AI生成内容可能引发伦理、法律问题，数据隐私保护面临挑战。

结论

互联网电商行业正经历由基础大模型驱动的AI技术革命，从底层架构创新到应用快速商业化，再到AI视频生成和AI Agent的突破，展现出蓬勃的发展势头。然而，技术进步的同时也伴随着一系列挑战，包括技术成熟度、市场竞争、以及AI伦理和隐私问题。对于投资者而言，选择在AI应用领域布局深入的公司作为投资对象，同时关注风险因素，将是获取长期收益的关键。

简述行业变化：基础大模型持续升级演进，多模态成行业趋势。近期国内外AI基础大模型持续升级迭代，阿里、百度、微软、谷歌等头部大厂纷纷升级其基础大模型，在多模态、长文本、逻辑思维等方面能力均显著提升，我们认为各厂商大模型能力持续升级，有望加速应用落地。底层架构的创新或引发新一轮变革。近期CMU和普林斯顿大学的研究者发布了全新Mamba架构，可以克服Transformer的致命缺陷：核心注意力层无法扩展到长期上下文。我们认为，底层架构的创新有望推动新一轮技术变革，提升AI应用落地效果。 AI应用逐步落地并商业化随着AI基础的大模型的升级和优化，大量AI应用快速涌现，且已有较多应用进行了商业化。海外很多C端应用已经实现盈利，商业模式以订阅为主，应用更偏向于情感陪伴、AI绘画等泛娱乐应用。国内B端应用如智能客服、办公助理等也在快速落地应用，但C端现象级应用短缺。我们认为短期内AI应用主要在对准确性、专业性要求不高的场景，长期则有望向对准确性、专业性等要求更高的领域延伸，如教育、金融、医疗等场景。 AI视频生成领域逐渐突破 AI视频生成是多模态领域最大的难题，因为融合了文本、图像、音频等多种媒介，因此在AI生成方面难度最大，当前AI视频生成技术仍处于早期阶段。但近期AI视频生成领域逐渐迎来突破，Runway的Gen-2、Pika、字节的MagicAnimate、阿里的AnimateAnyone等产品表现亮眼，生成视频的流畅度、清晰度等均有较大升级。我们认为AI视频生成能力的提升，可广泛应用于电商、直播、影视等场景，助力相关公司降本增效。 AIAgent有望加速应用落地 AI Agent是具备环境感知、自主决策并执行的智能体，可以自主思考和调用工具从而完成既定任务，可以克服当前基础大模型存在的内容生成不准确、幻觉等问题，可以将用户从日常任务和重复劳动中解放出来，有望帮助处理几乎所有活动和生活各个领域的事务，对软件业和整个社会都将产生深远影响。投资建议我们认为随着基础大模型的持续升级优化以及AI Agent技术的快速成熟，AI应用有望规模落地，建议关注营销、游戏、教育等AI应用可快速落地的领域，具体标的上建议关注在AI应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。风险提示：技术发展不及预期风险；竞争加剧风险；AI安全、隐私风险等。 1.基础大模型持续升级演进头部科技大厂引领行业发展，多模态成行业趋势。由于AI大模型依赖庞大的算力资源、优秀的AI人才、丰富的数据等条件，海外逐渐形成了以微软/OpenAI、谷歌、Meta、AWS等科技巨头为代表的竞争格局。国内大模型厂商除了阿里、百度、华为、腾讯等头部大厂，科大讯飞、360、Minimax等一众厂商纷纷入局，竞争激烈。技术方面，大模型技术不断从文字、代码延伸至音频甚至视频领域，多模态成为主流大模型的典型特征。与OpenAI深度合作的微软行业领先，正在将OpenAI最新大模型GPT-4 Turbo集成到自身产品中，在多模态、长文档、知识库等方面全新升级，持续引领行业。北美时间12月6日，谷歌正式发布全新原生多模态大模型Gemini 1.0，在推理、编程等多个方面行业领先。谷歌将在其相关产品中全面集成Gemini的能力，包括搜索、广告、Chrome、Duet AI等。Meta则押注开源大模型，LLaMA2已成为最优秀的开源模型之一，并衍生出过个应用和项目，但仍与OpenAI、谷歌PaLM2大模型有差距。10月17日，百度发布文心一言4.0，理解、生成、逻辑、记忆四大能力都有显著提升。10月31日，阿里通义千问2.0发布，阅读理解、逻辑思维以及数据处理等方面的能力都有了显著的提升。我们认为各个厂商大模型能力持续升级迭代，有望加速应用快速落地。图表1：典型AI大模型进展梳理底层架构的创新或引发新一轮变革。Transformer是目前AI大模型的主流架构，但Transformer存在致命缺陷：Transformer模型中自注意力机制的计算量会随着上下文长度的增加呈平方级增长，导致核心注意力层无法扩展到长期上下文。近期CMU和普林斯顿的研究者发布了新的SSM架构Mamba，这种架构在语言建模上与Transformer能力相当，而且还能够线性扩展，同时具有5倍的推理吞吐量，在语言、音频、DNA序列模态上都实现SOTA。我们认为，底层架构的缺陷直接影响大模型的效果和性能，底层架构的创新有望推动新一轮技术变革，加速AI应用落地。图表2：Mamba与Transformer吞吐量对比 2.应用落地多点开花 2.1AI应用逐步落地并商业化随着基础大模型的持续升级和优化，大量应用快速涌现，其中海外应用起步较早，已经有比较多的AI应用进行了商业化落地。根据美国风险投资公司A16z提供的TOP 50的AI产品榜单，海外很多C端应用已经实现盈利，商业模式以订阅为主，应用类型则更多偏向于情感陪伴、AI绘画等泛娱乐应用，如C端情感陪伴类应用Character.AI、AI绘画应用Leonardo.ai。国内AI应用虽然起步较晚，但AI相关应用快速涌现，尤其是B端应用如智能客服、办公助理等，C端应用相对较少，类似妙鸭相机这样的应用短缺。我们认为，在AI应用落地早期以对话机器人Chatbot和简单的工具应用为主，主要在创意设计、聊天互动等对准确性、专业性要求不高的场景，长期则有望向对准确性、专业性等要求更高的领域延伸，如教育、金融、医疗等场景。图表3：AI应用落地节奏 2.2视频生成领域逐渐突破 AI视频生成是多模态领域最大难题。与文字、图片相比，视频是融合了文本、图像、音频等多种媒介的综合体，在表达、画面丰富性等方面具有较大优势。也正是因为视频内容的复杂性，导致在AI生成领域视频内容生成成为一大难题，目前文生视频技术仍处于早期阶段。这与视频生成工具的底层原理类似，目前主流的文生视频主要包括扩散模型、生成对抗网络GAN以及Transformer模型，但扩散模型采样速度较慢，GAN存在训练不稳定的问题，Transformer模型质量高但计算成本大。同时在数据方面也面临较多问题，文生视频缺乏高质量数据集，且视频生成需平衡空间与时间信息，模型迭代方向集中在提高生成质量与连贯性。图表4：AI视频生成三大方案 AI视频生成逐渐突破，应用前景广阔。近期AI视频生成领域国内外进展迅速，Gen-2、Pika1.0、字节Magic Animate、阿里AnimateAnyone等产品均有亮眼表现。 11月3日，Runway视频生成工具Gen-2迎来重磅更新，在文生视频和图生视频中为结果的保真度和一致性带来重大改进，克服了早期版本生成视频内容不连贯、闪烁变形以及低清等问题，视频效果甚至达到4K超逼真的高度。11月29日,成立仅半年的AI初创公司Pika正式推出AI视频生成工具Pika1.0，支持从普通2D动画到实拍感的电影场景、3D动画的生成，还能够支持对视频实时编辑和修改，其中生成的视频在光影、动作流畅度等方面甚至都不输好莱坞动画电影级别。近期阿里和字节也推出了自己的AI视频生成工具，阿里推出了Animate Anyone，只需提供一个静态的角色图像（包括真人、动漫/卡通角色等）和一些动作、姿势（比如跳舞、走路），便可将其动画化，同时保留角色的细节特征（如面部表情、服装细节等）。字节则联合新加坡国立大学推出了Magic Animate，同样是利用AI技术，将静态图像变成动态视频。我们认为，随着AI视频生成技术的不断优化，其应用前景广阔，可广泛应用于影视、游戏、电商等场景，助力相关公司降本增效。图表5：四种视频生成工具展示 2.3AI Agent有望加速应用落地 AIAgent是具备环境感知、自主决策并执行的智能体，可以自主思考和工具调用从而完成既定目标。我们认为，在基座大模型能力不断优化完善的背景下，AI Agent有望成为应用落地的主要路线之一。因为大模型基于Prompt进行被动交互，而且Prompt的质量会直接影响大模型的回答效果，大语言模型应用落地仍面临诸多挑战，尤其是基础大模型仍不完善，存在生成内容不准确、存在幻觉等问题。而AI Agent可以基于目标任务主动思考并行动，还能调用外部工具，可释放LLM的应用潜能。AI Agent可以帮助用户从日常任务和重复劳动中解放出来，从而缓解人类工作压力并提高任务解决效率，同时智能体可以独立地分析、计划和解决问题，不再需要用户提供明确的指令；在解放用户双手之后，智能体还解放了他们的思维，使他们能够从事探索性和创新性的工作，在前沿科学领域充分发挥他们的潜力。总之，Agent有望帮助处理几乎所有活动和生活各个领域的事务，对软件业和整个社会都将产生深远的影响。图表6：AI Agent工作原理 AI Agent浪潮将至。AI Agent是近期社会关注和热议的方向，国内外厂商纷纷布局。阿里云推出模型调用工具魔搭GPT（ModelScopeGPT），用户可以通过一键发送指令调用Mota社区中其他人工智能模型，从而实现模型的协作，完成复杂的任务；昆仑万维正式发布“天工SkyAgents”平台，用户可以通过自然语言和简单操作，无需代码编程，即可在几分钟之内部署属于自己的AI Agents，完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等需求。海外在Agent方面研究进展更快，AutoGPT是GPT-4完全自主运行的首批示例之一，突破了人工智能所做的边界，他结合了GPT-4和GPT-3.5技术，通过API创建完整的项目；Baby Agent是一个人工智能驱动的任务管理系统，能够根据先前任务的结果自主解决任务并保持预定义的目标，还能有效地确定任务的优先级。图表7：一个设想中的智能体社会 3.建议标的我们认为随着基础大模型的持续升级优化以及AI Agent技术的快速成熟，AI应用有望规模落地，建议关注营销、游戏、教育等AI应用可快速落地的领域，具体标的上建议关注在AI应用积极布局且在数据、应用场景和应用生态方面积累丰富的公司如美图公司、昆仑万维、果麦文化、蓝色光标、分众传媒。 4.风险提示技术发展不及预期风险：AI大模型相关技术仍不完善，底层Transformer存在架构缺陷，使得大模型存在回答不准确、易产生幻觉等问题，技术升级迭代可能较慢，影响相关应用规模落地。竞争加剧风险：行业参与者众多，除了头部大厂还有众多中小企业以及创业公司，导致行业竞争激烈。 AI安全、隐私风险：AI生成内容可能存在暴力、政治敏感、低俗等问题，同时AI发展可能导致大量数据收集和分析，可能包含个人隐私信息，会对个人隐私造成较大隐患。

点击免费查看完整报告

互联网电商：大模型加速迭代，聚焦AI应用落地

行业变化与趋势

投资建议与风险提示

结论

你可能感兴趣

Opera延续强势增长，大模型迭代加速AI应用商业化落地

传媒互联网行业2月报：Sora横空出世加速技术迭代，关注AI多模态技术迭代与应用落地

国金互联网传媒快手可灵大模型网测效果优秀AI应用落地加速中

二月全球大模型密集迭代看好AI大模型和应用投资机会东吴传媒互联网张良卫团队

信息技术产业行业研究：海外大模型持续迭代，看好AI应用落地机会

金融科技行业AI应用双周报第十二期：大模型更新迭代，拉卡拉智能助手落地

计算机行业周报：大模型技术进入密集迭代期，AI应用规模商业化落地置信度增强

AI大模型加速迭代，券商称高速通信将驱动PCB成长;Tiktok流量优势显著赋能电商业务，关注相关品牌卖家---0219脱水研报

谷歌Gemini3Pro发布全球大模型迭代加速建议关注AI应用产业链

国内外大模型加速迭代，关注 AI 多模态应用及 AI Agent 进展