您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:AIGC专题四:国内外大模型和AI应用梳理 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC专题四:国内外大模型和AI应用梳理

信息技术2023-05-19马笑、王梅卿德邦证券比***
AIGC专题四:国内外大模型和AI应用梳理

0AIGC专题四:国内外大模型和AI应用梳理2023年5月19日证券研究报告|行业专题证券分析师姓名:马笑资格编号:S0120522100002邮箱:maxiao@tebon.com.cn研究助理姓名:王梅卿邮箱:wangmq@tebon.com.cn 1请务必阅读正文之后的信息披露及法律声明。投资要点:关注大模型迭代带来的应用端投资机会谷歌I/O上发布一系列生成式AI新进展,科技大厂竞争激烈。5月10日,谷歌I/O开发者大会上发布了包括:新一代语言模型PaLM2、升级AI聊天机器人Bard、生成式AI实验版搜索引擎、Duet AI for Workspace等。AI艺人迅速出圈,多模态应用充分释放AI潜力,进一步推动商业化落地。1)AI歌手:截至5月14日,“AI孙燕姿”翻唱的《发如雪》已有超过150万点击量。2)AI网红Caryn Marjorie通过出售AI版本的Caryn,在过去一周的beta阶段创收7.16万美元,99%的用户是男性。从应用端看,昆仑万维,汤姆猫,中文在线,万兴科技,美图公司等同时兼具跨模态属性和海外业务的公司有望率先实现应用场景落地。昆仑万维:2023年02月公司宣布将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源。旗下Opera浏览器计划接入ChatGPT,截至2022H1,Opera 全球平均MAU达3.3 亿,美洲市场Q2活跃用户规模同比增长22%;2022年,Opera GX 的MAU已超过2000万。汤姆猫:汤姆猫家族IP的交互属性与ChatGPT有着较高的契合度。公司团队已尝试应用ChatGPT模型进行AI 交互产品开发的初步测试,测试的模型目前通过ChatGPT海外接口接入。中文在线:海量优质数据资产为核心优势;与澜舟科技合力探索AIGC在内容生产方面的技术应用;AI技术已在内容创作、游戏元宇宙等领域落地。海外产品Chapters 和My Escape 已在做接入ChatGPT测试,应用在故事创作生成、剧本生成及改编、用户与AI 交互聊天等方面。万兴科技:视频创意软件WondershareFilmora接入OpenAI,WondershareFilmora12新增功能包括AI抠图、AI音频拉伸和AI音频降噪。软件拥有超过1亿用户,覆盖超过150个国家及地区。3月31日正式面向出海营销领域全球首发AIGC“真人”短视频出海营销神器“万兴播爆”(英文名:WondershareVirbo),并宣布开启移动端公测。美图公司:AI绘画功能在旗下部分产品中上线,推动产品全球业绩增长。商业化探索包括,1)“AI绘画”免费生成3张绘画,支付2元可解锁五张新效果;2)“百变AI头像”,6.6元50张(5种风格×10张);9.9元100张(10种风格×10张),12.9元200张(20种风格×10张)。随着技术的更新迭代,以及在应用端的持续探索,有望进一步创造新的消费和需求,有利于文娱内容和互联网行业。重点关注:万兴科技、昆仑万维、汤姆猫、中文在线、思美传媒、美图公司、百度集团-SW、商汤-W、腾讯控股、阅文集团;皖新传媒、南方传媒、焦点科技、风语筑、利欧股份、神州泰岳、联络互动、捷成股份、掌阅科技、立方数科、元隆雅图等。风险提示:技术发展不及预期、监管政策变化、知识产权等相关问题。 2请务必阅读正文之后的信息披露及法律声明。01 海外大模型发展02 国内大模型布局03 AI探索领先者04 投资建议&风险提示目录CONTENTS 301海外大模型发展 4请务必阅读正文之后的信息披露及法律声明。1.1 微软:投资OpenAI;将AI融入旗下应用模型Swin Transformer v2.0NLP模型CV模型多模态模型Megatron-Turing NLGBEiT-3Transformer-Based参数量530B完成预测阅读理解常识推理自然语言推理词义消歧Transformer-Based参数量3BKosmos-1MLLM参数量1.6B自研OpenAIGPT-4Image GPTCLIPDALL·E2应用办公软件Microsoft 365 Copilot浏览器Bing安全软件Microsoft Security Copilot虚拟人小冰营销Microsoft Viva SalesAI编程GitHub Copilot医疗临床笔记DAX Express数据处理Power BIAzure AIAI应用服务API服务基础设施机器学习资料来源: Microsoft AI, Microsoft Azure,Microsoft Research,OpenAI官网等,德邦研究所 5请务必阅读正文之后的信息披露及法律声明。1.2 谷歌:大模型基础Transformer的研发者深度学习框架TensorFlow通用AI架构Pathways模型PaLMViTPaLM-E底座NLP模型CV模型多模态模型对话模型LaMDA应用照片参数量137B训练数据1.56T参数量最高22B将Transformer创新性地用于CV领域,训练方法类似BERTViViT一个模型做多件事多模态稀疏且高效PaLM-540B+ViT-22B=PaLM-E 562B横跨语言、视觉和机器人领域Self-Attention机制对输入进行注意力权重的分配,即決定需要关注输入的哪部分,并对其分配有限的信息处理资源给重要的部分。编码器-解码器编码组件部分由一堆编码器构成;解码组件部分也是由相同数量(与编码器对应)的解码器组成的。TransformerYouTube助手Gmail广告搜索地图Pixel云Bard基于LaMDA的对话机器人模型准备数据构建机器学习模型部署模型实现MLOps2017-06Transformer问世2022-04提出PaLM2022-01LaMDA模型推出2023-03提出多模态模型PaLM-E2020-10将Transformer运用到CV领域(ViT)2015-11开源了第二代机器学习平台TensorFlow2023-02对话机器人Bard发布2018-10Transformer的衍生模型BERT发布资料来源:TensorFlow, GitHub,RomalThoppilanet al.《LaMDA: Language Models for Dialog Applications》等模型相关论文,机器之心公众号等,德邦研究所 6请务必阅读正文之后的信息披露及法律声明。1.3 Meta:大模型有望助力公司元宇宙发展模型底座深度学习框架PytorchNLP模型——LLaMaCV模型——SEER多模态模型——data2vec基础大模型应用模型以较小参数量获得与GPT-3等模型相匹敌的效果LLaMa参数量最大65B用更大量优质训练数据获得更小模型参数训练数据约1.4TTokens自监督学习模型参数量最高10B充分考虑上下文的自监督学习可以在文本、语音或图像上单独训练Make-A-VideoVisual Acoustic Matching资料来源:PyTorch, Make-a-Video Studio,Hugo Touvronet al.《LLaMA: Open and Efficient Foundation Language Models》等模型相关论文,机器之心公众号等,德邦研究所 702国内大模型布局 8请务必阅读正文之后的信息披露及法律声明。2.1 百度:文心大模型应用模型飞桨文心大模型产品&工具开发套件面向开发者开发平台面向下游应用面向用户服务平台产品百度飞桨(Paddle-Paddle)-深度学习平台开源开放产业级市场份额国内第一支撑优化ERNIE 1.0中文效果超越BERT2019-03ERNIE 2.0中英文公开数据集全面领先竞品ERNIE 3.0首个百亿大模型解决语义与生成问题2019-072021-072021-12鹏程-百度·文心全球首个知识增强千亿大模型2022-05VIMER系列文心·行业大模型基于行业数据知识提升行业适配性文心大模型平均分基础大模型NLP大模型语言理解和创作CV大模型图文OCR,视觉处理多模态大模型视觉、语音、地理语言任务大模型Unified TransformerERNIE搜索信息抽取代码生成PLATO 对话生物计算行业大模型通用文心大模型行业数据挖掘+行业数据挖掘ERNIEKitNLP算法定制开发工具集BML智能文本全功能AI开发平台EasyDL-文本零门槛开发平台ERNIE-API大模型API服务文心百中大模型驱动产业级搜索系统文心一格AI艺术与创意辅助平台高质量文生图中国风画作一键部署引擎节省90%人力一站式调用平台面向初级&专家一站式定制平台零代码、可视化一站式定制平台面向有基础者源码级工具集面向专业工程师资料来源:《AIGC专题三:国内大模型概览》,德邦研究所 9请务必阅读正文之后的信息披露及法律声明。应用模型太极平台混元大模型-机器学习生态服务平台万亿级中文NLP模型CLUE1.1总排行榜第一VCR排行榜第一跨模态文字-视频检索AI大模型领域/任务/行业大模型CV大模型(HunYuan-VCR)NLP大模型(HunYuan-NLP)多模态大模型(HunYuan-tvr)模型训练AngelPTMGPU训练加速/4D并行/上线腾讯云模型推理及压缩HCF Toolkit轻量化/蒸馏/推理服务产品套件研发管线数据&模型管理一站式全流程广告搜索推荐游戏翻译对话数据底层微信QQ腾讯广告腾讯云游戏降本增效商业化潜力广告内容理解行业特征挖掘文案创意生成产品业务多2022.04首次披露深入产业落地多元训练数据脱敏/清洗/平台化评测数据和标准共建迭代更快成本更低效果更好腾讯云智能数智人客服主播教师助手导游2.2 腾讯:混元大模型资料来源:《AIGC专题三:国内大模型概览》,德邦研究所 10请务必阅读正文之后的信息披露及法律声明。统一底座多模态统一极致通用性统一学习范式OFA单模型可处理10余项任务升级可处理30余项跨模态任务模块化设计多架构统一多任务统一模块可拆拔高效高性能层次化结构易于迭代部署2021-012020-01M6-OFA2020-06正式启动项目基础模型三亿参数预训练模型百亿参数2021-03KDD2021千亿参数训练损失↓37%效率↑90%全球最大的预训练模型10万亿参数训练速度提升7倍2021-102022-01通义-AliceMind正式发布通用模型开源深度语言模型CLUE1.1总排行榜第二NLP大模型(通义-AliceMind)多模态大模型(通义M6-OFA)业界首个通用统一大模型CV大模型(通义-视觉)上层产业应用中层通用算法底层统一算法架构应用领先的跨模态能力提质增效AI医疗工业视觉智能农业城市大脑手机拍照AIOT3%-5%的应用效果提升电子商务图像搜索万物识别以文生图跨模态搜索交通自动驾驶文生视频VideoFusion17亿参数2.3 阿里:通义大模型资料来源:《AIGC专题三:国内大模型概览》,德邦研究所 11请务必阅读正文之后的信息披露及法律声明。开发平台L0基础大模型L2 细分场景模型-业界首个千亿中文大模型-最大中文语音模型之一科学计算大模型数据处理行业数据预训练底座模型应用L1行业大模型ModelArts Studio全周期AI工作流算法开发AI应用管理和部署模型训练创建部署+最大拥有30亿参数判别+生成能力小样本学习性能领先盘古视觉大模型双塔结构独立性强,训练效率高下游任务中更好的精度盘古多模态大模型音频文本语义盘古语音语义大模型语音识别(ASR)语音合成(TTS)文本理解文本生成盘古气象大模型大体量高维度数据处理低成本高效率秒级天气预报MaaS图网络大模型+无监督训练赋能产业提质增效高泛化高精度高可解释性终身学习冷启动盘古工作流(快速交付:工作流,增量学习,小样本标注)L0 基础大模型使用授权费L1 行业大模型定制费语音语义舆情分析智能客服企业运营视觉智能巡检智能物流自动生成...2.4 华为:盘古大模型资料来源:《AIGC专