行业研究公司研究宏观策略财报招股书会议纪要中央经济工作会议低空经济 DeepSeek AIGC 智能驾驶大模型

电子AI+系列专题报告（一）：AI大语言模型的原理、演进及算力测算

电子设备2023-04-24胡剑、胡慧、周靖翔、李梓澎国信证券花***

AI智能总结

本文主要介绍了AI大语言模型的原理、演进及算力测算。大语言模型是一种非串行的神经网络架构，Transformer模型是其基础架构，具有并行运算、关注上下文信息、表达能力强等优势。GPT是基于Transformer架构衍生出的生成式预训练的单向语言模型，通过大量语料数据进行无监督学习，从而实现文本生成的目的。大语言模型的训练及推理应用对算力需求带来急剧提升，以GPT-3为例，其所需算力为121.528PFLOPS，以A100 PCle芯片为例，训练阶段需要新增A100 GPU芯片1558颗。

点击免费查看完整报告

你可能感兴趣

电子AI+系列专题报告（一）：AI大语言模型的原理、演进及算力测算

你可能感兴趣

电子AI+系列专题报告：缘AI：大语言模型的终端部署，推动新一轮终端需求

电子AI+系列专题报告（六）：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

电子AI+系列专题报告（二）：复盘英伟达的AI发展之路

电子行业AI+系列专题报告（五）：华为盘古大模型：让AI重塑千行百业

AI系列专题报告（一）算力：算力基建景气度高，国产AI芯片发展势头良好