本研究报告仅通过邮件提供给 中庚基金 使用。1 行业及产业 行业研究/行业深度 证券研究报告 计算机 2023年03月24日 国产AI芯片的百倍算力需求! 看好 ——AIGC系列之七 相关研究 "一层是AIGC狂潮,深层是数字经济出海!-计 算 机 行 业 周 报20230313-20130317" 2023年3月18日 "百度文心:一个符合预期的起点-AIGC系列之六" 2023年3月17日 证券分析师 黄忠煌 A0230519110001 huangzh@swsresearch.com 洪依真 A0230519060003 hongyz@swsresearch.com 李国盛 A0230521080003 ligs@swsresearch.com 刘洋 A0230513050006 liuyang2@swsresearch.com 联系人 崔航 (8621)23297818× cuihang@swsresearch.com 本期投资提示: AI芯片是大模型的基础。AI芯片主要分为训练和推理两类芯片,云和端对训练和推理芯片要求不同,目前主流架构包括GPU、FPGA和ASIC三类,通用性GPU>FPGA>ASIC,性能功耗比GPU<FPGA<ASIC。 四大AI芯片技术路线,均围绕打破英伟达CUDA生态垄断展开。英伟达凭借CUDA、cuDNN和TensorRT等软件工具链以及和Tensorflow的深度绑定构筑了极高的生态壁垒,2021年GPU市占率超80%,高性能AI芯片A100、H100被禁止向中国出口后,快速推出800系列合法出口中国;寒武纪复制英伟达成长之路。 GPT-4参数量高达100万亿,是GPT-3的500倍以上!即使考虑到AI芯片能力的提升(从当前主流的A100升级至H100),仍然需要巨量的额外增量投资。 AI芯片+AI服务器,受益于AIGC+类GPT等应用的“鲶鱼效应”。原有英伟达等供给有限,所以国产AI芯片有理论上的爆发弹性,AI服务器有成长空间。由于AIGC、类GPT有“鲶鱼效应”,带来约百倍算力需求 。而英伟达等供给解决需求有瓶颈(根据IDC咨询,预测2025年AI服务器市场空间仅仅318亿美元,21-25年预计CAGR仅仅19.5%),因此国产AI芯片在逻辑上有爆发弹性,此外AI服务器也有成长空间。 寒武纪思元590将是最早实现商业应用的接近英伟达A100性能的国产AI训练芯片。目前华为昇腾910性能超越英伟达V100,但未达到A100水平,壁仞科 技7nm通用GPU芯片BR100称其可与被禁售的英伟达H100一较高下,但尚未量产上市。寒武纪思源590 芯片面积800mm^2,和A100一样。内存带宽2.7T,是A100 1.8T的1.5倍。HBM2使用海力士,功耗达350W-550W,FP32算力到80TFLops,目前已经客户送样测试阶段,在高性能国产AI芯片中进程最快,最有机会承接国内AI算法商对英伟达A100、H100的需求。 重点推荐:1)直接受益AI芯片需求崛起的寒武纪(思元590将是最早实现商业应用的接近英伟达A100性能的国产AI训练芯片)、海光信息(预计2023年底量产的DCU3性能与NVDIA H100性能持平)。2)AI服务器供应商:浪潮信息、中科曙光、中兴通讯(通讯)、工业富联(电子)。 TMT领域算力基建逻辑,也建议关注通信、电子相关公司。 通信——天孚通信、中际旭创、紫光股份、锐捷网络、新易盛等。此外也持续关注流量基建主线的数据中心等环节供需变化,包括奥飞数据、润泽科技等,以及伴随算力增长的温控散热环节,英维克等。 电子——GPU:景嘉微、好利科技;视觉芯片及IP:思特威、富瀚微 、芯原股份;服务器存储及接口芯片:澜起科技、聚辰股份;CPU:海光信息、龙芯中科;FPGA芯片:复旦微、安路科技;数通/服务器PCB:沪电股份、深南电路、生益科技、胜 宏科技;光通信芯片:源杰科技。 风险提示:AI芯片迅速迭代,开启价格战;AIGC行业落地需求不及预期;供应链不稳定。 请务必仔细阅读正文之后的各项信息披露与声明 本研究报告仅通过邮件提供给 中庚基金 使用。2 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共23页 简单金融 成就梦想 投资案件 结论和投资分析意见 预计中国 互联网 大厂即 将进入 大模型 “军备 竞赛” 期,国 产AI芯片需 求进入 爆发期,带动AI服务器进入快速成长 期。 原因及逻辑 AI芯片+ AI服 务器,受益 于AIGC+类GPT等应用 的鲶鱼 效应。原有英 伟达等 供给有限,所 以国产AI芯片 有理论 上的爆 发弹性 ,AI服务器 有成长 空间。 由于AIGC、类GPT有 鲶鱼 效应, 带来约 百倍算 力需求 。而英 伟达等 供给解 决需求 有瓶颈 (根 据IDC咨询,预测2025年AI服务 器市场 空间仅 仅318亿美元,预计21-25年CAGR仅仅19.5%),因此国产AI芯片在逻辑上有 爆发弹 性,此 外AI服务 器也有 成长空 间。 有别于大众的认识 市场认为 ,英伟 达GPU生态难 以突破 ,我们 认为 ,国 产AI AISC性能 在主流 大模型算法中已能毕竟英伟达主流GPU计 算能力 水平 。 市场认为 ,国 产AI ASIC水 平竞争 格局较 差,我们认 为,当前AI ASIC芯片供 应商较多,但主要互联网产商AI芯片 采购较 为集中 。 本研究报告仅通过邮件提供给 中庚基金 使用。3 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第3页 共23页 简单金融 成就梦想 1. AI芯片:大模型的基础.................................................. 5 2. AI芯片四大技术路线,寒武纪复制英伟达 .................... 7 2.1英伟达:通用芯片GPU.............................................................................8 2.2寒武纪:复制英伟达成长之路 ............................................................... 10 2.3 AMD:部分兼容英伟达CUDA............................................................. 11 2.4谷歌、华为:“深度学习框架+AI芯片”自研 ................................... 12 3. 中国ASIC芯片格局:寒武纪卡位最优 ...................... 15 4. AIGC传导至潜在的百倍算力需求! .......................... 17 5. 重点关注公司 ............................................................... 20 6. 风险提示 ...................................................................... 21 目录 本研究报告仅通过邮件提供给 中庚基金 使用。4 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第4页 共23页 简单金融 成就梦想 图表目录 图1:云端训练、云端推理、设备端推理三个细分市场的AI芯片竞争格局 ....... 7 图2:寒武纪针对原生TensorFlow的修改(深灰色部分) .......................... 10 图3:寒武纪的端云一体软件栈架构 ............................................................ 10 图4:A MD的ROCm是和英伟达CUDA对等的智能编程语言..................... 11 图5:A MD的HIPify工具可以将英伟达C UDA代码转换为ROCm代码 ..... 11 图6:英伟达的CUDA栈............................................................................ 12 图7:A MD的ROCm栈............................................................................ 12 图8:华为在AI领域全栈自研:从底层芯片到智能编程语言再到深度学习框架14 图9:MindSpore和Pytorc h结合各类芯片训练速度(单位:张/秒) ........ 14 图10:Ope nA I首席执行官Sam Altma n谈C hatGP T每次聊天的成本....... 18 图11:GPT-3训练成本估算....................................................................... 18 图12:主流LLM模型训练成本估算............................................................ 19 图13:LLM训练/推理成本测算框架 ........................................................... 19 图14:过去5年中,LLM模型参数呈指数增长 ........................................... 20 表1:“端-边-云”对AI芯片的算力和功耗、延时性有不同的要求.................. 5 表2:国内外主流深度学习框架以及支持的硬件设备 ....................................... 8 表3:英伟达发布A 800、H 800实现向中国合法出口..................................... 9 表4:英伟达AI推理芯片参数一览 ................................................................ 9 表5:寒武纪AI芯片性能参数..................................................................... 10 表6:谷歌历代推理和训练芯片性能参数 ...................................................... 13 表7:华为主流推理和训练芯片性能参数 ...................................................... 14 表8:训练端芯片已有较多参与者 ................................................................ 16 表9:推理端芯片华为/阿里/寒武纪等布局较早 ............................................ 16 表10:重点公司估值表(单位:亿元) ...............