AI智能总结
AI芯片赋能算力基石,英伟达垄断全球市场。根据芯片的类别,AI算力芯片主要包括GPU、FPGA,以及以TPU、VPU为代表的ASIC芯片,其中以GPU用量最大,据IDC数据,预计到2025年GPU仍将占据AI芯片8成市场份额。 由于英伟达GPU产品线丰富、产品性能顶尖、开发生态成熟,目前全球AI算力芯片市场由英伟达的GPU垄断,根据中国信通院的数据,2021年Q4英伟达占据了全球95.7%的GPU算力芯片市场份额。2023财年,英伟达数据中心营收达到150亿美元,同比增长41%,FY2017-FY2023复合增速达63%,表明全球AI芯片市场规模保持高速增长。 国产AI算力芯片正起星星之火。全球AI芯片市场被英伟达垄断,然而国产AI算力芯片正起星星之火,投融资热度高企。根据电子发烧友统计,2022年多家AI芯片公司获得大额融资,其中摩尔线程达15亿元、天数智芯超10亿元、沐曦达10亿元。在国产AI算力芯片中,寒武纪推出的云端训练侧产品思元290达到512TOPSINT8算力,训推一体产品思元370达到256TOPSINT8算力; 海光信息DCU产品深算一号部分参数对标英伟达A100。国内非上市公司中,天数智芯的训练侧产品BI达到295TOPS INT8算力;沐曦的推理侧产品MXN100已于2022年8月回片点亮。互联网巨头亦强势入局AI芯片,腾讯领投的燧原科技推出推理侧产品云燧i20,INT8算力达256TOPS;百度孵化的昆仑芯推出训推一体AI芯片R200,INT8算力达256TOPS;背靠阿里的平头哥亦早在2019年就推出推理侧AI芯片含光800。 自主可控受高度重视,国产AI算力芯片迎“芯“机遇。2月27日,中共中央、国务院印发了《数字中国建设整体布局规划》,《规划》提出要夯实数字基础设施,我们认为,数字中国基础设施的建设有望拉动以数据中心、超算中心、智能计算中心为代表的算力基础设施建设,从而带动服务器与AI算力芯片的需求快速增长。同时,为构筑自立自强的数字技术创新体系,上游AI芯片作为算力基础,自主可控需求凸显,数字中国建设对AI芯片国产化提出新要求。 投资建议:我们看好以海光信息、寒武纪、天数智芯、沐曦为代表的AI算力芯片公司持续突破,以及以芯原股份为代表的IP公司在AI芯片大潮下加速成长。建议关注AI芯片相关赛道投资机遇。 风险提示:疫情反复影响生产经营;下游需求不及预期;研发进展不及预期。 重点公司盈利预测、估值与评级 1国产AI算力芯片正起星星之火 1.1AI芯片赋能算力基石,英伟达垄断全球市场 AI算力芯片主要包括GPU、FPGA,以及以VPU、TPU为代表的ASIC芯片。 其中以GPU用量最大,据IDC数据,预计到2025年GPU仍将占据AI芯片8成市场份额。然而,相较传统图形GPU,通用型算力GPU在芯片架构上缩减了图形图像显示、渲染等功能实现,具有更优的计算能效比,因而被广泛应用于人工智能模型训练、推理领域。 表1:主流AI芯片分类 根据在网络中的位置,AI芯片可以分为云端AI芯片、边缘和终端AI芯片; 根据其在实践中的目标,可分为训练(training)芯片和推理(inference)芯片。云端主要部署高算力的AI训练芯片和推理芯片,承担训练和推理任务,具体有智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。 图1:云端、边缘和终端AI芯片应用情况 由于英伟达GPU产品线丰富、产品性能顶尖、开发生态成熟,目前全球AI算力芯片市场仍由英伟达垄断。根据中国信通院的数据,2021年Q4英伟达占据了全球95.7%的GPU算力芯片市场份额,因此,英伟达数据中心业务营收增速可以较好地反应全球AI芯片市场增速。2023财年,英伟达数据中心营收达到150亿美元,同比增长41%,FY2017-FY2023复合增速达63%,表明全球AI芯片市场规模保持高速增长。 图2:2017-2023财年英伟达数据中心营收(亿美元) 1.2性能与生态构筑AI算力芯片高壁垒 评价AI芯片的指标主要包括算力、功耗、面积、精度、可扩展性等,其中算力、功耗、面积(PPA)是评价AI芯片性能的核心指标: (1)算力:衡量AI芯片算力大小的常用单位为TOPS或者TFLOS,两者分别代表芯片每秒能进行多少万亿次定点运算和浮点运算,运算数据的类型通常有整型8比特(INT8)、单精度32比特(FP32)等。AI芯片的算力越高,代表它的运算速度越快、性能越强。 (2)功耗:功耗即芯片运行所需的功率,除了功耗本身,性能功耗比是综合衡量芯片算力和功耗的关键指标,它代表每瓦功耗对应输出算力的大小。 (3)面积:芯片的面积是成本的决定性因素之一,通常来讲相同工艺制程之下,芯片面积越小良率越高,则芯片成本越低。此外,单位芯片面积能提供的算力大小亦是衡量AI芯片成本的关键指标之一。 除PPA之外,运行在AI芯片上的算法输出精度、AI应用部署的可扩展性与灵活性,均为衡量AI芯片性能的指标。 图3:常见AI芯片评价标准 英伟达的GPGPU是全球应用最为广泛的AI芯片,决定其性能的硬件参数主要包括:微架构、制程、CUDA核数、Tensor核数、频率、显存容量、显存带宽等。其中,微架构即GPU的硬件电路设计构造的方式,不同的微架构决定了GPU的不同性能,作为英伟达GPU的典型代表,V100、A100、H100 GPU分别采用Volta、Ampere、Hopper架构;CUDA核是GPU内部主要的计算单元;Tensor核是进行张量核加速、卷积和递归神经网络加速的计算单元;显存容量和带宽是决定GPU与存储器数据交互速度的重要指标。 表2:英伟达V100/A100/A800/H100对比 除GPU硬件之外,与之配套的软件开发体系亦是生态的重要组成部分。GPU的生态包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等,英伟达于2006年发布的CUDA平台是当今全球应用最为广泛的AI开发生态系统。通用GPU与CUDA组成的软硬件底座构成了英伟达引领AI计算的根基,当前全球主流深度学习框架均使用CUDA平台。 图4:英伟达CUDA生态系统 生态构建计算壁垒,国产GPU厂商初期兼容CUDA,长期仍需构筑自身软硬件生态。由于当前全球主流深度学习框架均使用CUDA平台进行开发,国产GPU可以通过兼容CUDA的部分功能,快速打开市场,减少开发难度和用户移植成本。 然而,CUDA本身涵盖功能非常广泛,且许多功能与英伟达GPU硬件深度耦合,包含了许多英伟达GPU的专有特性,这些特性并不能在国产AI芯片上全部体现。 因此,长期来看国产GPU厂商仍需通过提升自身的软硬件实力,构筑属于自己的软硬件生态。 1.3国产AI算力芯片全景图 全球AI芯片市场被英伟达垄断,然而国产AI算力芯片正起星星之火。目前,国内已涌现出了如寒武纪、海光信息等优质的AI算力芯片上市公司,非上市AI算力芯片公司如沐曦、天数智芯、壁仞科技等亦在产品端有持续突破。 表3:国产AI算力芯片公司对比 表4:国产AI算力芯片公司主要产品对比 1.3.1寒武纪 寒武纪成立于2016年,公司研发团队成员主要来自于中科院,董事长陈天石曾任中科院计算所研究员。寒武纪AI芯片思元290面向云端训练,思元370面向云端训推一体,两款芯片均采用 7nm 制程工艺。此外,思元370是寒武纪首款采用chiplet技术的AI芯片,最大算力高达256TOPS;训练侧新品思元590在研发中。 图5:思元370系列板卡与业内主流GPU性能对比 2月27日,寒武纪发布2022年业绩快报,公司2022年实现营收7.29亿元,同比增长1.11%;实现归母净利润-11.66亿元,亏损同比扩大41.40%。寒武纪2022年归母净利润亏损同比扩大主要原因系公司研发费用、资产减值损失、信用减值损失有所增长。 2022年,寒武纪云端产品已打入阿里云等头部互联网客户,并与头部银行等金融领域客户进行了深度技术交流,同时亦得到了头部服务器厂商的认可。展望2023年,随着ChatGPT为代表的AI大模型不断涌现,AI算力需求有望加速增长,从而驱动AI算力芯片需求增长。寒武纪作为国内领先的AI芯片公司,产品研发、市场拓展、客户导入均有较强先发优势,有望深度受益AI发展的浪潮与AI算力芯片国产化趋势,在23年取得快速成长。 1.3.2海光信息 海光信息成立于2014年,公司骨干研发人员多拥有国内外知名芯片公司的就职背景,拥有成功研发x86处理器或ARM处理器的经验。海光信息的DCU芯片深算一号采用 7nm 工艺,兼容“类CUDA”环境,软硬件生态丰富,已于2021年实现规模化出货,未来将广泛应用于大数据处理、人工智能、商业计算等领域。 表5:海光深算一号与NVIDIA、AMD产品参数比较 to276GB/s 2月23日,海光信息发布2022年业绩快报,公司2022年实现营收51.25亿元,同比增长121.83%;实现归母净利8.02亿元,同比增长145.18%。2022年,海光信息在保持高研发投入的同时,大力拓展国内市场,有效提升了公司在国内高端处理器领域的领先优势和市场地位,业务稳步增长。 风险提示:行业竞争加剧的风险;行业景气度波动的风险;行业技术路线变化的风险。 1.3.3沐曦集成电路 沐曦集成电路成立于2020年,公司创始团队处于国内顶尖行列——创始人陈维良曾任AMD全球GPGPU设计总负责人;两位CTO均为前AMD首席科学家,目前分别负责公司软硬件架构;核心成员平均拥有近20年高性能GPU研发经验。沐曦于2022年7月完成10亿元Pre-B轮融资,由混沌投资领投。沐曦首款异构GPU产品MXN100采用 7nm 制程,已于2022年8月回片点亮,主要应用于推理侧;应用于AI训练及通用计算的产品MXC500已于2022年12月交付流片,公司计划2024年全面量产。 图6:沐曦MXN系列GPU(曦思)产品概念图 图7:沐曦MXC系列GPU(曦云)产品概念图 1.3.4天数智芯 天数智芯成立于2015年,首席科学家郑金山为原AMD首席工程师,首席技术官Chien-Ping Lu曾任三星全球副总裁。2022年7月,公司完成超10亿元人民币的C+轮及C++轮融资。天数智芯的BigIsland云端GPGPU是一款具有自主知识产权、自研IP架构的 7nm 通用云端训练芯片,这款芯片达到295TOPS INT8算力。 图8:MI100、英伟达A100、BigIsland对比 1.3.5壁仞科技 壁仞科技成立于2019年,创始人张文曾任商汤科技总裁,CTO洪洲曾任职于海思的GPU自研团队,软件生态环境主要负责人焦国方曾创建高通公司骁龙GPU团队、领导了5代Adreno GPU架构开发。2021年3月,公司完成B轮融资,累计融资金额超47亿元。2022年8月,壁仞科技发布首款GPGPU芯片BR100,BR100芯片采用chiplet技术,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上。 图9:BR100的封装工艺 1.3.6燧原科技 对于互联网大厂来说,腾讯、百度、阿里巴巴等均在AI芯片领域大力布局。 其中,腾讯投资燧原科技、百度投资昆仑芯、阿里巴巴则孵化了平头哥。 燧原科技成立于2018年,公司创始人赵立东曾任紫光通信科技集团有限公司副总裁、AMD计算事业部高级总监;COO张亚林曾任AMD资深芯片经理、技术总监。公司最新发布的第二代推理产品云燧i20是面向数据中心应用的第二代人工智能推理加速卡,采用 12nm 工艺,通过架构升级大大提高了单位面积的晶体管效率,算力可媲美7nm GPU,达到256TOPS。 图10:云燧i20VSi10性能对比 1.3.7昆仑芯 昆仑芯成立于2011年,前身为百度智能芯片及架