您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[上海证券]:计算机行业先进科技主题周报:英伟达发布H200,生成式AI算力设施再演进 - 发现报告

计算机行业先进科技主题周报:英伟达发布H200,生成式AI算力设施再演进

信息技术2023-11-23刘京昭上海证券L***
AI智能总结
查看更多
计算机行业先进科技主题周报:英伟达发布H200,生成式AI算力设施再演进

——先进科技主题周报20231111-20231117 年初以来,以GPT为代表的生成式人工智能模型持续落地和商业化,展现出生成式人工智能模型在办公、教育等场景下的巨大潜力。作为人工智能模型训练与应用部署的重要基础设施,面向人工智能的算力设施设计指标也不断升级,促使以算力和通信为代表的人工智能基础设施迎来新的增长空间。 本周上证指数报收3054.37点,周涨跌幅为+0.51%;深证成指报收9979.69点,周涨跌幅为+0.01%;创业板指报收1986.53点,周涨跌幅为-0.93%;沪深300指数报收3568.07点,周涨跌幅为-0.51%。中证人工智能指数报收1096.65点,周涨跌幅+2.77%,板块跑赢大盘。 在人工智能主线方面,本周值得关注的有: 1)NVIDIA面向推理场景发布H200:在SC23上,NVIDIA宣布推出NVIDIA HGX H200。NVIDIA HGX H200基于NVIDIA Hopper架构,配备NVIDIA H200 Tensor Core GPU和HBM3e显存,能够更好地支持处理生成式AI和高性能计算场景下的工作负载。NVIDIA H200所配备的141GB HBM3e显存拥有4.8 TB/s的带宽,与NVIDIA H100相比,显存增加76%,带宽增加43%。以Llama2-70B模型为例,NVIDIA H200的推理速度是NVIDIA H100的1.9倍,大幅提高了对生成式AI推理场景的支持能力。 《AI可以更乐观,布局正当时》——2023年09月26日 2)微软发布面向AI场景的ASIC芯片,Microsoft 365Copilot正式开放商用:微软在今年的Ignite大会上发布了针对生成式AI场景进行了优化的ASIC芯片—Maia100,以及专为在Microsoft云上运行通用计算工作负载而设计的Arm架构CPU—Cobalt100。在内存带宽方面,Maia100配置了1.6TB/s的带宽,介于同为CSPs自研ASIC芯片的TPUv5和Trainium/Inferentia2之间。在网络方面,类似于TPUv5的专有ICI网络,每块Maia100拥有内置的RDMA以太网IO,单块芯片的单向IO速率为4.8Tb/s,超越了NVIDIA和AMD的最新计算卡。此外,Microsoft365Copilot正式面向企业开放商用,而OpenAI发布的GPT-3.5Turbo、GPT-4 Turbo、DALLE·3也在微软Azure上正式商用或发布了预览版本。 《旗舰手机新品发布,人工智能、手机卫星通信持续升级》——2023年09月25日 《持续看好华为链投资机会》——2023年09月21日 3)可穿戴设备AIPin问世:初创公司Humane发布了其首款配置了生成式AI语言助理的可穿戴设备AIPin,并于11月16日正式上市。AIPin可以固定在衣物上,通过激光将显示界面投射到手掌上,然后通过点击、手势或语音来完成交互。根据Humane公布的配置,AIPin搭载的是一款未知型号的高通8核心SoC,峰值频率为2.1GHz,低于同样为8核心的高通8 Gen3。 我们认为:(1)算力端:H200在硬件配置上,较H100提升了显存容量和显存带宽,针对推理场景进行了优化,有望助力解决推理端算力紧缺的现状,为下一阶段生成式AI应用的落地奠定基础。同时,在端 侧算力方面,以AIPin和GooglePixel8为代表的终端设备开始配备AI助手类应用,考虑到网络连接的不稳定性等因素,部分不依赖网络的端侧的推理成为生成式AI落地的重要方向。(2)算法端:具备文生文或文生图功能的生成式AI模型不断迭代升级,以Microsoft365Copilot为代表的AI+办公应用正借助成熟模型加速落地。(3)应用端:随着算力设施支持能力的提升,以及算法持续迭代,人工智能应用有望逐步丰富并不断降低使用成本。 此外,本周卫星通信领域也值得关注: Starship运载火箭第二次试射:由SpaceX公司研发并生产的Starship(星舰)运载火箭进行了第二次试射。试射过程中,一、二级火箭进行了热分离。星舰目前的设计最大载荷为100-150吨,是同样由SpaceX公司研发的猎鹰9号运载火箭的至少4.4倍。我们认为:星舰相较其他在役的运载火箭,具有载荷大、单次使用成本低的优点。若火箭能完成设计和验证,有望进一步降低卫星发射成本,有助于低轨道通信卫星的大批量发射,或将加速卫星互联网的落地进度,降低长期维护成本。 ◼投资建议 我们建议:跟踪生成式AI发展进程,应优先关注商业化落地的性价比,特别是有无充足的算力设施支持其后续的发展。在商业化落地的过程中,前期算力设施领域的增长空间会较为明显,且具有较高的确定性。后期随着软件应用的成熟,应优先关注需求具有较高确定性的高成长空间赛道中,上下游绑定较为紧密,具有较高行业壁垒的低估值公司。 科技板块中,建议关注以下赛道: 1)液冷:随着GPU服务器上架数量的不断提高,其散热问题也逐渐受到关注。近年来,通信运营商和地方政府陆续发布文件,对新建和存量数据中心的PUE等关键能耗指标做出限制。这有利于液冷在服务器市场提高渗透率,实现确定下较高的增长。与下游服务器厂商有较强合作关系的液冷厂商,有望取得较好的营收和利润增长。 2)光模块/光引擎:在GPU服务器集群中,交换机与交换机间往往采取光缆连接,由于GPU互相访问显存的需要,网络架构需具备低延迟、高速率的特性。因此,800G、400G光模块爆发了较大的需求量,此前研发、测试进度较快,与Google、NVIDIA等下游客户已存在合作关系的行业头部企业有望获得竞争优势。 3)AI+办公/AI+教育:随着AI+办公领域生成式AI应用的迭代成熟,有望进一步提高渗透率,实现相关企业的发展。今年以来,以搭载生成式AI应用的智能学习机为代表的智慧教育赛道发展迅速。相较平板+APP的传统模式,智能学习机更适合教育场景,有望助力生成式AI在教育领域快速实现落地。 ◼风险提示 下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 分析师声明 作者具有中国证券业协会授予的证券投资咨询资格或相当的专业胜任能力,以勤勉尽责的职业态度,独立、客观地出具本报告,并保证报告采用的信息均来自合规渠道,力求清晰、准确地反映作者的研究观点,结论不受任何第三方的授意或影响。此外,作者薪酬的任何部分不与本报告中的具体推荐意见或观点直接或间接相关。 公司业务资格说明 本公司具备证券投资咨询业务资格。 投资评级说明: 不同证券研究机构采用不同的评级术语及评级标准,投资者应区分不同机构在相同评级名称下的定义差异。本评级体系采用的是相对评级体系。投资者买卖证券的决定取决于个人的实际情况。投资者应阅读整篇报告,以获取比较完整的观点与信息,投资者不应以分析师的投资评级取代个人的分析与判断。 免责声明 本报告仅供上海证券有限责任公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。 本报告版权归本公司所有,本公司对本报告保留一切权利。未经书面授权,任何机构和个人均不得对本报告进行任何形式的发布、复制、引用或转载。如经过本公司同意引用、刊发的,须注明出处为上海证券有限责任公司研究所,且不得对本报告进行有悖原意的引用、删节和修改。 在法律许可的情况下,本公司或其关联机构可能会持有报告中涉及的公司所发行的证券或期权并进行交易,也可能为这些公司提供或争取提供多种金融服务。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见和推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值或投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见或推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中的内容和意见仅供参考,并不构成客户私人咨询建议。在任何情况下,本公司、本公司员工或关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负责,投资者据此做出的任何投资决策与本公司、本公司员工或关联机构无关。 市场有风险,投资需谨慎。投资者不应将本报告作为投资决策的唯一参考因素,也不应当认为本报告可以取代自己的判断。