AI智能总结
加速计算和生成式AI是新工业革命里程碑,已达爆发临界点。 2022年ChatGPT爆红掀起AI浪潮,2023年生成式AI崭露头角,这是新工业革命的重要里程碑。Transformer模型推出后,大模型每六个月有效扩展1倍。当前最新、最先进的OpenAI模型已拥有约1.8亿个参数,需要几万亿Token进行训练。因此,通用计算已经失去动力,需要另一种计算方式以继续扩大计算规模并降低计算成本,需要更大的GPU支持。 “ 世界最强大芯片”Blackwell问世,AI性能达到Hopper的5倍 。 Nvidia推出Blackwell架构GPU B200(一个封装内有两片die,使用传输速度10TB/s的NVLink5.0技术连接),该芯片集成2080亿个晶体管(Hopper集成800亿个晶体管),采用台积电4NP制造工艺,能够提供高达20 PFLOPS的FP4性能(Hopper为4PFLOPS),配备192GB HBM3e内存,提供高达8TB/s的带宽。同时其推出“超级芯片”GB200,由2个B200 GPU和1个GraceGPU组成。相较于H100 Tensor Core GPU,GB200超级芯片在大语言模型推理工作负载方面的性能提高30倍,并将成本和能耗降低了25倍。亚马逊、谷歌、Meta、微软、甲骨文云和OpenAI等公司都将是Blackwell芯片的首批用户。 推出创新AI软件NIMs,大幅缩短使用该服务客户部署定制应用时间。 Nvidia推出数十项企业级生成式AI微服务,其中NIMs(NvidiaInference Micro Service)适用于英伟达及合作伙伴生态系统中20多个热门AI模型进行推理优化。企业利用微服务在自身平台上创建和部署定制应用,能够将部署时间从几周缩短几分钟。英伟达希望能够通过微服务吸引购买英伟达服务器的客户注册NvidiaAI Enterprise 5.0,对每个GPU收取4500美元/年的费用。 携手微软Azure发布的AI Foundry, 为企业打造定制生成式AI模型。 NvidiaAI代工服务主要面向使用Microsoft Azure的初创公司和企业,该服务包括NvidiaAI基础模型、NEMO框架和工具以及DGX云AI超级计算,允许公司在Microsoft的云平台上构建和部署自定义AI模型,包括智能搜索、摘要和内容生成。商业软件开发商SAP、提供基于云的数据仓库和分析服务公司Snowflake均在使用该服务。 Omniverse可连接至Vision Pro,GR00T备战人形机器人。 关于仿真平台Omniverse,黄仁勋重点介绍了利用其在预测气候问题方面的进展,并提到Omniverse Cloud将可以连接到苹果MR头显VisionPro。此外,Nvidia发布了人形机器人通用基础模型Project GR00T,并推出基于Nvidia Thor系统级芯片的新型人形机器人计算机JestsonThor,对适用于自主移动机器人的IsaacRobotics平台进行了升级。 风险提示:宏观经济不及预期;地缘政治风险;AI应用落地不及预期;AI芯片需求不及预期等。 长城证券股份有限公司(以下简称长城证券)具备中国证监会批准的证券投资咨询业务资格。 本报告由长城证券向专业投资者客户及风险承受能力为稳健型、积极型、激进型的普通投资者客户(以下统称客户)提供,除非另有说 为诉讼、仲裁、传媒及任何单位或个人引用的证明或依据,不得用于未经允许的其它任何用途。如引用、刊发,需注明出处为长城证券研究院,且不得对本报告进行有悖原意的引用、删节和修改。 本报告是基于本公司认为可靠的已公开信息,但本公司不保证信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他投资标的的邀请或向他人作出邀请。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 长城证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。长城证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 长城证券版权所有并保留一切权利。