AI智能总结
引言 英伟达愿景使命 人工智能大模型的迅猛发展推动算力需求的高速增长,占据数据中心GPU市场98%这一绝对份额的英伟达,已经从曾经游戏显卡之王华丽转身成为人工智能时代“卖铲人”英伟达的野心绝不仅限于此,英伟达致力于成为人工智能计算领或的领导者,创造下一个工业革命,用算力来驱动智能时代的到来,驱动整个社会的智能化转型,让算力渗透到所有的社会领域,成为人工智能时代基础设施的提供商。 英伟达三芯战略 GPU(图像处理器)作为英伟达的核心产品,特别是在AI训练和推理、高性能计算以及图形染等领或,提供了强大的并行处理能力:CPU(中央处理器)的加入使得英伟达能够更好地应对需要快速逻辑判断和高度并行处理能力的应用;DPU(数据处理器)则专门针对数据中心和网络设备的需求,具有高效处理数据包和协议的能力。通过集成CPU、GPU和DPU到同一平台上,英伟达的三芯战略为客户提供了一站式的解决方案,能够更好地满足现代数据中心对于多样化计算需求的挑战。 英伟达四大业务 游戏业务是英伟达的基本盘,英伟达提供GeForceRTXGPU等针对个人电脑的显卡,SoC等针对游戏主机的显卡和GeForceNow为主的云游戏服务,目前游戏业务以“云游戏+AI为发展主线,不断强化RTX光线追踪和ACE虚拟数字人类生成两大关键技术,预计将在2025年发布AIPC芯片,进入高端笔记本电脑市场。专业可视化业务主要聚焦于为设计和可视化专业人士提供先进解决方案。英伟达面向专业级和企业级市场提供Quadro系列和RTX系列GPU,面向创作者和专业开发者提供6大版本的Omniverse实时协作平台,形成Omniverse生态系统,应用于电影制作、建筑设计、虚拟现实等众多领域。数据中心业务是驱动英伟达市值增长的第一大业务。英伟达提供从边缘计算到云端的全方位产品和解决方案,包括最新架构的CPU、GPU、DPU芯片、DGX系统、高速网络系列产品以及AIEnterprise等软硬件生态系统。英伟达持续强化五层算力体系,布局AI工厂,发布DGXSuperPOD超级计算机,引领下一代AI基础设施。未来,数据中心业务也从面向传统云服务商发展到面向各国家私有云及电信云,推出Jetson平台,大力布局边缘计算领域。汽车业务是英伟达极具未来潜力的关键业务。英伟达提供端到端的解决方案,包括Thor、Atlan汽车芯片、DRIVE软硬件及基础设施,赢得国内外广泛主机厂客户认可, 04英伟达应用场景 在医药领域,英伟达提供clareHoloscan计算平台,支持从医疗设备到边缘服务器的无缝连接,推动医学影像AI分析,与甲骨文,强生等代表性企业进行深度合作在汽车领域,英伟达提供DRIVE软硬件及Omniverse平台,赋能端到端的汽车自动驾驶解决方案,与特斯拉、小鹏等代表性企业进行深度合作在机器人领域,英伟达提供Issac、Omniverse及Jetson平台,协助开发各类型机器人,并且前瞻布局具身智能,与比业迪、西门子等代表性企业合作。 05英伟达竞争策略 英伟达采用“三团队-两季度”的创新研发选代模式,即三个井行开发团队专注于独立的分阶段产品开发,确保公司每6个月推出一次新产品领先市场1-2个研发周期,使得GPU的算力增长始终高于CPU的算力增长而无法被CPU集成,实现了计算机芯片产品品类的重新定义。 英伟达通过构筑软件生态、调动开发者、发掘应用场景对计算机形态进行渐进式改造,使得计算机从单纯的“CPU”形态逐渐演变为“CPU+GPU”形态,塑造计算机形态向着有利于其自身发展的形态演进 06英伟达生态壁垒 CUDA软件生态系统包括了多个层面,从编程语言和API支持到性能分析和调试工具,再到丰富的库和框架,以及对多种应用领域的支持,覆盖AI和HPC领域,CUDA与英伟达的GPU硬件紧密结合,提供了最佳的性能和最优化的体验。这种封闭的集成第略使得CUDA在性能上具有明显优势,构筑了软件覆盖率高、AI框架支持率高、细分行业渗透率高三大生态竞争壁垒,巩固了英伟达在AI和高性能计算市场的领导地位。通过提供全面的软件支持和优化,英伟达的GPU在训练和部署AI模型方面成为行业标准,使得英伟达在AI芯片市场中占据主导地位 供应链主导地位 英伟达充分利用数据中心对人工智能的无限需求,凭借自身的巨大产量和人工智能服务器所有技术和组件的超前领先地位,将网络组件、内存和其他组件都封装(CoWoS)到单个系统中,进而在供应链中占据主导地位。近日黄仁勋还透露,英伟达自主开发了很多技术,必要时,可弃用台积电,能让英伟达把订单转移给替代供应商。 为方便您的阅读请点图片横屏试货 发展历程 -发展阶段-市场表现 发展价段英伟达创立至今经过了创业初期、GPU定叉时期、GPU送代时期A萌芽时期、A精焊时五个阶段,并在2024年6月19日成为全球市值最高的公司 1998-2006 第一阶段:英伟达从游戏卡起家并发布世界上第一一款真正意义上的G产品,成为游戏显卡市场的领导者和GPU产品的定义者 第二阶段:2015年英伟达首次发布了面向深度学习处理器,GP芯片构架向A方可大步迈进,自前人工智能芯片方向的以市古奉80%处绝对基新的地位 发展战略 发展战略-产品策略-CPU-GPU-DPU 发展战略。英伟达通过对计算机底层技术的全面更新,以“CPU+GPU+DPU”三大芯片为产品底座推动英伟达成为人工智能计算领域的领导者 以CDA为核心的软件生态、证以NVDIAAI+NviDIAOmniverse为主的平台利各个场是下的应用框架 英伟达凭借快速送代的研发能力、供应链的主导地位、多种营销策略、肩平化的织、多元投资合作支撑游戏专业可视化、数据中心、汽车四大业务发展,进一步巩固企业在AI市场领导地位 二、产品策略。未来算力生态以CPU、GPU、DPU为三大核心算力芯片,英伟达、英特尔、AMD及其他代表企业抢占各芯片市场份额 英伟达在通用计算芯片CPU基础之上,开创当前GPU加速芯片时代,并将DPU作为第三颗主力芯片作为构建未来算力的基石和底座 基于未来以异构计为节的单力发展艳势和片上模式为的数据中心主流形态,更英伟大陆续通过自研及并购形成了GPU+CPU+DPU的三芯布局实现为客户提供更加全面、高效的计算解决方案 计贷机产业伴随荐兼容机的出现产业结构从过去的纵向一体化转变为植向切片式这种水平分层的产业形态超就了计算机产业基础层强惯性、高断性的特征 底层结构的碎片化会带来上层重复工作量和成本的大幅增加 英伟达通过对计机产品的重新定文,计黛机形态的通化竞争以及渐进式改造,步塑造计机形态向有利于自身的计算机演化方向 英伟达发布2025-2027年产品规划,Al芯片规划的战略核心是OneArchitecture”统一架构。AI芯片从两年次的重新周期转变为一年一次的更新周期,下一代Rb架构及具对应核心芯片已提上日程 英伟达日GraceCPU性能表现出色,专为高性能计贷及教据中插打造并将在2o26年推出领下一代eyeraCpU计划于未来几年推出消费者级别的CPU产品 NVIDIAGraceCPU性能表现Geekbench5多线程试比效 价值定位 应用领域 未来规划 超级计算领域:构建高性能计算系统,为科学研究和工程应用提供强大的计算支持人工智能领域:与NVIDIA的GPU相结合,为训练和推理任务提供高效的计算平台 英伟达在异构计算领域的进一步拓展在高性能计算和服务器市场迈出的重要一步为AI工厂等新型数据中心提供强大的计算支持 在2026年推出其下一代VeraCPU在未来几年内推出基于Arm的消费者级别CPU公众号·鼎雄咨询 NVDLAGraceCPU软件态系统将用于CPUGPU和DPU的全集NWLDIA软件与完整的Arm教据I中L生态系统相结合 遵循主流CPU设计原则 CPU符合Arm服务器基础系统架构(SBSA)以支持符合标准的硬件和软件接口支持Arm服务器基本引导要求(SBBR):以支持基于GraceCPU的系统上启用标准引导流程 提供符合标准的平台 -NVIDIAHPCSDK和每个CUDA组件都有Arm原生安装程序和容器。所有主要的Linux发行版,都可在NVIDIAGraceCPU上完美运行,无需修改编译器、库、工具、分析器、系统管理实用程序以及用于容器化和虚拟化的框架可轻松地在NVIDIAGraceCPU上安装和使用NVIDIAGPUCloud(NGC)还提供深度学习、机器学习和针对Arm优化的HPC容器 2.2GPU:GPU主要包括核心、显存、流处理器等部件,单核心数量远高于CPU,因此具有高效的并行处理能力任处理海量教据及加速计算时体现出独特架构优势 GPU(图形处理单元)是一种专门设计用于快速处理图像和视频道染的电脑硬件它是现代计算机系统中的关键组件,特别是在处理图形密集型任务时 英伟达两年一送代的速度持续电新GP架构,费米是世界上第一款直正意文上的GP架构,拍斯卡是首个加人更支持深度学习功能的架构,伏特是真正意义上的第一款A工芯片 TensorCore加速Al性能 最新Backwe架构搭载于GB20o、B100B20O,推动数据中进一步专型:为智能T厂奠定技术基码 结构与特点 代表产品 Blackwell架构的作用 基于BlackWellGPU的几种产品变体包括GB200、B200和B100,涵盖从超级芯片到离散加速器的多种配置,满足不同计算需求和系统兼容性。GB200集成了两个BlackwellGPU和一个72核的GraceCPU的超级芯片,在提供一体化解决方案方面实力突出。B200GPU在AI计算领域突出,处理1.8万亿参数的模型,性能提升15倍。B100能应对1730亿参数的大语言模型。2000张BlackwellGPU仅需1/4的电力即可完成与8000张HopperGPU相同的训练任务。 Blackwell架构采用了TSMC的4NP制程技术,特点是搭载了2080亿个品体管和高达192GB的HBM3e内存,以及8TB/s的内存带宽,显示出其在硅片设计和内存技术方面的先进性。Blackwel架构支持新的精度格式和微张量缩放技术,使得AI模型可以在保持高精度的同时实现更高的性能。与CUDA,TensorFlow,PyTorch等主流柜架兼容,并通过与各类生态系统合作伙伴协作,增强了应用发和部奢的灵活性 未来产品规划 启动Blackwel芯片的量产推出基于x86架构的H200hL40SB100和B40芯片带宽增加3 推出BlackwellUltraGPU8颗HBM3e12hi内存并推出降规版B200A4颗HBM3e12hi 推出RubinUitra GPU 12颗HBM4内存Arm的VeraCPU和NVLink6Switch(3600GB/s)步巩固英伟达在高性能计算和AI市场的领先地位,为更复杂计算任务提供支持 采用8颗HBM4内存VeraCPU作为Blackwel平台的继任者。 H200将提升内存至282GB,倍,搭载144GB的HBM3内存。 英伟达为GPU开发的CUDA统一计架构,利用GPU的并行计算能力加速大规模计红务,使GPU能够解快复杂的计算问题,促成了GPU+CPU协作的系统生态结构形成 允许程序员编写直接在GPU上运行的代码,并增加了控制GPU并行处理的功能开发者可以精确分配和控制数据在GPU核心上的处理,实现高效并行计算 UDA软件生态包含丰富的组件、缆程热(CC++、Eortran、Python和MATAB)、API开发和调试T具等,撒盖AI和HPC领域,构筑了软件盖率高、AI框架支持密高、细分行业渗透率高等竞争壁至 CUDA生态软硬件协同,赋能深度学习、信号与图像处理、线性代数及并行算法等多个应用场景 图形处理 GPU加速库为您的应用进程提供“嵌入式”加速 常用于视频游戏和电影特效中的大规模图形道染。例如,电影制作公司利用CUDA加速渣染过程大幅减少渣染时间,提高效率。(