行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

国金计算机科技星环科技GPUNative数据库平台与

2026-03-06 未知机构 LM

核心观点与关键数据

大模型推理推动计算架构转向GPU核心

传统计算架构以CPU为核心：设计用于运行逻辑复杂的程序，如操作系统和Web服务器。
GPU强项在于并行处理：AI推理的矩阵运算天然适合GPU的SIMT单指令多线程架构。
内存墙瓶颈：CPU使用DDR内存带宽50-200GB/s，GPU使用HBM带宽达2-5TB/s，数据供不应求是主要瓶颈。

GPU直连技术探索与目标

打破PCIe瓶颈：
- NVLink/NVSwitch实现GPU间直连，无需CPU中转。
- CXL允许GPU直接访问系统内存或共享地址空间。
- 封装化方案（如NV的Grace-Hopper或苹果M芯片）将CPU与GPU集成。
存储直连技术：
- NVMe SSD直接将数据传输至GPU显存，CPU仅负责指令。
- 现有路径：硬盘数据→系统内存→CPU处理→GPU显存，存储直连可省略中间环节。

数据库向GPU-Native变革路径

算子重构：
- 传统DB算子需用CUDA或OpenCL重写，以适配GPU并行架构。
- 执行计划直接调用GPU内核函数，在显存中完成数据过滤、聚合和连接。
显存管理：
- 数据库需直接管理GPU显存，通过智能算法决定热数据驻留策略。
- GDS（GPU Direct Storage）实现显存与存储的高速交互。
数据布局优化：
- 从CPU友好的行式存储转向GPU友好的列式存储。
- 对齐磁盘、内存和GPU传输的数据格式。
全面向量化：
- 查询引擎需一次处理向量块，适配AI推理中的RAG（Retrieval-Augmented Generation）。
- 内置GPU加速的向量索引，提升向量检索效率。

技术前瞻性与市场空间

公司官网已发布GPU-native数据库，性能较CPU模式提升显著。
ArgoDB作为分布式闪存数据库，具备技术前瞻性和广阔市场空间。
未来或与NVIDIA合作探索GPU直连方案，进一步优化数据库性能。

#与NV合作、关注3月GTC大会进展。当前，公司官网已有GPU-native数据库发布，效果相比CPU模式提升显著；下一步或与NV共同探讨GPU直连方案，公司的ArgoDB本身就是分布式闪存数据库，技术前瞻性和市场空间有目共睹。 1、大模型推理潮起、计算架构亟需转向“以GPU为核心”。【国金计算机&科技】星环科技：GPU-Native数据库平台 #与NV合作、关注3月GTC大会进展。当前，公司官网已有GPU-native数据库发布，效果相比CPU模式提升显著；下一步或与NV共同探讨GPU直连方案，公司的ArgoDB本身就是分布式闪存数据库，技术前瞻性和市场空间有目共睹。 1、大模型推理潮起、计算架构亟需转向“以GPU为核心”。 1）控制vs计算：传统计算架构以CPU为核心，本身是为了运行操作系统、Web服务器这种逻辑复杂的程序设计的。而GPU强项在于SIMT单指令多线程，AI推理就是一层层的矩阵运算，天然适合GPU并行吞吐。 2）内存墙：大模型推理最大的瓶颈不是算得不够快，而是数据供不上来。 CPU使用DDR内存，带宽通常在50-200GB/s；而GPU使用HBM，带宽可达到2-5TB/s。 2、GPU直连是目标、NV&存储厂已开始探索。 1）打破PCIe瓶颈：传统架构中，数据必须先经过CPU，再通过PCIe总线传给GPU。改变后，NVLink/NVSwitch让GPU之间直接互联，不走CPU；CXL允许GPU直接访问系统内存，甚至共享地址空间；也可以像NV的Grace-Hopper或苹果M芯片，CPU和GPU封装在一起。 2）存储直连：现在的路径，从硬盘读取数据->进系统内存-> CPU处理->拷贝到GPU显存；通过存储直连GPU技术，让NVMe SSD直接把数据传输到GPU显存，CPU只负责发号施令，不碰数据。 3、数据库向GPU-Native变革、计算效率呈量级提升。 1）算子重构：传统DB的算子都是用C++/Java为CPU写的，后续须用CUDA或OpenCL重写这些算子。数据库查询引擎在生成执行计划时，直接调用GPU内核函数，在显存中完成数据的过滤、聚合和连接。 2）以后数据库需要直接管理GPU显存，需要智能的算法来决定哪些热数据常驻显存，哪些数据通过GDS快速换入换出。 3）数据布局：从对CPU友好的行式存储到对GPU友好的列式存储，同时对齐磁盘上的、内存里的、传给GPU的数据格式。 4）全面向量化：数据库查询引擎必须是一次处理一个向量块；同时，AI推理通常伴随着RAG，数据库内核需内置GPU加速的向量索引。

点击免费查看完整报告