您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[申万证券]:计算机行业GenAI系列报告之65:AI Infra,应用渗透下的又一卖铲人 - 发现报告

计算机行业GenAI系列报告之65:AI Infra,应用渗透下的又一卖铲人

计算机行业GenAI系列报告之65:AI Infra,应用渗透下的又一卖铲人

2025年12月22日 ——GenAI系列报告之65 看好 相关研究 本期投资提示: AI Infra作为AI模型训练与推理的底层支撑,已成为应用落地的关键“卖铲人”。本篇报告核心解答三个问题:1)哪些Infra软件是刚需;2)生成式AI给核心Infra软件带来了何种影响;3)生成式AI影响下,竞争格局和态势如何变化,厂商又如何动作。 证券分析师黄忠煌A0230519110001huangzh@swsresearch.com洪依真A0230519060003hongyz@swsresearch.com曹峥A0230525040002caozheng@swsresearch.com 算力调度是决定模型推理盈利水平的核心变量。国内模型Token收费显著低于海外,成本敏感度更高。阿里Aegaeon通过Token级调度可减少82% GPU用量,华为Flex:ai提升30%算力利用率,高效调度能力成为模型推理厂商盈利关键。根据我们测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点。⚫ 数据类Infra需求先于应用爆发,向量数据库成刚需。RAG技术渗透率快速提升,Gartner预测2025年企业采用率将达68%。向量数据库作为RAG核心组件,支撑海量数据毫秒级检索,市场需求持续高增。⚫ 研究支持曹峥A0230525040002caozheng@swsresearch.com 联系人曹峥A0230525040002caozheng@swsresearch.com AI时代数据架构从“分析优先”转向“实时运营+分析协同”,行业发生了几点重要的变化:1)NoSQL+OLTP数据库再风靡,通过补充向量索引能力切入向量数据库市场;2)数据湖、数据仓库厂商(OLAP为主)通过并购、合作方式引入AI模型,向全栈工具迈进。⚫ MongoDB凭借“低门槛+高弹性”,契合中小客户低成本AI落地需求,增长弹性突出。MongoDB作为文档型NoSQL数据库,其适配非结构化数据存储与高频实时CRUD操作,契合AI原生应用与Agent需求,2025年收购Voyage AI补齐向量检索能力。FY26Q3核心产品实现30%增速,增长弹性突出。⚫ Snowflake与Databricks靠全流程工具链和客户粘性,占据数据密集型行业核心场景,但需应对CSP跨界竞争与实时能力短板。Snowflake与Databricks以OLAP为核心向全栈工具延伸,靠海量数据处理能力成为中大型企业首选,但TP能力暂有不足(尤其是Snowflake),面临中小市场渗透与云厂商挤压压力。⚫ GPU主导数据控制中心,存储与数据库技术升级。NVIDIA推出SCADA方案实现GPU直连SSD,将IO延迟降至微秒级。向量数据库需适配GPU并行计算,通过列式存储、算子重写等技术升级,匹配AI实时推理需求。⚫ 结论和投资分析意见:生成式AI+Agent加速渗透,AIinfra软件作为应用部署的基础设施,有望进入高速增长期。看好高实时性、可灵活拓展的分布式交易型数据库厂商(OLTP),以及增量的向量数据库。相关标的:MongoDB、达梦数据、英方软件、Snowflake、深信服等。⚫ 风险提示:商业化与IT支出不及预期;生态竞争加剧风险,云厂商自研与平台整合挤压份额;技术迭代与产品成熟度风险。⚫ 投资案件 结论和投资分析意见 生成式AI+Agent加速渗透,AI infra软件作为应用部署的基础设施,有望进入高速增长期。看好高实时性、可灵活拓展的分布式交易型数据库厂商(OLTP),以及增量的向量数据库。 相关标的:MongoDB、达梦数据、英方软件、Snowflake、深信服等。 两类产品是重点:算力调度类软件和数据类软件。算力调度类软件将主要由CSP等大型下游客户攻克,包括华为、字节跳动、阿里巴巴等。 数据类软件,OLTP、OLAP两类厂商差异化场景适配。MongoDB凭借“低门槛+高弹性”,契合中小客户低成本AI落地需求,有望借庞大客户基数扩张份额。Snowflake与Databricks靠全流程工具链和客户粘性,占据数据密集型行业核心场景,但需应对CSP竞争与实时能力短板,需技术迭代巩固高客单价市场壁垒。 看好相关标的包括MongoDB、达梦数据、英方软件、Snowflake、深信服等。 原因与逻辑 算力调度能力是模型推理服务的关键,根据我们测算,在单日10亿查询量下,若使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点。 相比SaaS时代,AI给软件工具栈的最大影响是,数据结构从“分析优先”转向“实时运营+分析协同”,Agent也强化了对高实时性数据的需求。综合来看,这些需求的本质是高频、小批量、低延迟的实时事务处理,这正是OLTP的核心优势。以上趋势下,OLTP+NoSQL再次风靡。海外MongoDB厂商的收入增速25Q2出现拐点,印证这一逻辑。 有别于大众的认识 市场认为,AIinfra软件面临SurroundedbyGs的问题,第三方独立软件厂商生存空间有限。我们认为,在数据层、MLOPs层,CSP投入产出比问题及技术专精性等问题,此外第三方的中立属性方便客户跨云调度,都为其成长提供强支撑。 市场认为,OLAP数据库更适配云架构,能够顺畅切入AI实现进一步份额增长。我们认为OLTP数据库实时性强,更适配生成式AI、Agent的需求,重要性提升,数据库市场需求从云计算时代OLAP转向OLTP。MongoDB凭借“低门槛+高弹性”,契合中小客户低成本AI落地需求,增长弹性突出。 目录 1.AI infra:应用渗透下的又一“卖铲人”.........................6 2.算力调度是模型推理盈利水平的关键...........................7 3.数据类Infra先于应用爆发.........................................12 3.1 RAG类AI...............................3.2 OLTP+NoSQL...3.3 GPU成为数据控制中心,数据库+.......................23存储技术升级14切入向量数据库,数据湖仓工具向应用层拓展13应用渗透,向量数据库需求提升 4.国内本地部署特色,涌现新需求................................25 5.重点公司估值表.........................................................28 6.风险提示...................................................................28 图表目录 图1:AI infra包含哪些核心环节........................................................................6图2:CY25Q3海外CSP厂商云业务毛利率处于20-45%区间............................9图3:Aegaeon token粒度调度、阶段化计算、缓存复用、弹性扩缩容...........10图4:推理服务毛利率与芯片单卡吞吐敏感性分析..............................................10图5:OpenRouter统计的Token消耗量自2024Q4起快速增长....................12图6:Gartner预计企业RAG技术采用率25年将达68%................................13图7:向量数据库在RAG类AI应用推理的流程................................................13图8:海外数据厂商收入增速.............................................................................16图9:MongoDB季度营收及增速....................................................................16图10:MongoDB毛利润率情况......................................................................16图11:MongoDB DB Engine向量数据库排名第一........................................17图12:MongoDB DB Engine向量数据库排名第一........................................17图13:Retool的调查中,21.1%的用户最常使用MongoDB向量数据库.......17图14:HuggingFace RTEB测评,Voyage模型霸榜.....................................18图15:Snowflake营收及增速.........................................................................22图16:Snowflake Non-GAAP毛利率略有下降..............................................22图17:Snowflake NRR FY25-26稳定在125%.............................................22图18:Snowflake的RPO呈阶段性扩张趋势..................................................22图19:FY26 Q3 Snowflake客户数量达到12621..........................................22图20:Snowflake持续拓展优质客户..............................................................22图21:英伟达GPU直连SSD的硬件设计.........................................................24图22:H100的IO调度效率是Gen5 Intel Xeon Platinum CPU的2倍以上24图23:英方软件数据复制和同步产品在AI应用的业务逻辑...............................26图24:深信服的AI Infra工具提供从一体机-MLops-应用开发的一站式平台...26 表1:25Q1-Q3美股AI软件收入增速(%)2C应用>AI infra>2B应用.........7表2:国内模型Token收费价格较海外更低,成本更敏感....................................7 表3:大厂自研算力调度平台能力........................................................................9表4:模型推理服务收入假设.............................................................................11表5:推理服务毛利率与芯片单卡吞吐敏感性分析..............................................11表6:主要的向量数据库及其特点...........