您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国新证券]:计算机行业周度:阿里升级全栈AI体系 - 发现报告

计算机行业周度:阿里升级全栈AI体系

信息技术 2025-09-30 国新证券 Gnomeshgh文J
报告封面

2025年9月29日 计算机行业周度:阿里升级全栈AI体系 看好 本周计算机行业指数表现 本周(9.22-9.26)计算机(申万)板块下跌0.02%,沪深300指数上涨1.07%,计算机板块跑输沪深300指数1.09个百分点。和申万其他行业对比,计算机行业涨幅排名位列第8位。 本周涨幅前3名分别为品茗科技(44.01%)、中威电子(34.63%)、中电鑫龙(29.90%),跌幅前3名分别为ST创意(-26.21%)、华胜天成(-15.46%)、旋极信息(-13.73%)。 本周关注 阿里升级全栈AI体系 数据来源:Wind,国新证券整理 阿里云在2025云栖大会上展示了其作为“全栈人工智能服务商”的体系化技术突破。在硬件基础设施层面,新一代磐久128超节点AI服务器采用液冷技术,单机柜功率密度达350千瓦,其AI算法对GPU故障的预测准确率已达99%。HPN8.0高性能网络支持10万卡规模GPU集群稳定互联,实现百纳秒级低延迟。系统级优化如多级亲和性调度和异构计算架构,为千亿参数大模型训练提供支撑,使训练效率提升3倍以上。 在软件栈层面,人工智能平台PAI实现端到端优化。其paiMoE训练引擎和推理层全链路优化技术,使通义千问模型训练加速比提升超3倍,推理吞吐提升71%、时延降低70.6%。一站式平台百炼集成七大企业级组件,支持超200款模型,已拥有超20万开发者,累计创建80多万个Agent,模型日均调用量增长15倍,生态活跃。 面对AI海量数据挑战,存储体系同步革新。高性能并行文件存储CPFS实现单客户端40GB/s吞吐,对象存储OSS创新引入向量数据原生支持,构建存检一体架构,成本降低95%。智能数据管理平台DMS和OSS数据索引功能实现了数据的统一治理与智能价值识别。 分析师:钟哲元登记编码:S1490523030001邮箱:zhongzheyuan@crsec.com.cn 云原生平台升级为“AI原生应用工厂”,函数计算GPU极速模式实现模型服务秒级/毫秒级启动。其全球智能算力网络已覆盖30个地域、89个可用区,为跨国部署提供基础。安全方面,阿里云构建了全栈可信体系,并获得全球150多项合规认证。 目前,通义大模型已服务超100万企业客户,未来技术将向具身智能、模型自我演进及超高效架构(如Qwen3-Next架构)三大方向持续探索。 投资线索 基于2025云栖大会,阿里明确了其AI战略布局,包括推进3800亿元的AI基础设施投入。其通义大模型系列实现多项突破,旗舰模型性能全球领先,并通过坚定的开源路线构建了庞大的开发者生态, 证券研究报告 全球下载量已突破6亿。云业务收入因此重回双位数增长,AI产品收入连续多季度保持三位数高增长。此次大会还突出了智能体和具身智能作为关键落地场景,其一站式Agent开发平台日均调用量显著增长,并与行业伙伴在物理AI领域合作以推动具身智能等应用发展。这些进展预示着从底层算力基础设施到上层AI应用的广泛投资机遇。 风险提示 1、政策落地不及预期;2、技术发展不及预期;3、市场竞争加剧。 目录 一、本周市场回顾........................................................................................................................................................................4 1、硬件基础设施:战略布局与技术创新.......................................................................................................................42、软件栈:深度优化与生态构建....................................................................................................................................53、存储与数据管理系统:架构革新................................................................................................................................54、云原生架构与调度系统:演进升级...........................................................................................................................65、安全与可靠性:系统工程保障....................................................................................................................................66、未来技术前景................................................................................................................................................................6 1、英伟达拟向OpenAI投资最高1000亿美元并共建10吉瓦AI数据中心...........................................................72、阿里深夜炸场:首个端到端全模态AI模型Qwen3-Omni发布开源.....................................................................83、工信部部长李乐成:加快打造一批新兴支柱产业,创建一批未来产业先导区................................................104、小米17系列正式发布:三年最大设计突破,背屏+骁龙8至尊版定义新旗舰...............................................105、德国软件巨头SAP遭欧盟反垄断调查.....................................................................................................................126、OpenAI推进星际之门项目:官宣在得州等开发5个新数据中心站点..............................................................12 五、风险提示..............................................................................................................................................................................14 图表目录 图表1:计算机行业板块相对表现(%).................................................................................................................................4图表2:计算机行业个股涨跌幅.................................................................................................................................................4 一、本周市场回顾 本周(9.22-9.26)计算机(申万)板块下跌0.02%,沪深300指 数上涨1.07%,计算机板块跑输沪深300指数1.09个百分点。和申万其他行业对比,计算机行业涨幅排名位列第8位。 数据来源:Wind,国新证券整理 目前计算机行业上市公司共335家,其中,99家公司收涨,占比29.46%。本周涨 幅 前3名 分 别为品 茗 科 技(44.01%)、中 威 电 子(34.63%)、中 电 鑫 龙(29.90%),跌幅前3名分别为ST创意(-26.21%)、华胜天成(-15.46%)、旋极信息(-13.73%)。 二、本周关注 阿里升级全栈AI体系 1、硬件基础设施:战略布局与技术创新 阿里云在AI计算基础设施领域实现了突破性进展,其技术架构呈现出明显的体系化特征。新一代磐久128超节点AI服务器采用创新的液冷散热方案,单机柜功率密度达到业界领先的350千瓦,同时通过多级冗余设计和故障自愈机制,实现了高达99%的硬件故障预测准确率。在网络架构层面,HPN8.0高性能网络能够支持10万卡规模GPU集群的稳定互联,依托自研的通信协议栈和RDMA优化技术,实现了百纳秒级的低延迟通信。 这种硬件创新不只是停留在性能参数的提升上,更体现在系统级的深度优化中。通过多级亲和性调度算法,阿里云实现了GPU间最优互联路径的精准选择,同时支持异构计算架构,可根据实际需求灵活调配CPU、GPU和专用AI芯片资源。这些技术创新共同为千亿参数级别的大模型训练提供了坚实的物理基础,最终实现训练效率提升3倍以上,并大幅优化了推理吞吐和时延。 2、软件栈:深度优化与生态构建 在软件体系层面,阿里云构建了覆盖AI全生命周期的技术栈。其中,人工智能平台PAI实现了训练、推理、部署的端到端优化。针对MoE模型,其paiMoE训练引擎通过统一调度和自适应计算通信掩盖等技术,使通义千问模型训练端到端加速比提升3倍以上;在推理层,通过大规模专家并行(EP)和预填充/解码(PD)分离等全链路优化,实现推理吞吐提升71%、时延降低70.6%。同时,PAI的编译器与算子融合技术为各类AI负载提供底层加速。 在开发工具层面,阿里云百炼平台打造了一站式模型服务与Agent开发环境,集成了工具连接MCP Server、多模数据融合RAG Server、沙箱工具SandboxServer等七大企业级能力组件,支持200多款模型的即插即用。该平台生态繁荣,已拥有超20万开发者,累计创建了80多万个Agent,过去一年模型日均调用量增长达15倍,充分体现了其技术架构的实用性和可扩展性。 3、存储与数据管理系统:架构革新 面对AI时代海量数据与极致性能的需求,阿里云在2025云栖大会上宣布了对存储体系的系统性重构。 在核心存储产品层面,高性能并行文件存储CPFS为AI训练负载进行了深度优化,实现了单客户端40GB/s的超高吞吐,并能提供200微秒的延迟、20TB/s的带宽和3亿IOPS的高并发能力,充分满足了十万卡智算集群对存储性能的苛刻需求。对象存储OSS则创新性地引入了对向量数据的原生支持,推出VectorBucket,并与表格存储Tablestore的向量检索能力深度集成,构建起存检一体的架构。该方案相比自建开源向量数据库,可使存储成本降低95%,并在测试中展现出查询时延远优于开源方案的性能。 更值得关注的是智能数据管理能力的突破。通过一站式多模数据管理平台 DMS等服务,阿里云实现了对全域多源数据的统一元数据管理,保障了数据无缝流转。OSS数据索引功能能自动为海量非结