行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

东吴电子陈海进CPU系列研究AgenticAI重塑推理架构CPU

2026-01-21 未知机构喜马拉雅

产业趋势：AI推理架构正从“单次推理”转向“多步编排”，CPU重回AI推理系统的核心地位。传统“用户输入-推理-输出”的单次路径模式，在引入决策编排器和外部工具后，变为“感知-规划-工具调用-再次推理”的循环过程。尽管LLM推理主要在GPU上运行，但工具调度等任务主要依赖CPU，现有研究对此关注不足，导致系统效率低下，工具处理（CPU）在端到端延迟中占比高达90.6%。高并发环境下（Batch Size 128），CPU延迟暴涨超2倍（从2.9s涨至6.3s），因进程数超过物理核心数引发严重上下文切换开销，现有CPU资源迅速耗尽。

订单验证：AMD与Intel服务器CPU供给趋紧，订单接近售罄。AMD 2026年服务器CPU几乎预订一空，预计业务增长≥50%，AI相关收入或达140–150亿美元；英特尔数据中心CPU亦接近售罄，具备提价能力。Agent云端沙盒调用量飙升带动云实例业务增长，进一步加剧CPU供需紧张。英伟达Blackwell的ARM架构CPU算力受限，Rubin项目大幅提升CPU核心数和超线程，并计划开放英特尔x86CPU作为NVL72互联机柜。

投资建议：重视CPU行业beta，强烈看好龙芯中科。

产业趋势：从“单次推理”到“多步编排”，CPU重回AI推理系统核心“用户输入-推理-输出”的单次路径。瓶颈主要在GPU在LLM之上增加了决策编排器和外部工具，是“感知-规划-工具调用-再次推理” 的循环过程。虽然【东吴电子陈海进| CPU系列研究】Agentic AI重塑推理架构：CPU成为Agentic推理的首要性能瓶颈，行业景气与订单共振上行产业趋势：从“单次推理”到“多步编排”，CPU重回AI推理系统核心“用户输入-推理-输出”的单次路径。瓶颈主要在GPU在LLM之上增加了决策编排器和外部工具，是“感知-规划-工具调用-再次推理” 的循环过程。虽然LLM推理在GPU上运行，但工具调度主要依赖CPU。现有研究仍主要针对GPU进行优化，CPU侧性能瓶颈被忽略，导致系统效率低下在许多任务中，工具处理（CPU）占据了高达90.6%的端到端延迟；在高并发（Batch Size达到128）下，CPU延迟暴涨了2倍以上（从2.9s涨到6.3s），原因是进程数超过了物理核心数，导致严重的上下文切换开销。现有的CPU资源会迅速耗尽订单验证：AMD与Intel服务器CPU供给趋紧、订单接近售罄AMD26年服务器CPU几乎已被预订一空，预计服务器CPU业务今年增长≥50%，AI相关收入26年或达140–150亿美元；英特尔数据中心CPU今年亦接近售罄，可能具备提价能力。 Agent云端沙盒调用量飙升带动云实例业务增长，进一步加剧了CPU供需紧张。英伟达Blackwell的ARM架构CPU算力受限，Rubin大幅提高了CPU核心数和超线程；英伟达还将开放英特尔x86CPU作为NVL72互联机柜。投资建议：重视CPU行业beta，强烈看好建议关注龙芯中科。

点击免费查看完整报告

你可能感兴趣

东吴电子陈海进CPU系列研究AgenticAI重塑推理架构CPU

你可能感兴趣

东吴电子陈海进CPU系列研究AI计算的演进方向从算力堆叠走向编排

东吴电子陈海进GroqLPU引爆AI推理集群升级进一步提振M9产业链景气

东吴电子陈海进重视Agent时代统一内存架构新趋势提醒关注海光信息

东吴电子陈海进AR眼镜怎么看碳化硅波导的市场空间

东吴电子陈海进正交背板取代铜缆