您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:东吴电子陈海进CPU系列研究AgenticAI重塑推理架构CPU - 发现报告

东吴电子陈海进CPU系列研究AgenticAI重塑推理架构CPU

2026-01-21 未知机构 喜马拉雅
报告封面

产业趋势:从“单次推理”到“多步编排”,CPU重回AI推理系统核心“用户输入-推理-输出”的单次路径。 瓶颈主要在GPU在LLM之上增加了决策编排器和外部工具,是“感知-规划-工具调用-再次推理” 的循环过程。 虽然 【东吴电子陈海进| CPU系列研究】Agentic AI重塑推理架构:CPU成为Agentic推理的首要性能瓶颈,行业景气与订单共振上行 产业趋势:从“单次推理”到“多步编排”,CPU重回AI推理系统核心“用户输入-推理-输出”的单次路径。 瓶颈主要在GPU在LLM之上增加了决策编排器和外部工具,是“感知-规划-工具调用-再次推理” 的循环过程。 虽然LLM推理在GPU上运行,但工具调度主要依赖CPU。 现有研究仍主要针对GPU进行优化,CPU侧性能瓶颈被忽略,导致系统效率低下 在许多任务中,工具处理(CPU)占据了高达90.6%的端到端延迟;在高并发(Batch Size达到128)下,CPU延迟暴涨了2倍以上(从2.9s涨到6.3s),原因是进程数超过了物理核心数,导致严重的上下文切换开销。 现有的CPU资源会迅速耗尽 订单验证:AMD与Intel服务器CPU供给趋紧、订单接近售罄AMD26年服务器CPU几乎已被预订一空,预计服务器CPU业务今年增长≥50%,AI相关收入26年或达140–150亿美元;英特尔数据中心CPU今年亦接近售罄,可能具备提价能力。 Agent云端沙盒调用量飙升带动云实例业务增长,进一步加剧了CPU供需紧张。 英伟达Blackwell的ARM架构CPU算力受限,Rubin大幅提高了CPU核心数和超线程;英伟达还将开放英特尔x86CPU作为NVL72互联机柜。 投资建议:重视CPU行业beta,强烈看好建议关注龙芯中科。