行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

国泰海通电子CPU在Agent时代的重大产业逻辑更新20260120

2026-01-20未知机构浮***

AI智能总结

核心观点与关键数据

Agent元年与CPU需求增长
- 2026-2027年被视为Agent元年，传统Agent架构割裂，新流派通过云端虚拟机（沙箱）执行任务，CPU成为核心资源。
- CPU需求与Agent用户数强相关，独立于GPU数量，海内外CSP已加大采购导致涨价。
- 乐观测算显示，2027年AI服务器与Agent驱动服务器CPU市场空间达723亿美元，需求远超现有规模。
Agent执行模式区分
- API调用型（无需沙箱）：如点外卖、电商等，Agent仅分发任务，复用现有业务服务器，CPU需求低。
- 沙箱执行型：如文件处理、PPT制作等，需创建独立虚拟环境，CPU消耗显著（每任务1-2个沙箱，用户级数十个）。
CPU用量驱动因素
- 任务复杂度与沙箱数量正相关，任务越长越重，CPU占用越高。
- 现有沙箱环境资源分配冗余（如固定0.5核，实际利用率仅5%），优化后可提升至70-80%，但仍无法满足指数级需求增长（需求端增速200-2000倍，优化仅20倍提升）。

研究结论

技术优化与需求增长矛盾
- 线程池等技术可释放约20倍资源效率，但Agent普及带来的并发量（如Coding类Agent持续使用数小时）将突破物理瓶颈，CPU需求长期仍将增长。
高并发与持续重计算挑战
- 碎片化任务（如I/O、脚本）可通过调度优化，但持续高负载任务（如游戏、渲染、长程推理）无法通过技巧绕过CPU瓶颈，高并发下易饱和。
CPU与GPU角色演变
- 传统对话中GPU主导推理（30-40%并发），CPU负责执行（低并发）；Agent时代任务链条变长，CPU占比将反超GPU（如写报告流程中，GPU仅负责规划，CPU主导执行）。
- 端侧场景（如咖啡推荐）依赖手机算力，无需云端虚拟化，增量消耗纯CPU服务器资源。
硬件趋势
- Agent逻辑需额外CPU服务器支持，AI服务器CPU仅用于训练，新增需求灵活且独立于GPU架构。

占用越多；2、用于沙箱执行的CPU并非与GPU封装在一起的AI CPU，而是独立于AI 服务器的通用服务器，用量与Agent用户数相关，并不与GPU个数强绑定；3、海内外CSP已经开始增大CPU采购用于Agent沙箱，所以才出现涨价。对于CPU增量的测算表：乐观测算，2027年AI服务器和Agent驱动的服务器CPU市场空间为723亿美金，需求将远远大于CPU现有的市场规模正文：首先，要看多CPU，需要认可26/27年是Agent元年的主要前提，在这个前提下传统模式的agent架构是：Agent与执行环境是割裂的。Agent主要负责意图识别，执行主要依赖调用写死的接口（Function Calling、MCP协议等）后面形成了一个新的流派，当agent执行的时候，它不像OAI一样去操作用户的PC ，而是创建了一个云端虚拟机，一个沙箱环境，让agent在沙箱环境中闭环去执行任务操作举个例子，你的任务是把一堆简历做一个数据分析，现在的步骤是：第一步，创造一个沙箱环境第二步，找到网盘地址，下载第三步，找到那个zip，解压压缩包，找到一堆简历第四步，做一个分析数据，生成一个报表第五步，任务完成后，销毁沙箱环境（资源释放） 2025年下旬到26年，这种模式大幅铺开，Claude skills，豆包，包括智谱都在用，Agent的执行层（虚拟机、运行代码、文件处理）高度依赖CPU，所以CPU+虚拟机这套体系成为主流，CPU的需求增加。 1、Agent需要CPU创建大量的沙箱环境用于执行任务，任务越长、越重，对CPU占用越多；2、用于沙箱执行的CPU并非与GPU封装在一起的AI CPU，而是独立于AI 服务器的通用服务器，用量与Agent用户数相关，并不与GPU个数强绑定；3、海内外CSP已经开始增大CPU采购用于Agent沙箱，所以才出现涨价。对于CPU增量的测算表：乐观测算，2027年AI服务器和Agent驱动的服务器CPU市场空间为723亿美金，需求将远远大于CPU现有的市场规模正文：首先，要看多CPU，需要认可26/27年是Agent元年的主要前提，在这个前提下传统模式的agent架构是：Agent与执行环境是割裂的。Agent主要负责意图识别，执行主要依赖调用写死的接口（Function Calling、MCP协议等）后面形成了一个新的流派，当agent执行的时候，它不像OAI一样去操作用户的PC ，而是创建了一个云端虚拟机，一个沙箱环境，让agent在沙箱环境中闭环去执行任务操作举个例子，你的任务是把一堆简历做一个数据分析，现在的步骤是：第一步，创造一个沙箱环境第二步，找到网盘地址，下载第三步，找到那个zip，解压压缩包，找到一堆简历第四步，做一个分析数据，生成一个报表第五步，任务完成后，销毁沙箱环境（资源释放） 2025年下旬到26年，这种模式大幅铺开，Claude skills，豆包，包括智谱都在用，Agent的执行层（虚拟机、运行代码、文件处理）高度依赖CPU，所以CPU+虚拟机这套体系成为主流，CPU的需求增加。这里面，还是要区分一下“API调用型”和“沙箱执行型”两种Agent任务模式API调用型（无需沙箱）：典型场景：点外卖（阿里/美团生态）、电商购物、订酒店、网页开发、生成Excel、腾讯元宝调用小程序。 Agent仅充当“分发者”和“翻译官”。它理解用户意图后，直接调用现成的底层API接口。不需要创建独立的虚拟沙箱环境，直接复用现有的业务服务器（如外卖平台的服务器）。沙箱型：典型场景：复杂文件处理（网盘下载->解压->数据分析）、PPT制作（缺乏标准API）、通用生产力工作。任务中间涉及文件操作、渲染或复杂的非标准化步骤，必须有一个独立的“操作空间”来承载这些动作。必须为每个任务创建独立的虚拟环境（沙箱），消耗额外的CPU和内存。在明确CPU的用量在往上走后，提供三个观点：第一个观点：虽然技术优化能带来约20倍的效率提升，但面对未来Agent需求20倍、200倍甚至2000倍的爆发式增长，CPU的总体需求仍将大幅上升原来的CPU是不做优化的，因为够用，一个上述任务，现在大概是创建0.5核1G空间，平均一个简单任务是创建1-2个沙箱环境，每个用户创造几十个沙箱环境，这么一看似乎CPU似乎现在就该非常非常缺，但实则短期不然。现在给一个用户下发的沙箱环境，0.5核里面实际的CPU利用率是非常低的，只有5%，原因是上层Agent模型无法预知任务的具体负载（不知道文件多大、计算多复杂），为了保底，系统只能“无脑”给每个任务分配固定的资源配额（如0.5核+1G内存），实际上，大部分任务（如下载、简单解压）对CPU的消耗极低。分配了0.5核，可能实际连0.05核都没用到，剩下90%以上都是浪费。优化的做法是将计算能力（CPU核）与存储空间（内存/硬盘）解耦，不再分配固定的“虚拟核”，而是动态分配“线程算力”，将线程算力池化。Agent需要计算时才给算力，不计算时不占用CPU资源，这样或许利用率能到70%-80%，那是十几倍的提升空间，最后可能一个16核管理1000个沙箱环境这是完全可以优化做得到的尽管供给端的优化能带来20倍的释放，但需求端（Agent大规模普及带来的并发量）的增速大概率是指数级的（200倍、2000倍）。优化的速度跑不赢需求的爆发，因此长期来看，CPU市场依然面临巨大的增长需求第二个观点：Agent时代的高并发（在线时长久）是常态，虽然“线程池技术”能解决大部分碎片化任务的资源浪费，但一旦遇到“持续重计算”的复杂任务，CPU依然会被塞满，无法通过技巧绕过物理瓶颈传统Chatbot，用户问一句答一句，用完即走。并发比极低，仅为1%。但是，Agent (如Coding类)：用户挂着软件写代码（如Cursor/Claude Code），一开就是数小时。并发比飙升至30%-40%甚至更高。这就带来一个问题，如果某个任务一直霸占着CPU时间片不释放，CPU就无法切换去服务别的沙箱。所以，容易优化的任务，比如简单的I/O任务、短暂的脚本执行。这类任务对CPU的占用是碎片化的，容易被调度。但类似打游戏、看高清视频、P图（Photoshop）、渲染这类持续高负载，或者长时间推理，这就是难被优化的，就是CPU杀手第三个观点：随着任务链条变长（Long-context/长程推理），CPU的工作时长占比将大幅提升，甚至可能超过GPU 不同于传统对话，Agent完成一个任务（如写报告）的流程是CPU和GPU交替配合的：第一步（GPU主导）：用户下达指令，GPU进行推理，生成一个详细的To-Do List（任务规划/拆解）。规划一旦完成，GPU暂停第二步（CPU主导）：CPU根据To-Do List开始干脏活累活（如控制浏览器、搜索网页、下载文件、寻找信息）如果评估不合格：CPU继续干活如果评估合格：进入下一个子任务。第四步（GPU收尾）：所有任务完成后，GPU进行最终的总结和报告生成。这中间CPU承担了漫长的执行过程，往后思考和执行的链条越长（任务越复杂），CPU在整个过程中运行的时间占比就越高，GPU的相对占比反而越少上述是云侧，在端侧时，消耗的是端侧算力。比如用户想喝咖啡，千问运行大模型，进行大数据分析和意图识别。判断你是谁、在哪里、喜欢什么口味，然后决定应该给这个用户推荐什么咖啡，给一个指令到手机，至于后续的小程序的加载、页面渲染、你手指滑动的流畅度、动画效果，全部消耗的是手机自己的芯片算力，这一步不需要云端创建一个“虚拟手机”来替你打开小程序，而是利用你手里现成的硬件从硬件的角度，这个agent逻辑对于CPU的用量是增量，并不是动用AI服务器里面的CPU部分，因为AI服务器的CPU只负责训练的时候去计算tokens，Agent逻辑如果成立，增加的CPU是纯CPU服务器，增减相当灵活联系人：舒迪/李奇/段笑南

点击免费查看完整报告

你可能感兴趣

国泰海通电子CPU在Agent时代的重大产业逻辑更新20260120

核心观点与关键数据

研究结论

你可能感兴趣

国泰海通电子Agent沙箱CPU与AI服务器CPU解耦1

国泰海通电子存储观点更新首先在大模型的三个步骤中同时需要

国泰海通电子AI产业崛起看好AI计算HBM服务器主板测试设备的发展

建材板块今日大涨简评国泰海通建材鲍雁辛团队20260120本日建材板

国泰海通医药恒瑞医药JPM更新前日恒瑞医药在JPM大会上进