AI智能总结
再谈Token需求“通胀”:从云到大模型 glmszqdatemark2026年02月13日 分析师:吕伟执业证书:S0590525110033邮箱:lvwei_yj@glms.com.cn 推荐 维持评级 事件:2月12日,智谱在官方渠道宣布上调GLM Coding Plan订阅价格,涨幅“至少30%”。此前,海外云厂商于本月纷纷提价,如Google Cloud在北美涨价幅度达100%,在欧洲与亚洲也同步上调;同时AWS的价格也上调了约15%。综合来看,Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权。 颠覆传统互联网的免费路径:传统互联网软件的典型路径是先用免费换用户规模,凭借“用户数和时长”换议价权,然后在广告、会员订阅、增值服务、交易抽佣里变现,免费背后的底层原因无非是边际成本极低。即多一个用户或多一次点击,成本却可以被带宽与存储规模效应稀释,从而达到近似为零的边际成本。 云计算时代也出现过类似的“先免费/低价再扩张”,但云的计费单位很快变成CPU/存储/带宽/请求数,客户也习惯了“按量计费”。云能收费,是因为它交付的是明确的资源和SLA(服务提供商与客户签订的服务等级协议)。但当行业依旧处在“模型价格战”时,智谱却出现了涨价的信号,我们认为这意味着大模型时代的“计量单位”从流量(DAU/时长)转向Token(推理消耗),而Token的消耗在越来越多场景里是刚需。 相关研究 1.计算机行业事件点评:AI+招采迎来政策红利-2026/02/112.计算机行业周报20260207:再次强调迎接新一轮大模型创新潮-2026/02/083.计算机行业事件点评:Clawdbot系列研究之核心受益方向:大模型篇-2026/02/044.计算机行业事件点评:Clawdbot系列深度总起篇:AI“杀手级”应用的雏形-2026/02/025.计算机行业周报20260201:2025Q4持仓分析:持仓历史底部,AI主线持续走强-2026/02/02 大模型时代的变化:Token变成“可计量的生产资料”,不再是“免费流量”。大模型把“对话/写代码/生成内容”这类看似是由软件供应商提供的服务,变成了强依赖算力的在线推理服务。对模型厂商而言,每一次回答都要实打实地消耗GPU、显存、带宽与电力;对用户来说,每一次“让模型多想一会儿、写一段更长的代码、跑一个更复杂的任务”都对应更多Token的消耗,于是Token天然成为新的计量单位。智谱此前正因为用户增长导致算力阶段性紧张,对Coding Plan做过“限量发售”安排,这与其后续涨价形成了一个非常典型的“供需链条”:需求在短期内大幅增长→资源呈现刚性约束(导致限流/限量)→涨价。 当高峰期拥堵与资源紧张出现时,涨价是一种让模型厂筛选需求的机制,比“无差别限流”更能保护用户的体验。并且,模型厂商的成本端仍与GPU供给、利用率、推理优化强相关,涨价/更合理的分层定价能把模型厂商从“边际收益受算力成本约束”的陷阱里拉出来,在保持订阅留存的前提下有利于提升毛利与现金流质量。 Token需求在“通胀”:“Token通胀”,不是指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。Token需求的高涨有以下几个原因:· ●从“问答”变为“干活”:模型发展至今,用户不再满足于简单的回答形式,而是开始让模型重构代码、改写文件、生成文档和跑测试等等。编程场景的特征天然是“长上下文、多轮迭代、大量输出”,这对Token是大量的消耗。通过智谱的表述,也证实了开发者依靠其模型用于编码支持,导致Token消耗的快速增长。 ●从“单轮”到“Agent的多轮”:智谱把GLM-5定位为面向Coding与Agent场景的新一代模型;2月12日,MiniMax也把正式上线的最新旗舰编程模型M2.5标注为全球首个为Agent场景原生设计的生产级模型。将M2.5的编程与智能体性能(Coding&Agentic)直接对标Claude Opus4.6。Agent会 主动规划、检索、执行、反思,多次调用模型,Token消耗自然按步骤累加。 ●推理强度上升:更多“深度思考、更长链路推理”会显著提高输出与中间过程的Token消耗。对开发者而言,这往往带来更高成功率与更少返工,用户反而愿意“增加Token投入来换取效率”。 我们认为,这意味着Token不是传统互联网时代边际成本几乎为零的“流量”,而是生产任务时必不可少的“燃料”。 投资建议:云计算逐步变为“卖资源”,而大模型厂商化身“卖Token燃料+卖成果”。智谱GLM Coding Plan的涨价折射的是产业定价逻辑的改变:当推理消耗变成生产资料,模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流。建议后续持续关注: ●大模型厂商:能在编程、Agent、企业流程等高ROI场景中维持订阅留存与企业席位扩张,能把“Token用量”稳定转成“省人省时省返工”的交付价值时,就具备了穿越开源与价格战的能力。建议关注MiniMax和智谱等优质大模型公司。 ●云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云侧有望受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长。建议关注金山云、优刻得、首都在线等。●安全治理与运行时的防护工具:随着企业把AI嵌入工作流,数据泄露、代理越权等风险有望推动“AI安全平台/治理平台”成为刚需层。建议关注深信服、启明星辰、三六零等。 短期观察提价与需求(Token“通胀”)带来的边际改善,中期跟踪企业席位与订阅留存带来的续费与扩张,长期看好治理工具普及带来的“AI防火墙”新增市场。 风险提示:技术路线变革具有不确定性;行业竞争加剧。 资料来源:智谱官方微信公众号,国联民生证券研究所 资料来源:智谱官方微信公众号,国联民生证券研究所 资料来源:谷歌官网,国联民生证券研究所 资料来源:OpenRouter官网,国联民生证券研究所整理 分析师承诺 本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的利益。 免责声明 本报告由国联民生证券股份有限公司或其关联机构制作。国联民生证券股份有限公司具有中国证监会许可的证券投资咨询业务资格。本报告的分销依据不同国家、地区的法律、法规和监管要求由国联民生证券于该国家或地区的具有相关合法合规经营资质的子公司/经营机构完成。在遵守适用的法律法规情况下,本报告亦可能由国联证券国际金融有限公司在香港地区发行。国联证券国际金融有限公司具备香港证监会批复的就证券提供意见(4号牌照)的牌照,接受香港证监会监管,负责本报告于中国香港地区的发行与分销。 本报告仅供本公司授权之机构及个人使用,本公司不会因任何人收到本报告而视其为客户。本报告仅为参考之用,并不构成对任何人的操作建议或任何保证,不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑获取本报告的机构及个人的具体投资目的、财务状况、特殊状况、目标或需要,客户应当充分考虑自身特定状况,进行独立评估,并应同时考量自身的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见,不应单纯依靠本报告所载的内容而取代自身的独立判断。在任何情况下,本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。 本报告是基于已公开信息撰写,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断,且预测方法及结果存在一定程度局限性。在不同时期,本公司可发出与本报告所刊载的意见、预测不一致的报告,但本公司没有义务和责任及时更新本报告所涉及的内容并通知客户。 在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务,本公司的员工可能担任本报告所提及的公司的董事;本公司自营部门及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。客户应充分考虑可能存在的利益冲突,勿将本报告作为投资决策的唯一参考依据。 若本公司以外的金融机构发送本报告,则由该金融机构独自为此发送行为负责。该机构的客户应联系该机构以交易本报告提及的证券或要求获悉更详细的信息。本报告不构成本公司向发送本报告金融机构之客户提供的投资建议。本公司不会因任何机构或个人从其他机构获得本报告而将其视为本公司客户。提示客户及公众投资者慎重使用未经授权刊载或者转发的本公司证券研究报告,慎重使用公众媒体刊载的证券研究报告。 本报告的版权仅归本公司所有,未经书面许可,任何机构或个人不得以任何形式、任何目的进行翻版、转载、公开传播、篡改或引用,不得将报告内容作为诉讼、仲裁、传媒所引用之证明或依据,不得用于营利或用于未经允许的其它用途。所有在本报告中使用的商标、服务标识及标记,除非另有说明,均为本公司的商标、服务标识及标记。本公司版权所有并保留一切权利。 上海上海市虹口区杨树浦路188号星立方大厦B座7层 无锡江苏省无锡市金融一街8号国联金融大厦8楼 北京北京市西城区丰盛胡同20号丰铭国际大厦B座5F 深圳深圳市福田区中心四路1号嘉里建设广场1座10层01室