英伟达推出AVO智能体技术,Gemma 4开启端侧智能新纪元 —计 算 机行 业 周 报 投资要点 推荐(维持) ▌算力:算力租赁价格平稳,英伟达推出AVO智能体技术 分析师:任春阳S1050521110006rency@cfsc.com.cn 2026年3月26日,英伟达发布智能体式变异算子AVO技术,以自主编码智能体替代传统进化搜索方式,构建全流程自主优化闭环。该技术在BlackwellB200GPU上对注意力内核自主迭代优化,性能显著超越cuDNN与FlashAttention-4,可快速迁移至GQA场景。 行 业 相 对 表 现 ▌AI应用:Discord周访问量环比+3.52%,Gemma 4开启端侧智能新纪元 2026年4月3日,谷歌DeepMind发布了全新的开源模型系列Gemma4。Gemma 4系列基于与Gemini3同源的技术打造,涵盖了从适合端侧设备的2B版本到可在单张计算卡上运行的高性能31B版本,四个尺寸全部开源,试图实现对不同部署场景的全覆盖。 ▌AI融资动向:Starcloud完成1.7亿美元A轮融资 2026年3月,太空数据中心企业Starcloud完成1.7亿美元A轮融资,估值达11亿美元,成为YC成长最快的独角兽,累计融资2亿美元。本轮由Benchmark与EQT领投,资金用于卫星研发、制造基地建设、团队扩张及发射采购。 相 关 研 究 1、《计算机行业点评报告:英伟达(NVDA):Blackwell量产驱动业绩增长,数据中心仍是AI主线》2026-04-032、《计算机行业点评报告:DUOL:用户增长与订阅变现共振,AI产品线继续抬升长期空间》2026-04-033、 《 计 算 机 行 业 点 评 报 告 :Spotify:用户与盈利双升,广告修复与产品扩张共振》2026-04-02 ▌投资建议 2026年3月31日,智谱发布上市后首份2025年全年业绩财报。财报显示,公司全年实现总收入7.24亿人民币,同比增长131.9%,稳居国内大模型公司收入规模首位,综合毛利率达41%,远超行业水准;MaaS商业飞轮全面运转,MaaSAPI平台实现ARR17亿元(约2.5亿美金),同比提升60倍,毛利率同比提升近5倍至18.9%,盈利能力显著改善。业务拆分看,企业级通用大模型业务实现收入3.66亿元,占总收入的50.4%。企业级智能体业务收入从上年的0.47亿元增至1.66亿元,增长248.8%,收入占比达22.9%。开放平台及API平台业务从上年的0.48亿元增至1.90亿元,增幅高达292.6%,收入占比提升至26.3%。截至2026年3月,智谱平台的注册企业及用户已突破400万,服务全球超218个国家及地区,其GLMCodingPlan付费开发者超24.2万,2026年3月推出的ClawPlan上线20天订阅用户突破40万。当前的GLM模型已 全面部署于Google VertexAI、AWSBedrock、Fireworks、Cerebras等全球顶尖云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台,智谱已成为国内付费Token消耗量最高的厂商之一。从技术层面来看,公司依托自研Slime框架提升异步强化学习效率,为GLM-5-Turbo模型研发提供支撑;同时GLM-5实现国产芯片软硬协同优化,通过量化策略降低显存占用与部署成本,在国产硬件平台达成国际顶级芯片等效推理性能,形成技术与算力自主可控的一体化体系。公司的模型性能优势显著,2026年一季度API提价83%后调用量仍保持增长,客户需求持续旺盛。本次智谱最新财报验证了模型能力向商业价值的有效转化,其API大幅提价后调用量仍增,验证了优质模型是应用层付费的基础。随着行业从同质化接入转向依托强基座的差异化落地,头部应用的盈利空间将被打开,业绩兑现与毛利改善的确定性将显著提升。基于此,我们维持对AI应用板块的看好。中长期,建议关注专注于半导体等高端制造业的罗博特科 (300757.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)、AI智能文字识别与商业大数据领域巨头的合合信息(688615.SH)、深耕工业AI与软件并长期服务高端装备等领域头部客户的能科科技(603859.SH)。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:算力租赁价格平稳,英伟达推出AVO智能体技术....................................41.1、Tokens跟踪.......................................................................41.2、数据跟踪:全球云厂商集体涨价......................................................51.3、产业动态:英伟达推出AVO智能体技术................................................62、AI应用动态:DISCORD周访问量环比+3.52%,GEMMA 4开启端侧智能新纪元......................82.1、周流量跟踪:Discord周访问量环比+3.52%............................................82.2、产业动态:从口袋到工作站全覆盖,Gemma 4开启端侧智能新纪元........................83、AI融资动向:GRANOLA完成1.25亿美元C轮融资............................................114、行情复盘..............................................................................125、投资建议..............................................................................146、风险提示..............................................................................15 图表目录 图表1:TOKENS规模LEADERBOARD..............................................................4图表2:市场份额占据示意....................................................................5图表3:EVO与AVO对比差异示意图.............................................................6图表4:AVO原理示意图.......................................................................6图表5:MHA结果对比示意图...................................................................7图表6:2026.3.28-2026.4.3AI相关网站流量....................................................8图表7:GEMMA 4在MODELPERFORMANCEVSSIZE与ARENAMODELRANKINGS中的表现.......................9图表8:GEMMA 4在多个测试中的表现...........................................................9图表9:GEMMA 4包含的四款模型..............................................................10图表10:上周AI初创公司融资动态...........................................................11图表11:上周(2026.3.30-2026.4.3日)指数日涨跌幅..........................................12图表12:上周(2026.3.30-2026.4.3日)AI算力指数内部涨跌幅度排名...........................12图表13:上周(2026.3.30-2026.4.3日)AI应用指数内部涨跌幅度排名...........................13图表14:FICONTEC2025年年中至今公告订单....................................................14图表15:重点关注公司及盈利预测............................................................15 1、算力动态:算力租赁价格平稳,英伟达推出AVO智能体技术 1.1、Tokens跟踪 根据OpenRouter公开数据,2026年3月30日至2026年4月5日,周度token消耗量有所上升,调用量为27T,环比上周18.94%。在tokens规模leaderboard前五名中,qwen的Qwen3.6Plus(free)以4.6Ttokens位居榜首,xiaomi旗下的MiMo-V2-Pro以3.08Ttokens位居第二;qwen的Qwen3.6Plus(free)以1.64T位列第三;stepfun的Step3.5Flash的以1.26T位列第四;minimax旗下的MiniMaxM2.7以1.19Ttokens位居第五。 从市场份额维度来看,qwen以1.78Ttokens占据39.6%的份额,稳居首位;google以430B占 据9.5%, 位 列 第 二 ;OpenAI、Anthropic、Minimax则 分 别 以397B、372B、328Btokens,对应占据8.8%、8.2%、7.3%的市场份额。 据OpenRouter最新数据,中国AI大模型周调用量已连续五周超过美国,在3月30日-4月5日这一周达到12.96万亿Token,环比涨幅31.48%,而同期美国为3.03万亿Token,中国是美国的4.28倍;该时段全球大模型周调用量榜单中,前6名均为中国模型。小米MiMo-V2-Pro于3月31日公布最新成绩,在OpenRouter平台周Token消耗量达4.19万亿,拿下日、周、月三榜榜首;该模型在TextArena评测跻身全球前五,小米宣布未来三年AI领域投入超600亿元。4月4日,阿里Qwen3.6-Plus发布仅1天,日调用量突破1.4万亿Token,成为OpenRouter首个单日超万亿Token的模型,刷新全球单日单模型调用纪录,其智能体与编程能力表现突出。两款国产模型接连破纪录,彰显中国大模型在全球应用市场的领先地位。 资料来源:OpenRouter,华鑫证券研究 资料来源:OpenRouter,华鑫证券研究 1.2、数据跟踪:全球云厂商集体涨价 近期国内云计算市场迎来大规模调价浪潮,3月以来阿里云、腾讯云、百度智能云等头部厂商相继上调AI算力、云存储及大模型服务价格,部分产品涨幅最高超400%,AI算力紧缺与硬件成本上涨推动行业进入集体涨价周期,价格战逻辑逐步转向成本传导式定价。在此行业背景下,火山引擎与京东云接连释放明确信号,选择逆势坚守价格稳定,与行业趋势形成鲜明