AI智能总结
【请务必收听#国金计算机CPU涨价还能持续多久? 电话会】 1月26日,阿里发布Qwen3-max-Thining,总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。 #国内首个Agent范式 【国金计算机&科技】Qwen3更新:国产模型进入Agent时代,海外2025重演!重视CPU+算力+存储! 【请务必收听#国金计算机CPU涨价还能持续多久? 电话会】 1月26日,阿里发布Qwen3-max-Thining,总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。 #国内首个Agent范式模型、开启国内推理算力军备赛。 Qwen3更新采用了一种全新的Test-time Scaling,对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮#自我迭代。 从范式上追平GPTo3!!! 【#我们认为2025年海外所有变化均来自RL和Agent推理范式、明确看好2026年国内重演!】①算力/GPU:Agent范式下,推理的Token消耗较Chatbot扩大4~15倍,部分场景甚至扩大百倍以上。 ②CPU:Multi-Agent带来OS调度压力,“推理→执行→评估→反思”的机制导致CPU调度任务大幅增加。 CPU开销可能在通信打满前先成为瓶颈。 ③存储:#Agent范式下Token和上下文指数级增长,KV Cache大约是Token的千级别扩大,推动KV从HBM卸载至DRAM/NAND,存储需求大幅提升。 建议重视#阿里链软硬件和国产CPU+算力+存储!!!CPU:海光信息、中科曙光、禾盛新材、广合科技、兴森科技、深南电路、宏和科技。 国内算力:寒武纪、东阳光、海光信息、协创数据、首都在线、大位科技、华丰科技、潍柴重机、欧陆通。 存储:兆易创新、大普微、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、长川科技。