Andrej Karpathy (@karpathy) 认为,随着代币需求的增长,为大语言模型(LLMs)精准调配底层内存与计算资源存在重大机遇。由于芯片制造工艺,内存池存在两种物理实现:紧邻计算单元、速度快但容量低;容量高但传输慢。设计最优物理基板,在LLMs最高吞吐量工作流中协调内存与计算,以实现最佳吞吐量/延迟/成本比,是当前最具智力挑战性且回报最高的难题。当前两大技术阵营(HBM核心的英伟达派与SRAM核心的Cerebras派)难以兼顾推理解码及长代币上下文处理。MatX团队堪称顶尖,参与其中令人荣幸,祝贺其融资成功。
Reiner Pope (@reinerpope) 介绍了MatX One芯片,其基于大型脉动阵列结构,融合了高能效与面积效率优势,实现高利用率。该芯片融合了先进技术,采用创新数值处理方案,吞吐量超越已公布系统,延迟水平与SRAM优先设计相当。更高的吞吐量与更低的延迟,使订阅费用能换取更智能、更迅捷的模型。MatX One已完成融资,预计一年内流片。本轮融资由Jane Street领投,参与方包括Spark Capital、Daniel Gross、Nat Friedman等。MatX的初衷是基于对LLMs需求的理解,从第一性原理出发设计芯片,愿意放弃小模型性能、低负载任务等,已组建百人团队协同推进,欢迎供应链投资者加入。