您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:巨兽出笼!Cerebras400亿美元IPO能否颠覆英伟达垄断霸权? – 华尔街见闻 – -20260515 - 发现报告

巨兽出笼!Cerebras400亿美元IPO能否颠覆英伟达垄断霸权? – 华尔街见闻 – -20260515

2026-05-15 未知机构 Man💗
报告封面

共6131字阅读需13分钟 在NVIDIA垄断GPU市场的当下,Cerebras Systems的IPO不仅是一家半导体公司的融资事件,更是对“算力即权力”这一共识的技术挑战。 Cerebras的核心逻辑在于其晶圆级引擎(WSE-3)——一颗拥有4万亿个晶体管、90万个AI核心的巨型芯片。通过将整个晶圆视为一颗芯片,它彻底消灭了芯片间的通信瓶颈,在推理速度上宣称达到NVIDIA H100的20倍。然而,高增长背后隐藏着极端的客户集中度(G42占比约83%-100%)。 一文看懂市场追捧Cerebras的投资逻辑。 一、发生了什么?Cerebras400亿美元IPO在即 2026年5月,AI芯片行业迎来了一个历史性的事件——CerebrasSystems正式启动IPO路演。这家成立于2015年的AI芯片初创公司,以“晶圆级计算”的颠覆性技术路线,向英伟达主导的万亿级AI算力市场发起了正面挑战。当前IPO定价区间为每股115至125美元,估值最高可达266亿至400亿美元,对应约80倍PS的稀缺溢价。其背后站着的是价值200亿美元的OpenAI长期合 同、246亿美元的超额剩余履约义务,以及全球顶级投行摩根士丹利、花旗、巴克莱和瑞银的联合承销。 OpenAI已与Cerebras签署了价值200亿美元的协议,约定在2026年至2028年间购买750兆瓦(MW)的AI推理能力,并可选择在2030年底前再增加1.25吉瓦(GW)容量。这是一份金额乃至规模上超过绝大多数半导体公司旗舰季报的长期订单。作为合作的一部分,OpenAI还向Cerebras提供了约10亿美元以资助开发数据中心系统,并获得Cerebras少数股权认股凭证,持股比例至高可达10%。此外,如果OpenAI在2030年前订购高达2GW的总算力,将获得全部Cerebras的认股权证,这也为未来订单追加提供了潜在巨大的上行期权。 这笔交易的意义远超财务数字本身——它不仅为Cerebras构建了长达三至五年的收入可见性,更证明晶圆级架构获得了全球最顶级的AI实验室的技术认可。OpenAI计算基础设施负责人萨钦·卡蒂明确指出,Cerebras为平台“增添了专属低延迟推理解决方案,这意味着更快的响应速度、更自然流畅的交互体验”。 尤其值得一提的是,双方的合作并非一朝一夕——据披露的诉讼相关文件显示,OpenAI早在2017年就已对Cerebras的技术进行初步评估,技术磨合的基础相当牢固。 2024年9月Cerebras因为与阿联酋G42合作在华盛顿引发国家安全关切而被迫撤回IPO申请——当时G42一家客户就贡献了公司87%的营收,客户集中度高到让CFIUS直接介入了审查。如今这一格局已经发生了根本性改变。通过引入OpenAI(2026年1月签约)以及Amazon Web Services(2026年3月签约成为首个将Cerebras芯片部署于自有数据中心的超大规模云厂商),公司将G42的收入贡献压降至此前水平中的一小部分。CEO安德鲁·费尔德曼在采访中清晰表达了这一策略:“获得三大核心客户的关键在于,先服务好一个大型客户并保持其满意度,再逐步赢得下一个”。一年多时间内,Cerebras将客户集中度从G42独大转向多元地域与行业覆盖的超大规模云商和AI研究龙头企业,完成了IPO前的决定性转型。 此外,S-1文件显示,公司2025年全年营收由2024年的2.903亿美元攀升至5.1亿美元,同比增速约76%,更重要的是,公司实现了净利润8790万美元,从2024年巨额亏损4.848亿美元转为全面盈利。虽然毛利率仅约39%-42%,低于英伟达约75%的水平,但公司在较短的业务扩张期已率先盈利,对风险偏好相对审慎的机构投资者而言意义重大。2025年第四季度单季收入同比增速攀升至76%,不仅展示了核心产品放量的速度,也映射 了晶圆级芯片在推理侧的市场渗透速度超预期。考虑扣除股权激励支出后的Non-GAAP运营亏损为9600万美元,实际经营现金流距离正循环仍有挑战,但营收改善曲线十分陡峭。 二、为什么重要?颠覆者的宿命 如果说英伟达与AMD主导的是“造无数辆顶级跑车、并用最快的超级高速公路把它们连接起来”,那么Cerebras选择的道路就是“直接造一辆超级高铁”——这种根本性差异体现在多个维度。 ①“晶圆级”vs“晶片级”:从物理结构上改写摩尔定律 传统芯片制造是将300毫米硅晶圆切割成数百个独立Die(裸片),每个Die尺寸不超过约800平方毫米——这是光刻设备掩膜版极限(Reticle Limit)决定的。“顶配”GPU如英伟达Blackwell之所以突破这一瓶颈,采用的是极其复杂的Chiplet式先进封装技术,将两个Die拼接在一起。 Cerebras彻底舍弃了切割逻辑。它将整片12英寸硅晶圆(面积46,225平方毫米)用作一个巨型单一处理器。WSE-3(WaferScale Engine 3)搭载了4万亿个晶体管、90万个AI优化核心、 44GB片上SRAM,内存带宽高达21PB/s——约等于NvidiaH100 HBM带宽的7000倍,是Rubin GPU的接近1000倍。推理速度呈现压倒性优势。根据2026年公布的独立测试数据,运行Llama 3 70B模型且在推理场景当中,Cerebras CS-3相比英伟达旗舰DGX B200 Blackwell实现了超过21倍的端到端推理性能领先。而在Meta Llama 4 Maverick(4000亿参数)模型上,Cerebras以每用户每秒2,522 token输出翻倍超过DGX B200Blackwell系统。这一领先幅度已经超越了“代差”——本质上是通过克服多GPU集群的互联瓶颈来实现的。从第三方基准测试来看,当并行处理10个并发请求时,面对Nvidia Blackwell B200仅约580 tokens/秒,Cerebras依然保持在极高水平。 ②AI训练/推理的最大瓶颈通常不在算力不足,而在于数据传输太慢,导致GPU原地等待数据。英伟达的应对策略是不断拉高外部HBM的容量与带宽——其B系列芯片配备192GB/8TB/s,而即将推出的Rubin系列则进一步扩展至288GB/22TB/s。 Cerebras在这一问题上选择了幅度更彻底的方案:把内存和计算核心放置在同一个平面上,让“内存墙”几乎不复存在。WSE-3 全部依赖片上SRAM,内存带宽拉高至惊人的21PB/s。以SRAM替代HBM,被称为“没有HBM的大规模算力系统”。 SRAM的优势在于极低延迟,但以往受制于单位面积开销高、无法大容量扩展而被局限为L1/L2/L3的配角缓存。Cerebras证明了:如果整个芯片被推向晶圆等级,在有限预算内铺开高达44GB的片上SRAM完全是可用且结构合理的——SemiAnalysis在2026年初推断,Cerebras下一代WSE芯片的SRAM容量预计将进一步提升。这种路线正从GPU巨头获得侧翼验证:英伟达在最新的Rubin+LPX机架方案中,架构由PD分离转向AF分离,其中decoding的FFN阶段由于batch size极小,显著强化了对海量片上SRAM带宽的依赖,与Cerebras的思路有异曲同工之妙。微软在2026年推出了Maia 200推理芯片,也进一步加大了对SRAM架构的探索力度。 不过,SRAM与HBM仍将持续共存而非取代。TrendForce 2026年1月研究报告指出,尽管SRAM在低延迟推理中具明显优势,但受制于单位面积成本与容量限制,短期之内无法取代HBM的主流地位。值得关注的佐证是:2026年5月初,Anthropic已与英国SRAM芯片初创公司Fractile进入早期洽谈阶段,试图寻找DRAM-less AI推理芯片方案作为现有第四家供应商,但Fractile芯片预计要到2027年才能商用化——显示产业界正发力跟进SRAM推理方向。SRAM价值在Cerebras路线引导下,正在从“配角”走向“主战场”。 ③台积电已有InFO-SoW(集成式扇出-晶圆上系统)工艺为Cerebras及Tesla Dojo供应晶圆级芯片。根据台积电2025年技术论坛披露,当前的CoWoS(基板上晶圆上芯片)能力正向更高的中介层尺寸发展,预计2027年实现9.5倍掩膜版尺寸、支持12颗或更多HBM堆叠的大规模集成。而SoW-X——一种CoWoS基础上演变而来的晶圆级集成方案——可将计算能力提升至当前CoWoS的40倍,大规模生产时间设定在2027年。Cerebras的芯片制造目前完全依赖台积电5nm制程,并正由台积电以3nm制程在升级之中。这是核心技术路线上的一个显著风险点——S-1文件确认了当前再无其他代工厂能生产晶圆级芯片。 竞争对手方面,英特尔正扩大先进封装布局,Foveros Direct3D产能预计提升30%,EMIB-T投资翻倍,Foveros-S与台积电的竞争态势明显升温。制造生态的多极化对于Cerebras长期产能安全与潜在多供应商布局至关重要。 三、接下去关注?颠覆革命如何发生 ①上游关键:晶圆制造与先进封装 上游从侧面反映了Cerebras技术路线的核心保障能力——台积电的6nm/5nm N5产线当前已为WSE系列主力制程;先进的CoWoS/SoW封装产能扩展将直接决定晶圆级芯片后道良率。台积电规划2029年实现40倍掩膜版尺寸的SoW方案,特别针对高密度逻辑+HBM集成的晶圆级系统。如果良率可从早期低水平改善到具备商业足够规模的水平,将有助于Cerebras毛利率从当前40%爬升至成熟公司的60%甚至更高水平,缩小与英伟达之间的差距。 ②中游核心:推理引擎芯片+一体化算力服务模式 Cerebras本身是中游核心。其产品路径具有“芯片设计+全栈系统+自身部署的数据中心集群”的垂直整合特点,客户产品交付可选择硬件、云API访问或混合租赁。值得一提的是Cerebras与AWS的最新协议——亚马逊已签署协议,将在自有数据中心部署Cerebras CS-3系统,用于与亚马逊Trainium3芯片整合的推理功能。这种“在规模化云环境中嵌装第三方推理加速器”的模式,为快速打开企业级市场提供了基础。AWS作为全球最大云服务商,它的背书对Cerebras在分布式GPU集群以外证明自身运营成熟度具有决定性。 ③下游影响:改变CSP“算力商品化”与云收入结构 直接采用Cerebras加速推理的客户包括OpenAI以及将来AWS之上的终端企业用户,对降低每百万token的整体成本与提升响应体验有强烈诉求。由于Cerebras低延迟推理释放了极其快速的token生成能力,可大幅提升大模型Chatbots、复杂推理应用的 交互频率和使用黏性。英伟达也在逐步提升其Inference-as-a-Service产品线中的灵活性,但Cerebras的出现将迫使它(尤其在超大规模推理采购层面)陷入价格和性价比双重竞争。 Cerebras IPO的最深远的意义不在其直接影响,而在于它可能引发资本市场对现有AI芯片板块进行估值框架重构: ①SRAM价值永久重估。过去共识是SRAM面积大且成本高,只适合L1/L2/L3缓存(仅几十MB)。Cerebras在单晶圆上铺开44GB SRAM,使其不再是内存瓶颈的“缓冲带”,而是主体新品类。这将牵引其它推理芯片初创公司基于SRAM架构获得更高估值倍数,同时可能对HBM和NAND市场的长期需求预期形成结构性影响。 ②CUDA的潜在迂回。Cerebras绕开底层CUDA编程的方式(编译器直接映射PyTorch模型到晶圆硬件),即使目前仍无法直接取代CUDA的统治地位,却预示未来ASIC生态的硬体定义范式的可能变化:更侧重编译优化,无需支持海量旧模型库,可换来推理性价比的显著提升。 ③HBM及CoWoS必要性在此技术框架内降低,但对台积电CoWoS依然是正向推动——台积电的WOW(晶圆堆叠)与SoW(晶圆上系统)在更大中介层