智微智能参股元川微,布局LPU赛道助力全场景AI算力生态
核心观点与业务协同
智微智能公布参股国内领先的LPU公司元川微。元川微依托自研的硬数据流架构与全资源编译器等核心技术,大幅降低推理应用的部署复杂度和TCO,与智微智能的智算业务强协同,是公司完成全场景AI算力生态的关键延伸。
行业景气度与业务发展
伴随国内算力需求斜率上行,国内算力beta预计将持续高景气。目前智微智能的智算业务在手订单充沛,并有望打入更多客户,智算业务加速释放为公司业绩提供强力弹性。
LPU技术优势与市场背景
LPU是更契合Agent实时推理的计算平台。英伟达在年初斥资200亿美元收购Groq知识产权,并计划在后续GTC大会上阐述更多LPU信息。LPU并非新物种,但当前突然火热,本质原因是推理范式从Chatbot向Agent的转变,众多小Batch的推理任务使得对于时延的要求提升。
技术对比与市场定位
Latency(时延)与Throughput(吞吐量)是推理必须权衡的两个要素,GPU本质上追求的是最大化Throughput,而LPU追求的是最低Latency。Agent催生了众多小Batch低时延的推理需求,而LPU正是为低时延而生,是特定推理范式下的更优平台。