您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:火山引擎:8月豆包大模型日均Token调用量及核心产品用量拆分,中短期大模型调用量增长预期及算力需求估计,昆仑芯测试效果及采购规划,与阿里云差异化竞争等20250919 - 发现报告

火山引擎:8月豆包大模型日均Token调用量及核心产品用量拆分,中短期大模型调用量增长预期及算力需求估计,昆仑芯测试效果及采购规划,与阿里云差异化竞争等20250919

2025-09-19未知机构心***
AI智能总结
查看更多
火山引擎:8月豆包大模型日均Token调用量及核心产品用量拆分,中短期大模型调用量增长预期及算力需求估计,昆仑芯测试效果及采购规划,与阿里云差异化竞争等20250919

消费,TMT,半导体 Jay Dong2025/09/18 08:14:56 要点 针对⽕⼭引擎,本⽂核⼼要点包括: 1,⾖包⼤模型最新⽇均Token调⽤量表现及具体内外部⽤量拆分2,中短期⾖包⼤模型⽇均Token调⽤量增⻓预期及核⼼增⻓驱动⼒3,外部泛互及AI硬件领域重点客户4,2026年推理算⼒需求估计5,如何看待阿⾥⾃研卡及百度昆仑芯 本⽂共5037字,预计阅读时间11分钟 已享VIP免费 以下为专家观点: 1,6⽉份⽕⼭原动⼒⼤会上曾发布⾖包⼤模型在5⽉底⽇均Token调⽤量达到16.4万亿以上,近期⽇均Token调⽤量增⻓情况,能否根据不同业务线进⾏拆分? 8⽉份⾖包⼤模型整体⽇均Token调⽤量为25.9万亿,对应⽇均调⽤次数约为200亿次。整体数据可以分为三类业务线:第⼀类是Flow相关,包括⾖包、扣⼦、猫箱等,合计约7⾄8万亿Token,其中⾖包App约为4.2万亿,猫箱约为⼏千亿,⾖包爱学等也是⼤⼏千亿;第⼆类是原有业务,如抖⾳、懂⻋帝、头条等,其中抖⾳⽇均约9万亿Token,主要⽤于客服、审核质检、素材⽣成等。懂⻋帝⽇均约6000⾄7000亿,头条约4000⾄5000千亿,即梦约1.5万亿到2万亿Token;第三类是⽕⼭引擎to B业务,⽇均约3.9万亿Token。 此外,字节内部还有约40多个原有业务的孵化项⽬,总量相对较⼩。内部业务增量最快的是Trae(代码类⼯具),⽇均从七、⼋⼗亿增⻓到三、四千亿Token,增速较快。整体来看,资源消耗主要由上述业务线推动,⼯程团队也在持续优化和扩展相关应⽤。 2,针对⾖包8⽉⽇均4.2万亿的⽇均Token调⽤量,这⼀增⻓主要受哪些因素影响?与⾖包的DAU、⽇均在线时⻓及核⼼功能相关?⽬前⾖包哪些功能是核⼼消耗Token的功能?能否对单项功能的Token消耗进⾏排序? 由于⾖包的DAU数据不对外公开,⽬前约为4000多万⾄5000多万,环⽐增量与业务链路的投放和扩产密切相关。⾏业内通常通过公开的DAU、留存率以及商业化组件覆盖情况进⾏观测。⾖包投⼊了较多精⼒在产品功能和⼯程组件的迭代,如视频⽣成等新功能的上线也带动了Token消耗的增⻓。 具体⽽⾔,普通⽤户每天约有七到⼋轮Query,每轮平均消耗约2000多Token。其中⽂本对话每轮约1500Token,图像理解约2000到2500Token,⾳频约3000到3500Token,视频⽣成每轮约2到3万Token,但视频⽣成占⽐相对较⼩。语⾳通话则与通话时⻓相关,若⽤户持续通话则总消耗会更⾼。 3,未来⾖包⽇均Token消耗量的主要驱动⼒预期?是⽤户交互轮次增加、单次Query消耗增加,还是⽤户量增加? ⾖包单轮Query的Token消耗⽬前整体较为稳定,但随着多模态功能的引⼊,单次请求的⻓度和时⻓有扩容趋势。未来⽇均Token消耗量的增⻓主要由DAU扩容、⽤户交互轮次增加以及多模态应⽤的普及推动。⽐如预计到年底⾖包DAU有望达到7500万,随着多模态和思维链等功能的应⽤,单次请求的Token消耗也会增加。整体来看,⽤户量、交互轮次和多模态功能共同驱动Token消耗的增⻓。 4,抖⾳产品的DAU和⽤户使⽤已趋于稳定,如何看待其Token消耗的增⻓及潜⼒?如果年底整体⽇均Token消耗达到60万亿,抖⾳⾃身的⽤量会是多少? 若年内整体⽇均Token消耗达到60万亿,抖⾳⾃身预计在15万亿到18万亿Token左右。抖⾳单应⽤的⽤量增⻓主要取决于⼯程团队对业务场景的释放和应⽤开发的深度。⽬前抖⾳的业务潜⼒尚未完全释放,实际开发仅约20%,且仍有⼤量⽅案和业务场景尚未启动。未来随着客服、审核质检等需求的增加,抖⾳在Token消耗和业务扩展⽅⾯仍有较⼤增⻓空间。 5,针对抖⾳单产品,当前⼤模型在内容审核领域的渗透率⼤约是多少?未来在审核领域的渗透率天花板可能会达到多少?影响⼤模型替代传统审核⽅式的主要因素有哪些? 对于抖⾳⽽⾔,⽬前⼤模型在内容审核领域的⽇均Token消耗约为两、三万亿,实际任务量中约有六、七⼗项尚未完全实现AI功能质检,渗透率仍有很⼤提升空间。未来随着多模态应⽤和商业化政策的推进,相应Token消耗增⻓可能会超出预期。影响⼤模型替代传统审核⽅式的主要因素包括模型能⼒以及业务线政策和⼈⼒资源的配合。 具体⽽⾔,本质上是要求⼯程团队识别⾃身业务的重点。⾄于如何推进,⽐如客服、审核、质检、⻛控、信贷等,这些⼯作都需要⼈⼯参与,⽬前需要投⼊更多精⼒来推进这些内容。 6,中短期抖⾳单产品⽇均Token调⽤量增⻓预期? 当前抖⾳⽇均Token消耗量约为9万亿,年底预期提升⾄15~18万亿,对应整体年底⽇均Token消耗量预估为60万亿。如果明年整体⽇均Token消耗量达到400~500万亿,抖⾳这边⾄少会接近⼤⼏⼗万亿,即从当前的9万亿可能会有接近10倍的增⻓潜⼒。 其中新增扩建场景包括视频⽣成,⽬前抖⾳很多素材还是以⼈⼯⽣成为主,后续可能会有更多素材由模型扩写。同时很多交互现在由真⼈完成,未来模型交互也可能扩展,这些都是合理的预估。当前增量部分有限,核⼼问题还是模型能⼒不⾜,⽐如在⽂本、图像、语⾳、视频等⽅⾯的效果普遍低于预期。后续通过⼯程叠加和技术模型能⼒提升,有望整体提升效果。 7,抖⾳针对搜索推荐、⼴告和电商领域,⽬前应⽤状态及⽇均Token消耗? 字节对⼴告的扩展要求较⾼,电商领域⽬前阶段也在扩容。按照现有链路逻辑,各场景都有加速节奏,整体商业化⼴告⽤量基本每个场景⼀天⼏百亿到⼏千亿,扩容后可能达到⼏万甚⾄⼗⼏万。 但整体来看抖⾳在商业化中的Token消耗占其整体⽇均Token消耗⽐例较⼩,主要消耗较多领域还是多模态素材⽣成。后续如果视频内容交互和搜索过程中能及时⽣成内容,消耗量可能会进⼀步扩⼤。 8,Flow相关产品、原有APP以及⽕⼭引擎,年底分别会有怎样的⽇均Token消耗预估? Flow可以重点关注⾖包,年底⾖包⽇均Token消耗可能达到10万亿到12万亿。原有产品⽅⾯主要是抖⾳、头条和即梦,预期都会有翻倍的Token消耗。对于to B的⽕⼭引擎,8⽉份⽇均Token消耗约3.9万亿,预期年底翻倍到七、⼋万亿。 9,⽕⼭引擎to B业务中有哪些头部客户? 客户包括拼多多、⼩红书、滴滴等头部互联⽹公司,以及游戏和⼿机⼚商都在接⼊⽕⼭引擎。最⼤Token消耗量还是以泛互客户为主,⽽且整体⽤量有较⼤扩展空间。其中拼多多主要应⽤于客服辅助对话、商品素材抠图和⽣成、质检和审核等,具体⽤法与百度、字节类似。⽽商业化取决于模型能⼒边界,伴随模型能⼒成熟将解锁更多应⽤。⽐如最近也在测试图像编辑等新功能,未来可能带来新增⽤量;⼩红书主要也是审核质检等需求,整体⽤量较多。 拼多多和⼩红书等客户除了⽤⽕⼭引擎,也会接⼊阿⾥云等多家服务商。需求量扩展是⾏业共性,不只是⽕⼭⼀家。 10,客户在多云选择中,在分配具体消耗量⽅⾯主要取决于哪些因素?中短期内如何看待⽕⼭引擎竞争⼒? 客户在多云选择中,分配量主要看可提供的模型能⼒和使⽤价格,另外还有⼀些商业合作资源,⽐如⼴告资源等,字节擅⻓⽤⾮模型资源做接⼊合作。⽬前国内模型⼚商如阿⾥、百度等都会带来⼀定竞争压⼒,字节模型在⽂本和图像理解⽅⾯表现较好,但视频和其他领域效果⼀般。在实际内场应⽤时,效果与外部宣传还是有差距。价格和服务⽅⾯,其他⼚商也有竞争⼒。 现在⾏业内有⼀个问题,只要基座模型能⼒稍微有⼀点超预期,可能就会带来很⼤的突破。在短期内,字节未必能⽐其他⼚商做得更好。现在更多是动态博弈,友商模型也很有实⼒。 11,⽕⼭引擎提供的模型价格是否会⼀直保持竞争⼒? ⽕⼭的价格应该会保持竞争⼒,预计⼀直不会特别⾼,会给市场⼀个相对较低的价格。当前更关注市场⽤量的整体扩容和增⻓,不介意在市场中提供更低的价格。 12,针对⼿机⼚商,⽬前与⽕⼭的合作状态?现在有哪些头部⼿机⼚商和⽕⼭有⽐较深度的合作? ⽬前市场上的⼿机⼚商⼤致分为两类:⼀类是对端侧模型或者⼊⼝完全不想做,类似早期汽⻋⼚商不关注“灵魂”层⾯的内容,⽐如努⽐亚、传⾳等,字节可以在模型层⾯贡献更多,甚⾄可以做⼀些OS层⾯的融合;另⼀类对于苹果、三星、OV、荣耀这些⼚商,他们并不愿意把端侧⼊⼝完全开放出来,相应如果指望在端侧OS助⼿⽅⾯有特别多的合作,实际上很难实现。所以字节现在主要是和努⽐亚等中型⼚商进⾏更深⼊的资源合作,让三⽅⼚商了解字节在OS层⾯能做的内容,推动他们配合接⼊。⽽对于OV、荣耀等⼚商,可能还需要再观望⼀段时间,相应客户对字节的信任度有限,也不太愿意过多让渡相关权限。 具体⽽⾔,年底可能会看到字节与荣耀、三星等⼚商在标准服务和客服接⼊⽅⾯的合作进展,⽬前正在推进相关接⼊⽅案。⾄于其他⼚商,⽬前整体进度相对较慢,商业合作的推进速度也低于预期,尤其是具备⾃研模型能⼒的⼚商, 在使⽤⽕⼭或⾖包模型时会有更多考量。 13,针对与⼿机⼚商合作,⽕⼭与阿⾥云在能⼒上的差异? ⽕⼭和阿⾥在模型能⼒⽅⾯差异不⼤,双⽅在数据和基座模型调参等⽅⾯都能实现平替,整体来看没有本质性的代差。 但在与硬件⼚商合作意愿和端侧模型开发⽅⾯,阿⾥表现得更积极。阿⾥更愿意投⼊端侧模型开发,⽽字节这边则不太有相关预期,也不主动参与端侧相关内容。阿⾥在海外市场也更受⼿机⼚商欢迎,合作预期更强。 14,⽬前与传⾳的合作模式?传⾳是否也与其他⼚商如阿⾥、⾕歌、OpenAI等有合作? ⽬前与传⾳的合作主要集中在基座模型能⼒⽅⾯,包括⽂本和端侧语⾳等服务。此外,传⾳在CDN短信和海外技术资源⽅⾯也有不少合作,实际合作量超出预期。传⾳是⽕⼭引擎云上的重要客户,但模型合作的深度还有限。⾄于传⾳与其他模型⼚商的合作,了解到他们使⽤其他云的⽤量不多,相对⽽⾔在字节这边的合作量相对较⼤。 15,美团是否为⽕⼭客户?美团近期在模型和Agent产品⽅⾯都有进展,相应算⼒资源租赁情况? 美团是⽕⼭的客户,但⽤量不算很⼤。他们主要⾃⼰研发模型,在⽕⼭有租⽤算⼒资源,但实际使⽤的量有限。其实美团、拼多多、京东等都⽕⼭客户,但整体⽤量都不算太⼤。整体资源租赁量低于预期,美团⾃身也采购了不少算⼒资源。 模型调⽤⽅⾯,美团每天在⽕⼭这边调⽤量约200亿到300亿token,主要集中在图像理解和⾳频接⼝,⽂本模型的调⽤量较少。 16,⽬前有不同品类的AI硬件,包括⼿机、汽⻋、AI眼镜等,中短期哪些AI硬件会带来较⼤的Token消耗? ⽿机、眼镜、台灯、玩偶等这些硬件都会有消耗量,这些品类的消耗量都⽐较可观。⽽⼿机⼚商的⼿持设备,token消耗量可能没有那么⼤。 如果从硬件排序来看,带摄像头的设备,⽐如安防监控摄像头,这类设备的消耗量是最⼤的。其次是玩偶类设备,整体消耗量也⽐预想的要多⼀些。再往后是眼镜类设备,预计可以排在第三。其他设备的消耗量⽬前差距不⼤,整体来看,各类设备的共性需求较为明显,现在很多设备的资源消耗差距并不⼤。 17,预计到今年年底⽇均token消耗量可能达到60万亿,2026年达到400-500万亿,对应的算⼒需求可能会提升多少? ⽬前⽇均token调⽤量在27到28万亿,对应需要⼤约25到26万张卡来⽀撑。如果到年底达到60万亿token,预计需要55万到60万张卡来承接。如果算上海外市场,明年(2026年)整体调⽤量达到500万亿到600万亿token,预计需要330万到350万张卡来⽀撑。 ⽬前的预估逻辑是,算⼒的增量需求⽐原先预想的要多⼀些,⽽且相应卡90%是训练卡,可以综合⽤于训练和推理。相应以A800为锚定物,如果不⽤A800⽽⽤其他卡,采购量会缩⼩很多。 18,2026年算⼒会成为限制因素? 个⼈认为还好。国内采购,包括三⽅采购,基本都在正常扩容。从现有情况来看,并不⼀定需要那么多卡,扩容需求主要集中在2026年年底,⽬前阶段并不需要那么多卡。所有前提都是基于基座模型推理增量是否还能进⼀步扩展。 19,下半年字节模型迭代更新规划