行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

dcjsjdsv32应用再迎助推剂ds预训练算力不足所谓

2025-12-02 未知机构测试专用号2高级版

核心亮点

DSA技术显著降低推理消耗：通过索引器选出k个关键token（top-k），将计算复杂度从L²降低至LK（k远小于L），大幅节省算力。
扩展训练规模与性能提升：训练规模超预训练10%，结合agentic任务合成系统，部分基准超越Gemini3等水平。

不足之处

高复杂度agent任务表现不足：成功率（ds 12%）远低于Gemini3pro（64%）。
性能提升需更多token：达到同等效果需要更多输入token。
世界知识广度不足：影响知识性问题回答正确率，论文明确指出与前沿模型存在差距。

应用前景

国内应用优势：DS V3.2部分场景拉平了模型能力与成本差距，结合应用低筹码+豆包手机等因素，看好应用行情。
推荐标的：税友、金山、合合、深信服、fubo集团、金蝶等，手机相关产业链。

未来展望

杰文斯悖论持续演绎：大厂内部目标（如OAI 2030）推动token消耗增长，需持续跟踪但信心仍存。
范式级跃升：世界模型、完整记忆模型、自主学习模型（如谷歌新论文、genie3、grok5）或带来革命性突破，明年值得期待。

[庆祝]核心亮点：1. DSA技术大幅降低推理消耗：大白话，以前L长度的上下文需全部两两做计算，现在先通过一个很小的indexer 选出k个最重要的token（所谓top-k)，大幅降低推理算力消耗(计算复杂度从L的平方降低至LK，其中k远小于L）。2.进一步扩展后训练规模(超预训练10%)，并通过agentic任务合成系统，在部 [玫瑰]【dcjsj】ds-v3.2：应用再迎助推剂，ds预训练算力不足，所谓”通缩”需着眼未来 [庆祝]核心亮点：1. DSA技术大幅降低推理消耗：大白话，以前L长度的上下文需全部两两做计算，现在先通过一个很小的indexer 选出k个最重要的token（所谓top-k)，大幅降低推理算力消耗(计算复杂度从L的平方降低至LK，其中k远小于L）。2.进一步扩展后训练规模(超预训练10%)，并通过agentic任务合成系统，在部分基准上达到甚至超越了Gemini3等水平。 [抱拳]不足：1.在一些高复杂度的agent任务中，成功率不如Gemini3pro等（ds 12% vs gemini 64% ）2.达到与Gemini同样的效果需要更多token。3.世界知识不如Gemini等。同样的效果，更低的成本，国内应用原本受限于模型能力与成本(消费能力)，现在DS V3.2等于说在部分场景拉平了这一差距，国内做应用更强。叠加应用低筹码+豆包手机等因素，看好应用行情。[强]税友、金山、合合、深信服、fubo集团、金蝶等，手机相关产业链。 ds论文最后明确写到，与前沿模型相比，世界知识的广度不足，这会影响ds v3.2回答一些知识性问题时的正确率，后续ds预计虽然ds用强大的技术力(后训练与推理阶段)在部分基准实现了追赶，但遇到包括高复杂度的agent任务等问题时，仍是一分耕耘一份收获。其实是老生常谈，看现在，超级应用何处？非通缩型收费点何处？下一代模型何处？当前现金流+落后恐惧型投入达到极限，问题都存在，但越是此时越需着眼未来。 ->未来1：杰文斯悖论的持续演绎（也是说烂了的点）。一个信息-某大厂内部目标明年token日均消耗增长10倍，更不提OAI的2030目标。这方面无法说服，只有跟踪，唯有信心。 ->未来2：世界模型、完整记忆模型、自主学习模型，这都是全新范式级别的跃升，有则一些问题都没了。这也不是空穴来风，谷歌的《https://wx.zsxq.com/mweb/views/weread/search.html?…》新论文、genie3，马斯克后面的视频模型+grok5。明年值得期待的东西还有很多很多。

点击免费查看完整报告

dcjsjdsv32应用再迎助推剂ds预训练算力不足所谓

核心亮点

不足之处

应用前景

未来展望

你可能感兴趣

信息技术产业行业研究：DS启动开源周、发布推理系统技术秘籍，看好AI算力、端侧及应用

脱水研报（国内AI大模型及应用再迎跃迁，产业链热度高;量子计算有望突破算力瓶颈，券商称或成为人工智能与新质生产力的“引擎”）

人工智能行业点评：英伟达GPU、DGX云、AI工厂三驾马车发布，AI算力和应用再迎跃迁

通信行业：算力券，算力租赁的“助推剂”

晶圆厂扩产及业绩修复有望带动半导体上游订单;券商称算力券有望成为算力租赁的助推剂带动算力建设提速-1017脱水研报

【财联社早知道】华为任正非重磅发声！第四次工业革命基础就是它，这家公司基于AI算力调度服务提供预训练模型

预训练大模型与医疗：从算法研究到应用

IT服务行业：场景应用驱动，AI预训练数据服务需求有望高增

计算机行业月报：手机端AI应用加速，DeepSeek将加大预训练规模

国内政策细则出台助推太空算力发展，再提能源强国指引核聚